这个带着头戴相机的宝宝,竟然成了教AI如何学习语言的小小老师

这篇具有很好参考价值的文章主要介绍了这个带着头戴相机的宝宝,竟然成了教AI如何学习语言的小小老师。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

 每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

这个带着头戴相机的宝宝,竟然成了教AI如何学习语言的小小老师,人工智能,学习

即使是目前最先进的大型语言模型,在学习能力上也远远比不上人类婴儿。为了能够输出勉强过得去的英语,ChatGPT必须接受包含数百万甚至数万亿单词的大型数据集训练。相比之下,孩子们接触到的数据量只是其中的一小部分,但到了三岁时,他们已经能够以相当复杂的方式进行交流了。

纽约大学的一个研究小组好奇,AI是否能够像婴儿那样学习。如果给AI模型一个远小于常规数据集的数据集——即一个正在学说话的孩子所经历的视觉和声音体验——它能做些什么呢?

结果证明,AI模型做了很多。它成功地将单词与它们所代表的物体匹配了起来。“即使是在这孩子经验的一小部分数据中,也足以进行真正的词汇学习,”纽约大学的计算认知科学家Brenden Lake说,他是这项研究的作者之一。这项今天发表在《科学》杂志上的工作,不仅提供了婴儿学习的见解,还可能导致更好的AI模型。

在这个实验中,研究人员依赖于由一名住在澳大利亚阿德莱德附近的孩子所佩戴的头盔相机拍摄的61小时视频。这名孩子,Sam,从六个月大开始,断断续续地佩戴这个相机一年半的时间,直到他两岁多一点。相机捕捉到了Sam所关注的事物,这些记录大约占他清醒时间的1%。它记录了Sam的两只猫、他的父母、他的婴儿床和玩具、他的房子、他的餐点等等。“这个数据集是独一无二的,”Lake说,“这是我们有史以来对单个孩子可接触到的最好的窗口。”

为了训练模型,Lake和他的同事们使用了60万个视频帧,与Sam的父母或房间里其他人在图像捕捉时所说的短语配对——总共有37,500个“话语”。有时候,单词和物体是匹配的。有时候,则不是。例如,在一幅静止画面中,Sam看着一个形状分类器,而一位父母说:“你喜欢那根绳子。”在另一个画面中,一个成人的手遮住了一些积木,而一位父母说:“你也想要那些积木。”

研究团队给模型提供了两个线索。当物体和单词一起出现时,这可能意味着它们之间可能有联系。但当一个物体和一个单词没有一起出现时,这意味着它们可能不匹配。“所以我们模型内部就有了这种拉近和推开的动作,”纽约大学的计算认知科学家Wai Keen Vong说,他也是这项研究的作者之一。“然后我们希望,在数据中有足够多的实例,当父母说‘球’这个词时,孩子正在看一个球,”他说。

将单词与它们所代表的物体匹配起来可能看起来是一项简单的任务,但实际上并非如此。为了让你感受到问题的范围,想象一下一个有小孩的家庭的客厅。它有所有正常的客厅家具,但也有孩子的杂物。地板上散落着玩具。咖啡桌上散落着蜡笔。窗台上有一个零食杯,椅子上有洗好的衣服。如果一个小孩听到“球”这个词,它可能指的是一个球。但它也可能指的是任何其他的玩具,或者沙发,或者一条裤子,或者一个物体的形状,或者它的颜色,或者一天中的某个时间。“对于任何一个词,都有无限可能的含义,”Lake说。

这个问题是如此难以解决,以至于一些发展心理学家认为,儿童必须天生就具有对语言工作方式的理解,才能如此迅速地学会它。但这项研究表明,即使没有那种天生的能力,语言的某些部分也是可以从一组非常小的经验中学到的,斯基德莫尔大学的发展心理学家Jess Sullivan说,她是收集Sam头盔相机数据的团队的一部分,但没有参与这项新研究。“这确实改变了我的世界观。”

但Sullivan指出,能够将单词与它们所代表的物体匹配,虽然是一个困难的学习问题,但这只是构成语言的一部分。还有一些规则决定了单词如何组合在一起。你的狗可能知道“球”或“散步”的单词,但这并不意味着它能理解英语。而且,婴儿可能拥有的对语言的任何天生能力可能超出了词汇。它可能影响他们如何在世界上移动,或者他们关注什么,或者他们如何对语言做出反应。“我不认为如果婴儿没有创建出神经网络正在学习的数据集,这项研究就会成功,”她说。

Lake和他的同事们的下一步是试图弄清楚他们需要什么,才能使模型的学习更接近儿童早期的语言学习。“还有更多的工作要做,以尝试获得一个具有完全两岁孩子般能力的模型,”他说。这可能意味着提供更多的数据。Lake的孩子,现在18个月大,是下一批提供数据的孩子之一。她每周佩戴头盔相机几个小时。或许模型需要关注父母的目光,或者需要对物体的坚固性有所感知——这是孩子们直觉上就能把握的东西。创建能够更像儿童那样学习的模型将帮助研究人员更好地理解人类的学习和发展。

能够捕捉到人类学习语言方式的AI模型可能会在学习上更加高效;它们可能更像人类,而不是像语言学家诺姆·乔姆斯基及其同事们曾经描述的大型语言模型那样,“一个笨重的统计模式匹配引擎”。“AI系统仍然脆弱,缺乏常识,”负责管理资助Lake团队的美国政府国防高级研究计划局项目的Howard Shrobe说。但能够像孩子那样学习的AI可能能够理解含义,对新情况做出反应,并从新的经验中学习。目标是使AI更接近于人类智能。文章来源地址https://www.toymoban.com/news/detail-832800.html

到了这里,关于这个带着头戴相机的宝宝,竟然成了教AI如何学习语言的小小老师的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • 带着问题看SpringBoot

    带着问题看SpringBoot 1、Spring容器具体是什么? 跟进run方法,context = this.createApplicationContext(),得出容器是AnnotationConfigServletWebServerApplicationContext类。 2、SpringBoot中Tomcat的启动流程。 2.1、跟进TomcatWebServer类的initialize() 方法,断点到 logger .info(\\\"Tomcat initialized with port(s): \\\" + this.ge

    2024年02月11日
    浏览(45)
  • 最落魄的时候,身上带着《毛选》

    最落魄的时候,包里只带《毛选》的腕儿 史玉柱:营销大咖,早年创业起伏大 东山再起的腕儿 趣讲大白话:成功是用心血浇灌的 【趣讲信息科技133期】 **************************** 90%的企业是销售驱动型 所以要把品牌和营销的事搞透彻 聚焦,集中优势兵力 企业界里推崇毛教员思

    2023年04月17日
    浏览(30)
  • New bing带着chatGPT来啦

    话不多说,随着chatGPT的到来,GPT-4的升级,AI时代真的要来啦。现在微软浏览器 bing 已经接入最新的GPT版本,而且是免费,重要的事情说三遍,免费使用GPT,免费使用GPT,免费使用GPT!这篇主要用来记录自己在申请使用 new bing时碰到的各种“坑”。希望对大家有所帮助。 第一

    2023年04月19日
    浏览(40)
  • 我带着 chatGPT 做了 2800 道算法题

    学算法认准  labuladong 后台回复课程 查看精品课 点击卡片可搜索文章👇 在线学习网站: https://labuladong.github.io/algo/ 老读者都知道,以前我的算法教程主要使用 Java 语言。但是现在有了 chatGPT 的帮助,《labuladong 的刷题全家桶》已经全面支持了 Java/C++/Python/Golang/JavaScript 等所有

    2023年04月26日
    浏览(52)
  • 基于微信小程序的宝宝成长记录系统(源码+文档+包运行)

    毕设帮助、技术解答、源码交流 联系方式见文末。 随着社会的发展和人们生活水平的提高,家长们对于宝宝的成长越来越关注。而随着科技的不断进步,人们的生活方式也在不断改变。微信小程序作为一种新型的移动应用程序,已经成为人们生活中不可或缺的一部分。因此

    2024年04月10日
    浏览(104)
  • 教你用Python画哆啦A梦、海绵宝宝、皮卡丘、史迪仔!

       由于代码过长,这里仅显示部分代码:        部分代码如下:       部分代码如下:       部分代码如下:     关注我的原创公众号【 小鸿爱摸鱼 】,回复【可爱皮卡丘】、【哆啦A梦】、【史迪仔】、【海绵宝宝】获取对应的源码     Author:南柯树下,Goa

    2023年04月18日
    浏览(36)
  • 带着问题去分析:Spring Bean 生命周期

    Bean在Spring中的定义是_ org.springframework.beans.factory.config.BeanDefinition _接口,BeanDefinition里面存储的就是我们编写的Java类在Spring中的元数据,包括了以下主要的元数据信息: 1: Scope (Bean类型):包括了单例Bean(Singleton)和多实例Bean(Prototype) 2: BeanClass : Bean的Class类型 3: Lazy

    2024年02月08日
    浏览(35)
  • 【带着学Pytorch】2、张量(Tensor)的介绍与创建

           最开始在出现CPU和GPU, GPU出现主要解决的问题时并行计算,在此基础上的软件层面的工作基本上围绕着并行计算进行的,张量也不例外。 首先,我们先来聊聊 编程语言,python,java ,C,C++等,他们都有的共同特点是什么?在大学中计算机类专业耳熟能详, 算法、数

    2024年02月11日
    浏览(43)
  • 教你用Python画哆啦A梦、海绵宝宝、皮卡丘、史迪仔!(附完整源码)

       由于代码过长,这里仅显示部分代码:        部分代码如下:       部分代码如下:       部分代码如下:     关注我的原创公众号【 小鸿爱摸鱼 】,回复【可爱皮卡丘】、【哆啦A梦】、【史迪仔】、【海绵宝宝】获取对应的源码     Author:南柯树下,Goa

    2023年04月20日
    浏览(37)
  • 多少年轻人,被赛博美女逼成了AI侦探

    赶紧自查。 不知从什么时候开始,社交媒体平台上的美女账号越来越多了。 她们的一颦一笑都精致到头发丝,有时成为穿着套头卫衣深情望向镜头的纯情女大,有时又变身元气活泼的氧气美人;她们对摄影、音乐、旅行、护肤、养生都有自己的见解,也能说出让屏幕另一端

    2024年02月21日
    浏览(49)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包