无需海量数据输入,AI通过儿童眼睛和耳朵学习语言

美国纽约大学研究人员开展了一项实验,他们通过一个孩子的眼睛和耳朵来训练多模式人工智能(AI)系统,使用的数据来自孩子6个月大到两岁生日期间的头戴摄像头的视频记录。发表在最新一期《科学》杂志上的该项研究表明,该模型或神经网络实际上可利用孩子经历的有限片段,学习大量的单词和概念。也就是说,视频只捕捉了孩子大约1%的清醒时间,但这对于真正的语言学习来说已经足够了。

资讯55

GPT-4AI系统现在可学习和使用人类语言,但它们从海量的语言输入中学习,远比儿童在学习如何理解和表达语言时接受的要多。最好的AI系统训练的文本数量达到数万亿字,而儿童每年只能收到数百万字的文本。

由于数据存在巨大差距,研究人员一直怀疑AI的最新进展能否反映出很多有关人类学习和发展的信息。此次,研究团队从孩子6个月大开始,到25个月大结束,每周通过头戴式摄像机,捕获其第一视角视频并分析。他们共使用了超过60小时的视频素材,包含大约25万个单词实例(即所传达的单词数量,其中许多是重复的)。这些单词实例与孩子在说出这些单词时所看到的视频帧相关联,包括进餐、读书和玩耍等各种不同的活动。

经过训练后,团队对模型进行了测试。他们向模型提供目标单词和四个不同的图像,要求它选择与目标单词匹配的答案。结果表明,该模型不但能够学习孩子日常经历中存在的大量单词和概念,还可以将它们概括为视觉实例,哪怕实例与模型训练中看到的完全不同。

本文采编:CY
下一篇

首张人类细胞微管形成高清图绘出,有助癌症治疗研究

西班牙巴塞罗那基因组调控中心和西班牙国家癌症研究中心团队捕捉到了世界上第一张人类细胞内微管形成最早时刻的高分辨率图像。1日发表在《科学》杂志上的这一发现,为治疗从癌症到神经发育障碍等多种不同类型的疾病奠定了基础。

如您有个性化需求,请点击 定制服务

版权提示:华经产业研究院倡导尊重与保护知识产权,对有明确来源的内容均注明出处。若发现本站文章存在内容、版权或其它问题,请联系kf@huaon.com,我们将及时与您沟通处理。

人工客服
联系方式

咨询热线

400-700-0142
010-80392465
企业微信
微信扫码咨询客服
返回顶部
在线咨询
研究报告
商业计划书
项目可研
定制服务
返回顶部