科技日报北京11月28日电 (记者张梦然)据《自然·通讯》28日发表的一篇论文,谷歌“深度思维”报道了一个人工智能(AI)体,在3D模拟中,该智能体能在第一次见到的任务中极迅速地模仿人类专家,实时可靠地获取来自人类搭档的知识。这一研究结果是对AI实现快速知识传播的一次概念验证,也是朝着人类—AI开放式互动的文化演变迈出的第一步。
具身AI,是指有身体并支持物理交互的智能体。之前在物理模拟和现实世界中,科学家已经证明了可用人类数据让具身AI学习新技能。但过去的智能体通常需要在监督下从大量第一人称的人类演示中学习,这类获取既昂贵又费时。相比之下,人类本身则可以通过模仿示范者,在几秒内以互动方式学会新技能,即使初生婴儿也有这种能力。因此,科学界一直在寻求一种AI智能体,能从效率和隐私与人类相仿的其他个体那里进行社会化学习。
“深度思维”团队此次利用深度强化学习训练了一个智能体,这个智能体能在名为GoalCycle3D的物理模拟任务空间里,几分钟就发现并模仿专家的行为,同时记住所学知识。训练后,他们发现这个智能体可在各种有挑战性的导航问题中从普通人类和AI专家那里快速学习,虽然它们以前从来没见过人类。
比如,这个智能体可在包含大量障碍的复杂地形中穿梭。该方法的一个关键是一种新形式的自动化课程,该课程结合了示范者的阶段性遮蔽以及任务难度的逐步升级。而这个智能体的个体神经元在其中能同时编码物理信息和社会信息。
新研究结果为AI领域和文化演化心理学之间的密切互动奠定了基础。团队认为,AI从业者可从人类社会学习中汲取灵感,构建出适应“人类伙伴”这一角色的具身智能体,并保护好隐私。此外,能通过社会学习的AI智能体,或为研究人类文化发展提供新的建模工具。
(原标题:未来AI或在社会中自行学习成长——能迅速模仿人类专家的智能体出现)
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。