研究人员给机器人安排了4项任务。图片来源:Allen Z. Ren et al./Aaron Nathans
美国研究人员在探索一种新的机器人训练方法时发现,对工具的语言描述可以促使模拟机器人加速学习使用各种工具。
这意味着,在人工智能训练期间,提供更丰富的信息可以使自主机器人更加适应新情况,提高其安全性和有效性。
机器人有很大的潜力帮助人类完成重复性或挑战性任务,但训练机器人有效操作工具是很困难的:工具有各种各样的形状,机器人的灵巧性和视觉无法与人类相比。
“以语言形式存在的额外信息可以帮助机器人更快学习使用工具。”研究合作者、普林斯顿大学智能机器人运动实验室负责人Anirudha Majumdar表示。在机器人训练过程中,添加对工具形式和功能的描述,提高了机器人操纵不在原始训练集中的新工具的能力。
此前,Majumdar很好奇自然语言处理的巨大进步对机器人学习有何益处。于是,研究人员利用一种大型语言模型GPT-3进行了工具特征描述——详细、科学地描述工具的形状或用途。
“这类语言模型是在互联网上训练的,所以在某种意义上,你可以将其视为一种检索信息的不同方式。”研究合作者、计算机科学助理教授Karthik Narasimhan说。
在这个模拟机器人学习实验中,研究人员选择了一套训练集,包括斧头、橡皮刷等27种工具。他们给机器人手臂安排4项不同的任务:推动工具,举起工具,拿它沿着桌子扫出一个圆柱体,或者用锤子把钉子钉进洞里。
研究人员使用包含和不包含语言信息的机器学习训练方法开发了一套策略,然后比较了这些策略在包含9个工具的单独测试集上的表现,并进行了配对描述。
这种方法被称为元学习,因为机器人通过每个连续的任务提高了学习能力。结果显示,大多数情况下,在提升机器人使用新工具能力方面,语言信息具有显著优势。
机器人不仅要学习使用每一种工具,还要试着学习并理解对这100种不同工具的描述,所以当它看到第101种工具时,会更快学习使用新工具。“我们正在做两件事:教机器人如何使用工具、教它英语。”Narasimhan说。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:
[email protected]。