作者:江庆龄 来源:中国科学报 发布时间:2025/1/15 11:32:36
选择字号:
机器人版“GPT”亮相“科技春晚”,释放了哪些信号?

 

 1月7日,有“科技春晚”之称的国际消费类电子产品展览会(简称CES)正式开幕。

现场,英伟达发布的“NVIDIA Cosmos”十分吸睛。这是首个世界基础模型,英伟达创始人黄仁勋表示,人工智能(AI)的下一个前沿就是物理AI(Physical AI)。“如果说ChatGPT定义了生成式AI,那么Cosmos将是机器人领域的‘ChatGPT时代’。”

从英伟达目前已公开的信息来看,Cosmos模型基于在200万小时视频上完成训练,集成了生成式模型、tokenizer和视频处理管线,可以接受文本、图像或视频提示,生成高质量的虚拟世界状态,从而为自动驾驶和机器人应用提供定制化的视频输出。

图片来源于英伟达官网。

  ?

“世界基础模型的作用并不是生成创意内容,而是帮助AI理解物理世界。”复旦大学管理学院信息管理与商业智能系助理教授李文文介绍,“世界基础模型”能够利用生成式AI技术,模拟现实环境并基于文本、图像或视频输入预测准确结果。通过从感官数据中学习表示和预测运动、力和空间关系等动态特性,它们可以理解物理世界中事物的性质、运行规律和空间特性。

实际上,世界模型的概念很早就已经提出。图灵奖得主杨立昆就曾提出,未来的AI发展方向,应该是通过无监督的方式观察世界、与世界交互,然后进行学习,这条技术路线需要由世界模型实现,而非ChatGPT这样的大语言模型。

李文文解释道:“例如,原先让AI学习开车采用的是类似于‘题库刷题’的方法,需要给AI投喂大量的开车视频,而人类在驾车时,即便遇到很多没有学过的状况,也能够下意识地做出避让反应。无监督式的学习就是要让AI像现实里的人类一样,在世界模型里观察世界再采取行动,在此过程中学会应对未知的状况。”

如果从商业应用角度来看AI技术,则需要思考当前的大模型技术仅仅是昙花一现,还是可以在商业层面发挥实际作用,这也是许多企业面临的关键问题。

在李文文看来,无论是科技创新型公司还是大型企业的领导者,未来必须拥有一项综合技术与商业思维的新技能,她将其命名为“技术嗅觉”。

所谓技术嗅觉,就是将技术理解与市场洞察相结合的一种能力。即便非技术或科研人员,也需要对技术发展有一定理解,知道技术能够解决什么问题。同时,领导者还需要对市场需求有敏锐的洞察,了解用户真正需要的是什么,以及市场的发展趋势如何。最终,技术嗅觉可以帮助他们识别商业化机会。

“一个常见的决策场景是在技术发展的不同阶段,企业需要考虑切入的时机。”李文文举例,新技术刚刚出现时,企业是否应该立刻引入,还是等到技术成熟后再采纳,这都需要权衡。企业应该根据自身定位,选择不同的切入时机和介入深度。

而要想做出正确的决策,不能仅依赖于传统的商业嗅觉,更需要结合技术嗅觉。“从这点上说,在自动驾驶汽车、机器人技术发展日益蓬勃的当下,英伟达推出Cosmos模型也是一种技术嗅觉的体现。”李文文指出。

 
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:[email protected]
 
 打印  发E-mail给: 
    
 
相关新闻 相关论文

图片新闻
科学网邀您一起揭晓2024年度十佳博文 智利大型能源项目威胁世界最大望远镜
全球尺度风速与植物水力性状的关系获揭示 地球早期大气层曾发生碘氧“大战”
>>FC碰碰胡老虎机法典-提高赢钱机率的下注技巧
 
一周新闻排行
 
编辑部推荐博文