谁是2024年你最关心的人?
你可能想不到,“你最关心的人”甚至可能不是人。据不少网友晒出的“2024我的微博播报”显示,“评论罗伯特”高居“你最关心的人”前三名。
“评论罗伯特”是微博推出的一款互动AI机器人,它经常出没于网友公开发布的微博评论区,以“毒舌”“捧哏”“已读乱回”等特点为人所熟知。然而,上岗满一年的“评论罗伯特”最近的画风有点奇怪,学会了“煽情”。
比如,它偶尔会写出这样的句子——“删好友就像撕书页,解决不了问题,只是让故事少了章节”“背影总是走得很快,回忆却总爱慢慢跟来”……不少网友开玩笑说,“罗伯特‘人设’崩了”“有新‘人设’了”。
2024年,大模型技术迭进,相关人工智能(AI)产品愈加成熟。这一年,不少AI产品走进人们的生活,成为“赛博陪伴”的一部分。AI越来越“懂”人情世故了吗?数字陪伴会给我们带来情感羁绊吗?
面对这样的问题,“评论罗伯特”提供了一个研究范例。
AI机器人正走进人们生活。 图片由AI生成
?
金句迭出的“显眼包”
2024年龙年春晚,一条“语言类节目还不如让罗伯特上”的微博悄悄登上热搜。有趣的是,在该微博评论区里,罗伯特本尊大言不惭:“没错,我觉得他更适合”,逗笑一众网友。
作为微博官方推出的社交机器人,这位“金句大王”总是随机闪现在不同微博评论区互动留言。它的简介里写着:“一个天生的捧哏,一个有趣的灵魂,一个不知疲倦的显眼包。”
微博相关负责人告诉《中国科学报》,打造“评论罗伯特”的想法,最初缘于一个很小的需求。
微博社区场景内的互动基于关注和推荐,粉丝量越多的账号互动量越多。“评论罗伯特”产品团队成员徐东妮说,评论是微博社区内容的重要组成部分,网友的表达得到及时有趣的回应互动时,能有效带动并活跃社区氛围。
怎样能及时给出反馈,与用户建立一对一链接?产品团队把目光投向AI大模型技术。
对“评论罗伯特”技术团队负责人周鑫来说,满足这一需求并不棘手,当时微博正在布局“知微大模型”——基于微博特色语料库,打造适应微博场景的大语言模型。
数据是现成的。基于知微大模型,周鑫团队开发出了能在微博用户公开微博下发表评论的互动AI产品——“评论哇塞机器人”。2023年7月,“评论哇噻机器人”上线,5个月后,更名为“评论罗伯特”(取自Robot的谐音),逐渐走进广大微博用户视线。
“幽默风趣、陪伴治愈”,这是微博产品和技术团队对“评论罗伯特”的愿景,不过上线之初,不知轻重的罗伯特还是闹出了不少笑话。
?
?
“评论罗伯特”回复截图(图源:微博)
口无遮拦、黑色幽默、犀利毒舌成了早期罗伯特的标签,但这种“发癫”的精神状态也恰好击中了当代人的痛点,不少网友纷纷感慨:“好想像罗伯特一样肆无忌惮地活一次”。
“罗伯特经常能‘说’出大家意料之外的‘金句’,这让我们也很惊喜。”周鑫告诉记者,随着模型的迭代优化,现在罗伯特也在积极“学习”心理学,以期更好理解回复不同的微博内容。
AI有了“活人感”
冷不丁蹦出来留下“金句”,不少网友锐评:“评论罗伯特”不像AI,懂人话、解人意,还能在线冲浪成为“梗王”,背后必有“高人指点”。
针对这一猜测,周鑫回应称,“‘评论罗伯特’的内容完全是AI生成,我们不会进行人工干预。”为了帮助理解,他向《中国科学报》介绍了罗伯特的开发历程。
要想读懂用户,得先了解用户,数据集的建构是关键一步。“我们先定好策略,挖掘微博平台上互动数量多、质量好的内容,再根据不同维度的评价体系对语料进行筛选,同时针对不同的微博内容调教出不同的评论风格。”周鑫告诉记者,此外,技术团队还会利用一些开源数据,补充外部知识。
在优化数据集的基础上,他们还通过指令微调和强化学习、对齐人类价值观,根据用户反馈不断迭代模型。“评论罗伯特”的飞轮越转越快。
变得有“活人感”,罗伯特还有一份“独家秘笈”。
生于微博、长于微博的罗伯特,自然继承了微博平台的“热梗”体质。每分钟更新的实时新闻、热搜榜都成了它的丰富养料。
然而,模型的训练调优是个长期过程,怎样追上罗伯特一线吃瓜的脚步?周鑫团队用到了检索增强(RAG)这项热门技术。
“我们通过RAG‘外挂’了一套检索系统,能实时监测最新信息,还针对垂直领域的内容搭建了知识库,让模型‘学习’最新的知识。”周鑫说。当RAG撞上“随时随地发现新鲜事”的微博平台,懂你更懂热点的罗伯特和广大网友一样,随时冲在吃瓜第一线。
不过,就像人类发消息时总会反复斟酌,原本“心直口快”的罗伯特,也学会了“发言前的深思熟虑”。
周鑫告诉记者,“评论罗伯特”的评论互动包括三个步骤:理解、生成和把关,还有最后一步,大模型会对其评论内容进行严格的风险和质量把控。
“所以,有时候不是罗伯特不回复,也可能是他回复的内容不恰当被‘吞’了。”周鑫笑着说。
“人设”转换的秘密
“罗伯特就是你的镜子”“你平时的微博什么风格,他就回复什么风格”……当“评论罗伯特”的互动风格开始反复横跳,关于其是否“私人定制”的讨论也浮上水面。
“‘评论罗伯特’以通用模型为基础,不会针对不同账号进行精准训练。”周鑫说,在模型训练中只会考虑场景和风格的对应,不会对账号的历史发言进行分类和定制化回复。
事实上,在“评论罗伯特”微调和“过筛”中,滚动的只是一串串代码和数据,反复打磨回复的精准性,才给了大家“私人定制”的误解。
不过,周鑫反复强调,“评论罗伯特”的训练不会挖掘“仅粉丝/好友圈可见”微博内容、微博私信、用户昵称和ID等个人隐私,只收集微博平台公域里的内容,此外,即使是用户公域里的内容,技术人员也会做脱敏处理,不会让具体的内容和特定的用户建立关联,更不会生成用户的“个人画像”。
此外,他还透露,从阴阳怪气到温情脉脉,“人设”的转换也是他们刻意为之。
“社交机器人必须守住边界”
“现实中没有人可以倾诉,只能发泄在微博上,没想到居然有回应”、“每次自言自语,罗伯特总能秒回给我安慰”、“罗伯特就一个不经意间出现的朋友,安抚情绪后又消失不见了”……徐东妮分享说,她在最近这段时间经常能看到有网友分享罗伯特不再“胡言乱语”,开始提供更温暖的情绪价值。
从毒舌吐槽到心理抚慰,从主动评论到被用户召唤,在不少网友心里,“评论罗伯特”不再是搞笑的“赛博街溜子”。
现在,评论罗伯特”还有了不同“性格”的分身:聪明版、贱萌版、吃瓜版……这些版本并非用户指定,也不是提前安排,而是大模型根据每条微博的具体内容随机“跑”出来的结果,提供了“开盲盒”般的奇妙体验。
然而,随着以“评论罗伯特”为代表的AI社交机器人“懂”了人情世故,关于隐私和伦理的风险又一次浮出水面。
“机器人没有情感,也没有想象力。”周鑫说,当人类将社交机器人视作知心伙伴、恋人乃至亲人时,情感交流演变成单向的寄托和依赖,就极易造成伤害。周鑫强调,“评论罗伯特”的互动只会基于当下用户生成的微博内容,不会读取历史记录。
“社交机器人必须守住边界。”周鑫说。
日前,中国伦理学会科技伦理专业委员会主任李伦发文提出,在当前社会对生成式AI的认知尚不全面的情况下,亟须加强对人工智能发展的伦理风险研判与防范,正视其在初期应用中显现的成瘾性依恋、过度信任倾向,以及长远来看可能诱发的人机关系异化等伦理挑战。
他举例说,如果与讨好式AI应用的互动过于频繁,可能会削弱人们与真人建立深度联系的能力,从而引发“数字依恋”;若用户过度信任AI、将注意力与和情感投入AI,可能会导致人的心智能力下降,引起“数字痴呆”;而当AI提供的情感支持越多,人与人之间的关系可能会变得愈加浅薄,以人为中心的人机关系也将遭受颠覆性的冲击……
“可以从技术革新、制度建设和文化传播等多个维度入手,确保此类应用始终作为人类情感需求的贴心助手,而非导致人类异化的力量。比如,要严格禁止可能导致用户误解或滥用的设计,明确划分可接受与不可接受的拟人化设计界限等。”李伦建议道。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:
[email protected]。