文 | 《中国科学报》记者 沈春蕾
“曹娟,你看这条信息是真的还是假的?”每当有重大事件发生的时候,中国科学院计算技术研究所(以下简称计算所)研究员曹娟总是特别忙,很多人会向她求证信息的真假。
11月9日,2022年世界互联网领先科技成果发布活动在浙江乌镇举行,共15项成果入选,曹娟团队的项目“睿鉴数字内容虚假伪造检测系统和设备”,从全球近300个参评项目中脱颖而出,获此殊荣。
曹娟在获奖现场 受访者供图
当今世界,互联网在提供海量信息的同时,也充斥着一些谣言和伪装信息。如何在这些海量信息中自动地、快速地甄别谣言呢?
2014年时美国、欧盟分别启动了网络谣言检测的科研立项计划,虚假信息的检测开始在政府、学术界引起广泛的重视。同年,计算所跨媒体计算课题组在曹娟的带领下开始从事数字内容伪造检测。2020年,曹娟团队创建了中科睿鉴,希望“用AI反制AI,用技术重塑一个更加可信的世界”。
从“耳听为虚”到“眼见亦假”
今年3月4日,网上有消息称:印度宣布人口已经达到了14.15亿,超过中国,位居世界第一,这是历史性的一刻。但这条消息却让曹娟存疑,因为消息的数据来自印度的一家医疗机构,数据是通过算法模拟预测得到的,并不是官方公布的。
为了进一步求证,她展开调查了解到《印度快报》的消息显示,印度政府计划在2021年进行人口普查,由于疫情爆发推迟了这项计划,所以印度至今没有宣布官方的人口数据。曹娟还查询到联合国的数据显示,印度在2020年的人口数是13.8亿,并没有超过中国。
“这个信息是不真实的!”曹娟结合已有的调查,给出了判断,有理有据。
在互联网上,这样让人一惊一乍的谣言数不胜数。曹娟指出,据统计,Facebook上82家不实信息源的年浏览量达到了38亿;在中国,2021年度微博共有效处理不实信息6万多条。
“我们每天都在跟谣言斗智斗勇。尤其在重大事件发生的时候,谣言更像炸弹一样,来势凶猛。”曹娟感叹道:“每当这个时候,我都特别地忙,因为身边的朋友、同学、领导都会纷纷发来信息,让我求证:曹娟,你看这条信息是真的假的?”
在计算所,曹娟有“智能女侦探”的美称。她很感谢每一位发来求证信息的人:“是你们的需要,让我觉得这份工作特别的有价值、有意义。”
荀子曰,“流言止于智者”。与虚假伪造信息的斗争,自古至今从未停止。古代的谣言受限于口口相传,传播力有限;随着互联网的出现,一条新闻可以在很短时间内影响到成千上万的人。
2015年曾出现过一条非常“热”的图片新闻,介绍的是成都一个小伙子把火锅店开到了南极。后面被证实,图片里南极科考站墙壁上的“成都火锅”是PS上去的。由于P图技术非常好,人眼很难分辨它的真假,所以很多媒体都转载了。
不难发现,技术进步已经颠覆了“有图有真相”的传统认知,不仅图像可以伪造,音频和视频也能弄虚作假,从“耳听为虚”到“眼见亦假”,AI技术的发展却带来了前所未有的信任危机,也给曹娟带来了新的命题——如何让技术落地成为现实生产力?
“魔高一尺,道高一丈”
如果说文字新闻可以通过人工审核判断真假,那么图片和视频则需要技术揭示出伪造的本质,才能识别出来。
“我们现在要做的事情就是跟上技术的进步,使得社会的认知达到一个新的平衡。”曹娟告诉《中国科学报》,既然“魔高一尺”,我们就要“道高一丈”,这也是曹娟选择互联网虚假新闻检测这个研究方向的原因。
“我要检测谣言,那谣言长什么样子呢?具备什么样的特征呢?”在研究过程中,这是曹娟团队遇到的第一个难题。
她举了个例子,普通人吃兴奋剂可能没有核查价值,因为不会引起广泛传播。但如果某运动员吃兴奋剂,那么核查真假就非常有价值,因为会引起广泛传播。“广泛传播是谣言的一个本质特点。”
为此,曹娟团队做的第一件事就是建一个谣言大数据平台。她带领团队花了大半年的时间,用几十台机器搭建了一个分布式的采集平台,每10分钟为一个采集周期,每天能发现上百条争议性的新闻线索。
2013年至今,曹娟团队采集到了百万级的争议性新闻线索,其中有十万级的人工精标注的谣言数据。
经过近10年的技术攻关,曹娟团队研发出互联网虚假新闻自动检测平台——“睿鉴识谣”,该平台可以鉴定事件真伪,溯源伪造痕迹,有效解决虚假新闻、图像、视频的传播问题。
在此基础上,曹娟团队还研制了基于国产芯片的伪造检测专用设备——“睿安”,通过软硬协同跨层优化技术,使得检测性能大幅提升,实现现网流量实时检测和规模化部署,在国家重大事件的虚假伪造信息治理中发挥了关键作用。
“不仅是技术命题,更需要社会参与”
“科学技术一定会跑赢谣言,互联网信息终将回归真实。”曹娟在颁奖现场发出这样的感叹,“对抗谣言不仅是技术命题,更需要社会参与。”
曹娟也发现,同学、朋友在给她发信息求证的时候,关于要不要转发这条信息,他们心里其实已经有了答案。
她的想法也得到了Nature在2021年发布的一项研究证实。
该研究表明,一个人在阅读虚假信息的时候,只要在中间插入一个环节,追问一下“这个信息是真的吗?”那么他(她)转发谣言的意愿就会降低21%。
“换言之,只要你开始关注‘信息是不是准确’这个问题后,你转发的动力就会降低。”曹娟回顾了近10年里,自己已经在点点滴滴中影响到了身边的人,为他们建立媒体的思辨习惯做了一点小小的贡献。
“任务不确定性、信息开放性、环境强对抗性,始终是数字内容安全技术发展面临的三大难题。”曹娟指出,此次获奖的“睿鉴数字内容虚假伪造检测系统和设备”从原创性、先进性、实用效果等多个维度展示了一张答卷。
中科睿鉴数字内容伪造检测技术体系
此外,中科睿鉴还发布了“睿鉴AI”小程序,向公众开放新闻可信度分析、图像视频伪造检测等服务。通过普及检测工具在公众心中埋下“探求真相”的种子,一层层解构数字信任危机,让数据作为生产要素的流通性和价值进一步释放。
曹娟表示,“用技术让世界更可信”既是中科睿鉴的愿景,更是中科睿鉴舍我其谁的使命。未来,中科睿鉴将继续从算法创新、系统搭建、应用服务三个关键方向发力,打造互联网3.0时代国家数字内容安全基座。
特别声明:本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。