得知诺贝尔物理学奖花落机器学习领域两位“大牛”之后,知名人工智能科学家、地平线科技创始人余凯第一时间发圈感慨:“我学习神经网络就是差不多30年前从Hopfield Network(约翰·霍普菲尔德根据物理学原理设计的一种网络,以其名字命名)开始的。”
而余凯和另一位“大牛”——杰弗里·辛顿的故事,则更是不同寻常。
余凯(下)与霍普菲尔德(左)、辛顿(右)两人的“同框”。 图片来源:Wired (《连线》杂志)
2013年3月,谷歌公司(Google)花费4400万美元,收购了多伦多大学的一家初创的“三无公司”——一无产品、二无计划、三无资金。
这家公司也只有三位员工,带头的就是已经六十多岁的多伦多大学计算机系教授杰弗里·辛顿,和他的两个学生Alex Krizhevsky和llya Sutskever。
很多人觉得谷歌人傻钱多,花了数干万美元,就买回来几篇“深度学习”的论文。
那时候没人能想到,但就是凭借这几篇论文,辛顿夺得了2018年的“图灵奖”,被誉为“AI教父”“深度学习之父”;Google也一举奠定了自己在AI领域的“头雁”地位。
更没人会想到,辛顿还能因此分享2024年的诺贝尔物理学奖。
在辛顿“卖身”谷歌之前,曾一度接近加盟百度公司,余凯就是参与牵线搭桥的“伯乐”和“操盘手”。
余凯,这位曾经的百度深度学习研究院常务副院长、现在的地平线科技创始人,可能是中国最早“相中”辛顿及其科研成果的人。
故事还要追溯到12年前的那个初秋。
2012年秋天,辛顿和学生们发表了一篇长约9页的论文:《基于深度神经网络的图像分类》,提出了一种全新的深层结构分析方法。他们用这种方法在当年ImageNet图像识别大赛中一鸣惊人,将图像识别错误率从25%以上降低到了15%,获得了第一名。
这在今天来看,应该算得上是AI技术发展的一个历史性时刻,但当时还没有多少人真正意识到它所代表的意义。
而就在论文发出后没几天,辛顿就收到了一封来自一名中国AI研究者的电子邮件。
发出邮件的人正是余凯。
“竞拍”辛顿
“2012年辛顿带着他两个学生拿了ImageNet图像识别大赛的冠军,我是2010年ImageNet图像识别大赛的冠军,所以当我看到2012年的结果超出我两年前的结果非常多的时候,非常震惊。”余凯说:“我觉得没有人比我对这个事情的意义理解的更深刻,所以我当时立刻就写了邮件给他。”
余凯比辛顿小30岁,两人最早在加拿大一个学术研讨会上认识。2012年4月,余凯离开美国NEC研究院加入百度,担任新成立的百度多媒体部部长。
这一年,百度开始大规模采购和建立GPU运算集群,开发了世界上第一个支持GPU&CPU的并行深度学习平台,迫切需要人才和技术。
于是,余凯就向百度创始人兼CEO李彦宏推荐了当时在业界还寂寂无名的辛顿,希望尽早把这个人才挖到手。
技术出身的李彦宏,最终决定派战略投资副总裁汤和松与辛顿取得联系,并直接提出邀约:1200万美元,合约期三年。
辛顿当时心动了,表示“能签”。但就在签约前,辛顿的两名学生“拦下”了恩师,并表示如果他们能先成立一家公司的话,百度可能就会愿意将报价提高很多。
于是,辛顿马上着手创建了员工只有他和他的两名学生的初创公司——DNNresearch。
他还专门询问了一位律师,咨询怎么把他的“三无公司”的价值最大化。律师建议他:要么花钱请谈判代表,要么进行一次拍卖。
余凯所在的百度、谷歌、微软和DeepMind(后来被谷歌收购,研发出战胜了围棋冠军李世石的AlphaGo)参与了竞拍。
尽管余凯所在的百度出到了最高价,但最后辛顿决定“卖身”谷歌。
几年后,余凯离开了百度,创立了自己的的科技公司“地平线”;辛顿的其中一名学生——IIya Sutskever也在同一时间,在马斯克的劝说下离开谷歌,与萨姆·阿尔特曼等人联合成立了OpenAI。
当被问到“没有如愿收购辛顿创立的初创公司,是否留有遗憾”时,余凯表示自己“一点都不遗憾”。
“当时参与的那场秘密收购,其实我觉得是让世界顶级公司都看到了彼此都愿意为收购三个人花那么多钱,几千万美金!至少让大家都更加重视深度学习了。”余凯对《中国科学报》表示。
值得指出的是,当年参加秘密竞拍的那些人,后来创立和壮大了现在的DeepMind、OpenAI以及地平线,这些都是人工智能发展史上值得一书的公司。
“后来,国外有媒体报道说是那是人工智能竞赛的一个‘发令枪’。”余凯说,他之所以一点都不觉得遗憾,还在于在那之后,百度公司上下也意识到深度学习重要性。一个月后,他就在百度组建成立了深度学习研究院,“也是促进了中国的人工智能的发展”。
霍普菲尔德和辛顿两位机器学习领域的“大牛”共同分享了2024年诺贝尔物理学奖,让很多物理学界人士大感意外,但余凯表示他“一点都不觉得意外”。
“因为早期的人工智能专家大部分都有物理学背景,包括我自己也是物理学背景。”余凯告诉《中国科学报》,所谓物理学思维实际上是用数学的方法去建模现实世界,这跟人工智能的核心意义是完全一致的。
“物理学思维并不是纯粹的或抽象的数学、人工智能,更关乎在现实世界里面去构建这样的系统,使它能够利用数学的一些原则去学习知识、变得越来越聪明。”余凯说,比如霍普菲尔德就曾在加州理工大学物理系任教授,他从统计物理学的角度构建了一个分布式的物理学系统,也即“Hopefield Network”。通过这种分布式的学习训练,就可以去构建一个智能系统。
“当年他这个想法是非常非常有远见的,可以说是开创了用人工神经网络去做人工智能、做机器学习的先河。”余凯对他的工作评价很高,一连用了两个“非常”。
因此,余凯认为物理学思维对于人工智能是非常重要的:“去构建物理学系统使它具有智能,这个无疑对于物理学本身也是一个很大的贡献。”
但让余凯更为感慨的是,霍普菲尔德和辛顿两位科学家,他们的研究工作都是长达几十年在一个方向的坚持。
“他们身上的这种理想主义以及对于这个世界的好奇心,我认为是非常值得我们学习的。”他说。
版权声明:凡本网注明“来源:中国科学报、科学网、科学新闻杂志”的所有作品,网站转载,请在正文上方注明来源和作者,且不得对内容作实质性改动;微信公众号、头条号等新媒体平台,转载请联系授权。邮箱:
[email protected]。