业界-人工智能正改变谷歌搜索,而下一个目标则是整个互联网

选自wired作者:CADE METZ机器之心翻译出品参与:张诗玥昨天,46岁的负责谷歌搜索业务的元老Amit Singhal宣布退休。很快,谷歌透露,Singhal卸任的巨大

选自wired

作者:CADE METZ

机器之心翻译出品

参与:张诗玥


昨天,46岁的负责谷歌搜索业务的元老Amit Singhal宣布退休。很快,谷歌透露,Singhal卸任的巨大空缺将由一个叫John Giannandrea的人来填补。在某种层面上讲,这只是两个人各自开启新的生活。但你也可以将两人的职位更替看做是对谷歌内部——甚至是整个科技界运转方式之重大转变的一个绝妙隐喻。



John Giannandrea


要知道,Giannandrea正是谷歌人工智能的掌舵人。他的业务范围包括深层神经网络和模拟人脑神经结构的软硬件网络。通过分析大规模的数据,这些神经网络能够学习各种有用的任务,如照片识别、智能手机语音命令识别,以及正在发生的——网络搜索查询响应(Internet search queries)。有时候,它们学习任务的能力甚至超越了人类——这些神经网络能做的更好、更快,并且能够完成更大规模的任务。


这个叫做深度学习的方法正迅速改造互联网一系列最热门的应用:从Facebook,到Twitter,再到Skype。过去几年中,它也重新定义了谷歌搜索——整个公司最赚钱的业务。正如彭博社(Bloomberg)最近的报道,谷歌从2015年初开始在其搜索业务中部署一个叫做RankBrain的深度学习系统。到了十月,RankBrian已经在谷歌搜索引擎每秒处理的数百万个查询任务中的「非常大的一部分」中发挥了作用。


据彭博社报道,正是Singhal本人批准了RankBrain的应用。此前,他或许已经带领团队进行过对其他更简单的机器学习的探索。但是,据称Singhal曾一度坚决反对在谷歌搜索中应用机器学习——过去,谷歌主要依赖于人工算法,它们严格遵循人类所定制的一系列规则。一些前谷歌员工描述了对机器学习的担忧:人类更难理解神经网络(相较于人工算法)的工作方式,也就更难对其进行优化。


这些担忧仍然威胁着机器学习领域。事实上,即便专家们并不能完全理解神经网络的工作原理,但它们实实在在的在起着作用:如果你向一个神经网络输入足够多的鸭嘴兽图片,它便能学着鉴别鸭嘴兽;如果你输入足够多的恶意代码,它便能识别电脑病毒;如果你输入的是大量的自然语言——人们在搜索引擎中可能输入的词或短语,它便能学着理解这些搜索命令并给出结果。在一些例子中,神经网络比工程师们写的算法更好地执行了搜索任务。人工智能是谷歌搜索的未来——如果是谷歌搜索的未来,也即是互联网更多领域的未来。

坚守规则


去年秋天,我与一位不愿透露姓名的前谷歌员工(他未被授权公开谈论公司的内部事务)讨论了神经网络在谷歌搜索引擎中的作用。他说道,谷歌的广告团队曾一度利用神经网络来协助定位广告,但「有机搜索(organic search)」团队对这一技术并无好感。的确,这些年来关于这一争议的讨论仍不时涌现在Quora(一个广受欢迎的问答网站)上。


《高效的工程师》(The Effective Engineer)一书的作者,曾就职于谷歌搜索团队的Edmond Lau 在Quora上写道:Singhal对机器学习抱着哲学上的偏见。他这样描述机器学习带来的困扰:「给定一个查询请求,人们很难解释,为什么某个特定的搜索结果排名高于另一个。」另外,他还补充道:「很难直接调整基于机器学习的系统来提高某一讯息的重要性。」一些其他前谷歌员工对这一描述表示赞同。


是的,谷歌的搜索引擎曾由能够自动响应搜索查询的算法所驱动,但这些算法相当于一系列明确的规则。谷歌的工程师们能够轻易地改变和优化这些规则——而且,与神经网络不同,这些算法不会自我学习。正如Lau写道:「基于规则的评价标准虽有其繁冗之处,却让工程师们能够针对特殊情况对权重直接进行调整。」


但现在,谷歌已经将深度学习整合到其搜索引擎中。随着人工智能的负责人接管搜索业务,谷歌似乎已经坚定了这一趋势。

失控


诚然,应用神经网络意味着一定程度上的失控。「但也并不是完全无法掌控,」深度学习创业公司Skymind的创始人说道。其实神经网络不过是数学——线性代数,工程师们毫无疑问能够追踪这个多层结构中数据的变化。问题是,人类很难理解神经网络为什么以某种特定的方式将一张照片、一段语音或自然语言进行归类。


「人们能够理解深度学习背后的线性代数,但是这个模型并非人类可理解,而是机器可理解的」,Nicholson说道,「它们可以给出非常精确的结果,但我们常常不能从人类的角度去解释这些结果背后的道理。」


也就是说,为了优化这些神经网络,人类只能依靠直觉、试验和犯错来调整其数学模型——而且你必须不断地加进新的数据进行训练,也就意味着更多地试验和犯错。这在理论上可行,但是错综复杂。随着谷歌搜索向人工智能模型迈进,谁也说不清这一举动怎样让其搜索结果避免不公平投诉,或者,面对投诉时调整其搜索结果的能力又会受到怎样的影响。


这些考虑并非杞人忧天。最近,谷歌正面临一项欧洲的反垄断调查,涉及到谷歌是否不正当地对其竞争对手的页面进行降级。如果真的完全让人类所无法理解的机器做决定,到时候又该怎么办呢? 人类依然会指导机器,但是不再像以前那样了。


无论如何,谷歌搜索已经迎来深度学习时代。而且近几年中,谷歌也许已经应用过其他的机器学习形式。虽然这些技术让人类在某种程度上失去掌控权,但谷歌相信这利大于弊。

深度学习


可以肯定的是,深度学习仍只是谷歌搜索系统的一部分。据彭博社报道,谷歌每天收到的搜索请求大约有15%是其未曾见过的,而RankBrain正是用于处理这一部分请求的。它主要的功能就是分析搜索请求中不熟悉的字词和短语,并且给出与其意义相似的词句。因此,在处理陌生搜索请求方面,RankBrain远胜过传统的基于给定规则的系统。



©本文由机器之心原创编译,转载请联系本获得授权

✄------------------------------------------------

加入机器之心(全职记者/实习生):hr@almosthuman.cn

投稿或寻求报道:editor@almosthuman.cn

广告&商务合作:bd@almosthuman.cn





机器之心是Comet Labs旗下的前沿科技媒体。Comet Labs是由联想之星发起、独立运作的全球人工智能和智能机器加速投资平台,携手全球领先的产业公司和投资机构,帮助创业者解决产业对接、用户拓展、全球市场、技术整合、资金等关键问题。旗下业务还包括:Comet旧金山加速器、Comet北京加速器、Comet垂直行业加速器。


↓↓↓点击「阅读原文」查看机器之心网站,获取更多精彩内容。