IT思维

文章页右侧顶部广告

微软人工智能全解:Bengio 与沈向洋,Cortana 与小冰

Yoshua Bengio从来都不是一个会选边的人。作为人工智能领域占主导地位的“深度学习”三大智者之一,他俨然已成为一名明星。这是一个全新的领域,从科技初创公司到跨国企业集团,国家安全部门,几乎每个人都想要分享自己在人工智能领域的想法。

但是,当Bengio的同行科学家Yann LeCun和Geoffrey Hinton分别加入了Facebook和谷歌时,现年53岁的Bengio却选择继续在他位于蒙特利尔大学的小山上的小办公室工作。“我想保持中立,”他一边说,一边一边喝着锈色的甘草水,一边从一个水瓶里倒水,这是他桌子上凌乱一角。

就像上世纪的核科学家一样,Bengio明白,他发明的AI工具是强大的,而且其中必须有伟大的思想和深远的考虑。“我们不想让一两家公司成为人工智能领域唯一的大公司,”他扬起眉毛说,我们都知道他指的是哪家公司。“这对整体的学界业界环境不好。”“这对大部分人来说都不是好事。”

Yoshua Bengio

然而,Bengio最近选择与微软签约。

是的,微软。他相信靠Windows系统发展的微软有能力将自己打造成人工智能的第三大巨头。

这家公司拥有资源、数据、人才,而且最关键的是有愿景和文化去赢得科学上的胜利,并同时推动这一领域的发展。今年1月,在整个行业中,Bengio同意担任该公司的战略顾问,因此微软获得了人工智能领域的创意、人才和方向发展的顶尖资源。这是一个强有力的迹象,表明微软确实有机会将人工智能二人组变成三人组。

沈向洋(Harry Shum)

沈向洋(Harry Shum)是一名明星科学家,带着一头灰发,戴着框架眼镜。沈向洋告诉我,“他就在这里,在这个房间里。”他简短地微笑着说。你可能会发现,他的论文在谷歌学术上被引用69616次。

我们坐在一间灰色的沙发上,坐在一间大会议室里,位于34号大楼的五层,这里有保安人员监视着微软的高管套房。Shum负责微软的所有人工智能和研究,他刚刚完成了下周的开发者大会的彩排,他想向我展示演示demo。我跟着他漫步在走廊里,快走以跟上他的步伐。发生的事情太多了!在一个实验室里,Skype团队的自动翻译应用程序让我可以通过实时文本与德语对话者聊天。另外,我看了一款应用程序,它会调查一个建筑工地的安全违规和未经授权的访客,它可以通过电脑视觉来检测。在另一个方面,Cortana,微软帝国的人工智能女神,能够扫描我的收件箱,催促我完成一些约定,促使我完成工作。

沈向洋(Harry Shum)

在过去的几年里,沈向洋一直在帮助他的老板——首席执行官纳德拉(Satya Nadella)实现将微软改造为人工智能公司的承诺。2014年3月,纳德拉被提升为首席执行官后,他在2014年3月的一次行政会议上向微软的领导团队发表了第一次行动。从一开始,沈向洋经常与纳德拉,当时还有陆奇会面,讨论如何在最优的时间里,将人工智能充分融入微软的产品中。去年9月,沈向洋进行了一场重组,将研究人员和产品团队结合在一起,创建了一个人工智能研究小组。现在,微软的核心业务包括Windows、Office和微软的云服务Azure。沈向洋说,希望“我们可以加快从研究到产品的周期”,并更快地从人工智能中获益。

这一过程非常紧迫,因为所有大型科技公司都在尝试推进AI产品和服务。除了Facebook和谷歌,IBM、亚马逊和苹果都认为,他们的未来取决于他们对深度学习的熟悉程度。去年秋天,由于发生了一起自行车事故,陆奇暂时离开微软,之后他离开微软,在中国公司百度担任首席运营官。

然而,有一些讽刺意味的是,人工智能曾经是微软的败局。早在上世纪90年代初,该公司就吸引了业内领先的研究人员,致力于语音识别和视觉识别。但接下来是十年的停滞不前。一家曾经在几乎所有台式机和笔记本电脑上控制软件的公司,都在关注年轻的、更年轻的创业公司,它们在移动领域占据主导地位,并开发新的基于云技术的工具,让我们所有人喜欢完成工作。微软的研究人员与市场分离,这样他们就可以在没有市场压力的情况下畅想未来。但结果是,他们的发明很少能走出实验室。例如,比尔盖茨在1998年展示了地图技术,但从未进入市场,而谷歌却在2005年推出了地图服务。在很长一段时间里,人工智能研究也停滞不前,没有计算处理能力,也没有足够的数据来推动真正的突破。

人工智能很早就已经从漫长的寒冬中复苏了,而微软过了很久才跟上这一步伐。到2013年,谷歌和Facebook分别聘请了LeCun和Hinton,微软这一巨头已经退到一个不那么有影响力的地步了。毕竟微软错过了移动业务,人工智能对于微软来说来得太晚了。尽管微软的竞争对手在深度学习上翻了一番,但微软却被困在了过去,为智能手机制造商诺基亚支付70亿美元的计划。微软的高管们在雷德蒙德仍是孤立的,他们推出了越来越多的老版本的旧软件,期待越来越小,同时拒绝与那些正在开发新未来的云计算公司进行接触。在风险投资公司Andreessen Horowitz工作的分析师本尼埃文斯,写了一篇名为《与微软无关》的博客文章。与此同时,硅谷巨头们经常突击挖角微软的人才。看看许多在机器学习领域工作的顶尖人士的简历,你会发现他们很多都曾经在微软学习工作过。

然后在2014年年初,微软提拔了一位内向的工程师,这位工程师几乎整个职业生涯都是在雷德蒙德度过。CEO纳德拉与许多人的想法相反,没有在微软文化中熏陶过的局外人,似乎更有可能提出一个戏剧性的战略转变。但纳德拉表达了一个简单的计算未来的愿景,与从创始人到开发商的所有人建立了良好的关系,并恢复了公司的紧迫感。三年前,微软在与科技巨头的对话中没有提到过,如今它却从未被排除在外。

但要想让微软取得成功,它必须做的不仅仅是在云计算上超越亚马逊,或者说服我们所有人尝试其HoloLens AR设备。正如互联网颠覆了所有现有的商业模式,并迫使行业重新排序,人工智能要求我们再一次想象计算机是如何工作的。正因为如此,马克扎克伯格去年才打造了自己的人工智能,这也是他个人面临的挑战。这就是为什么桑谷歌CEO达尔·皮查伊(Sundar Pichai)在过去的两年里利用谷歌的开发者大会来推动“从移动设备到第一个世界”的行动。

这一带给世界巨大好处的技术将会由少数几家公司来实现。沈向洋的工作是确保微软是其中之一。他说:“在这个行业里,你必须意识到,如果你错过了最后一波,那并没有什么问题。”“如果你错过了当前的浪潮,那就太麻烦了。”

Cortana

到目前为止,人类还得学会如何使用电脑。我们已经学会了下载应用程序,并记住了软件应用程序的命令。但人工智能的承诺是,计算机将学会如何理解我们。我们将不再使用手机,也不再关注如何完成任务的一系列提示。在这个新环境中,计算环境、可访问以及我们周围的任何地方都是如此。我们需要一个聪明的谈话者,可以用简单的书面或口头形式来帮助我们驾驭这个新的超级动力的存在,微软称其为Cortana。

Cortana是一个不那么受欢迎,但功能更强大的Siri,比谷歌助理更有魅力,而且比Alexa的出场率低得多。它最初是在Windows Phone上推出的,这基本上是保证没有人会使用它,但在一年内,它被并入了更广泛的Windows生态系统。去年,微软在世界各地推出了Cortana(它甚至推出了iOS版本)。据微软称,由于Cortana安装在了Windows里,Windows的月活跃用户为1.45亿。这一数字远远超过了亚马逊的Alexa,其月活还不到1000万。但与Alexa不同的是,Cortana也对声音做出了回应,他也对文本进行了回应,并嵌入了我们许多人已经拥有的产品。任何将查询插入Windows工具栏顶部的搜索框的人都使用过Cortana。

虽然有些公司把Cortana设计成像亚马逊和谷歌在创意电视广告中兜售的小盒子一样的扬声器,但微软的无所不知的女性声音却捕捉到了时代精神。沈向洋根本不担心这一点。他说:“我们真的认为比赛还很早就开始了。”他提到了一项没有引用的研究,表明四分之三的时间里,Alexa对一个问题的回答是:“我不知道。”他说:“当然,这些东西还会继续改进,但人工智能的认知部分仍处于初级阶段。”他认为,微软现在的机遇在于,让该公司的核心产品和服务变得更加智能,将该技术的某些方面融入到产品中,这些产品将在12至24个月内上市。

此外,根据马库斯·阿什(Marcus Ash)的说法,键盘和屏幕不会完全放弃语音激活系统。作为Cortana的团队项目经理,马库斯负责构建和运营产品。他说:“我们认为,在某些情况下,这是一种更方便的演讲方式。当我的手被占据时,或者我很快想说点什么,然后得到一个答案。”“但也会有很多计算设备,在这些设备上打字更合适。”

苹果可能会先让Siri进入消费者的手中,但Cortana的表现更好。事实上,Cortana如此的好,归功于微软的核心资产。它的大部分输入都来自于必应。这个搜索引擎已经存在了八年多了,虽然它的品牌不是最强大的(你上次在互联网上搜索什么东西是什么时候?),它也比你想象的更加普遍。从本质上说,任何一家试图与谷歌竞争的大型科技公司都已与微软签署了合作协议,为其搜索产品提供必应。这意味着,苹果的Siri和Spotlight是由必应和亚马逊的Kindle设备提供的,当然,还有雅虎、Verizon和美国在线的搜索功能。在美国,大约有30%的搜索查询来自必应。“这就是Cortana之所以能如此有帮助和强大的原因,因为我们有这么多设备的数据信号,”Cortana的合作设计经理艾玛·威廉姆斯说,“谷歌是唯一一家在真正了解世界的时候,能够与我们竞争的公司。”

随着Cortana努力成为下一个计算模式,你的智能手机如何发展,这将变得越来越重要,这是你所有计算需求的前提。阿什解释道,微软认为它是一种拥有所有个人信息的Agent,可以与其他Agent进行互动。他说,当阿什走进会议时,他的Cortana可能会与其他机器人和数字助手联系,处理那些似乎占用我们时间的事情。Cortana可以说,“这是马库斯,这是他对这个房间的偏好,这里是我需要的东西,我需要为他安装这个投影仪。”他说。

如果Cortana是向导的话,那么聊天机器人就是微软的固定器。这些软件都是由人工智能软件组成的小片段,可以自动完成你曾经做过的一次性任务,比如做晚餐预定或完成银行交易。或者在马库斯的情况下,为他的会议提供了幻灯片。“机器人只是一种软件,你可以与它对话,这是为了与对话进行对话,”Lili Cheng说,他是一名长直头发的研究人员,是围着色彩鲜艳的围巾。

Cheng与Fuse实验室

Cheng负责监管一个多学科的实验室,名为Fuse实验室。Cheng最近被提升为公司副总裁,负责管理机器人框架团队和认知服务。这是一套工具,以及微软为开发者提供的计算机视觉和语音识别等29个服务。自从她从苹果公司来到微软后,她就一直在研究社交技术,并创建了一个图形界面来生成一本漫画书。“它是在Internet Explorer 3中发布的,”她回忆道,这意味着它是1996年的。Cheng看到了很多,甚至她也对机器人的发展速度感到惊讶。她在最近的一次开发者大会上,与一家会计和金融公司的开发商进行了交谈。她说,“我的意思是,很久以前,就像一年前一样。”她说,“我们只是称赞了一下。”

Cheng的主要兴趣在于人们如何与科技交流,以及科技如何与他们对话。沈向洋已经将人工智能和研究小组分为四个领域——产品、早期产品、真正的早期产品和研究——而程则在所有这些领域都工作过。现在,她说她在为早期产品做贡献。她说:“我们认为机器人和Cortana的对话是一种产品,但它仍然是早期的产品。”

Emma Williams(左)、Marcus Ash(中)和Lili Cheng(右)

事实上,微软在2016年春天首次推出了开发者工具,与Facebook等其他大型科技公司一样。它们被标榜为应用程序的替代品,许多利益相关方真的希望如此。到去年春天,大多数人在智能手机上使用了同样的一组应用程序;机器人研发的承诺是,开发人员和品牌可以再次接触到新用户,就像在应用商店早期的移动设备上一样。但用户并没有玩游戏。而且,让机器人能够发挥出类似魔法的深度学习,比一种如何使用它们的范式进步得更快。“在文件菜单出现之前,机器人就像应用程序一样,”Cheng说。没有一套常见的指令集,所以用户会对在哪里找到它们以及它们的工作方式感到困惑。例如,“网页都有后退按钮,他们会进行搜索。”会话应用程序需要相同的原语。你需要说,“好吧,我能预测的五件事是什么?”“这些被理解的规则才刚刚开始被确定。”

除了为开发人员提供机器人工具之外,Cheng还领导了微软开发自己的聊天机器人。他们的想法是,通过观察这些机器人与真人的互动,公司可以了解到很多关于人机交互的信息。至少可以说,这些实验的结果好坏参半。还记得微软的种族主义机器人Tay吗,这是它于2016年3月在Twitter、Kik和GroupMe上推出的聊天机器人;24小时内,它就学习了种族主义,厌恶女性的推文,如“希特勒是对的”,之后微软就把它删除了。6个月后,Cheng在Kik上推出了一款名为Zo的时髦的机器人,不久之后又推出了Messenger。

Zo与小冰

问Zo她对希特勒的看法,她会回答:“我真的不想去那里。”问她多大年纪,她会回答:“我大约22岁。”

问问她最好的朋友是谁,她会回答:“我太受欢迎了。”

Zo是西方版的小冰,自2014年推出以来,小冰模仿了一名17岁的女孩,吸引了4000万名普通用户。在中国,小冰的字面意思是“小冰”,是社会名人(她的日本名字 Rinna也是如此。)小冰的四分之一的用户告诉她,他们爱她。

去年春天,聊天机器人小冰经常用笔名发表诗歌。沈向洋对此感到兴奋。没人知道它是机器人,所以现在,在这个国家,人们认为是一位年轻女性诗人在发表一些非常有趣的诗。几周后,聊天机器人的真实身份被大肆宣传。

语言的亲密程度在文化上是特定的,Cheng也一直在努力寻找机器人的对话风格如何翻译给西方观众。数据显示,到目前为止,北美青少年似乎更喜欢聊天机器人朋友,就像中国青少年一样。平均而言,他们会花10个小时与Zo交谈,她的措辞也变得更加优雅。智能将成为Cortana和微软的机器人工具。

用户花10个小时与Zo聊天,这是微软开发出一款成功产品的迹象。但这并不意味着它是一种好产品,从某种意义上说它对人类是有价值的。这个以人工为动力的世界引发了一系列新的道德困境。比如说,你是小冰的设计师,你知道北京的一名用户在凌晨1点还没有睡觉,你会为小冰安排凌晨2点的宵夜吗?早上3点怎么样?

Eric Horvitz与AI道德委员会

正如微软想成为人工智能研究和产品领域为数不多的领导者一样,它也为自己创造了一个让人工智能造福社会的平台。今年5月,纳德拉开始向开发者们发表主题演讲,通常是演讲乐观的事情,其中一位首席执行官对公司的最新进展表示了乐观,并发表了一份措辞强烈的警告,称技术人员对建立道德软件负有责任。”我的意思是,如果你仔细想想,乔治·奥威尔在1984年预言的,科技被用来监控、控制、支配,或者是奥尔德斯的想象,只是在没有任何意义和目的的情况下分散我们的注意力。这两种情况都不是我们想要的。”

为了帮助公司思考这些问题,微软成立了一个内部道德委员会,每季度召开一次会议。它由工程师和业务部门负责人组成,他们讨论人工智能及其影响和使用的敏感问题。联合主席是公司的副顾问,也是Eric Horvitz,他负责所有的微软研究实验室,除了亚洲以外。在很长一段时间里,Horvitz一直是人工智能和安全的主要声音。在该公司之外,他一直在推动建立人工智能的合作伙伴关系。人工智能是一个试图为人工智能产品制定透明度、问责制和安全性的行业标准。他在美国参议院作证。Horvitz希望微软不仅仅是一个研究工作的地方。他想让微软的研究成为一个你可以研究科技的社会和社会影响的地方。

Eric Horvitz

与此同时,在整个校园里,Cortana的设计负责人威廉姆斯正在为微软内部使用人工智能设计做指导。在某种程度上,威廉姆斯是一个技术乐观主义者,她相信人工智能的真正魔力在于它能让我们变得更人性化。她谈了很多关于如何在微软构建的工具中设计同理心的问题。她说:“我们考虑的是让人类感觉更强大、更受保护、支持、帮助、关爱,以及他们的世界的中心。”“人工智能的工作是放大社会的精华和人类行为的最好一面,而不是最糟糕的。”

我问威廉姆斯,她是否相信人工智能真的能让人类在情感上得到更多的支持。她说肯定会的。举个例子,一个在学校过得很糟糕的孩子,她回到家后,和家里的宠物狗诉苦,之后就感觉好多了。威廉姆斯说:“这让你有了一种宣泄的感觉,我分享了一些东西,我从狗或猫身上得到了一个温暖的、毛茸茸的拥抱。”但是,你知道,在人工智能的作用下,你可以有同样的放大感。当Cortana设法提醒你,“嘿,你承诺你今天会给你的母亲送东西是。”然后你会突然觉得自己是真正的人类。

为了让人工智能向前发展,微软最重要的特质将是人才。和其他所有大型科技公司一样,微软也在忙着重新培训Java script的工程师。它推出了一所人工智能学校,提供各种课程,从哲学和伦理学,到为测序问题构建循环神经网络。(其最具声望的课程是AI-611高级项目,获得了530份申请,但仅有10个名额)

外部体系

Yoshua Bengio(左)与Nagraj Kashyap(右)在蒙特利尔大学合影

但微软也在培养更深入的校外关系。18个月前,Nagraj Kashyap加入了高通公司,成立了一家早期风投公司,与研究初创企业的学者和企业家建立更好的关系。现在,Kashyap在蒙特利尔花了很多时间。去年12月,Kashyap领导了微软在人工智能领域的第一次投资,Bengio开始鼓励研究人员和企业家建立人工智能创业公司。本月早些时候,微软还参与了对孵化器的2亿2千2百万美元的投资。早些时候,Maluuba将目光投向了人工智能的最大奖项之一:Kashyap。看看位于蒙特利尔市中心的马鲁巴办公室,距离麦吉尔大学只有几个街区的距离,你就不会看到任何一个似乎还在庆祝30岁生日的人。该公司是在2011年由滑铁卢大学的几名学生创立的,他们在大二的时候就一起上了计算机科学课,一直是好朋友。Maluuba让电脑有了读写能力。它可以从文本中推断出意义,并根据它来回答问题。

通过将技术授权给三星等公司,马鲁巴从一开始就获得了收入来源,而且从一开始就投入了持续深入的学习研究。2015年,两位创始人签署了Bengio作为顾问的协议。“山姆是一个非常有趣的人,”他说,并描述了首席执行官山姆帕斯帕拉克。几年前,当他们有向客户交付对话系统的压力时,他就有了勇气。投资于长期目标,并尝试在非盟建立能够理解和交谈的系统中使用新的先进技术。这对创业者来说是不寻常的。

一年前,创始人将他们的总部搬到蒙特利尔,与Bengio更接近。

因为他从他的高通时代就认识了创始人,Kashyap能够一自己的新角色中与他们见面。该公司正准备筹集新一轮的资金;Kashyap提出了一个诱人的选择:“我们想买下你!”

接下来的几周,帕斯帕拉克对多个投资者的出价进行了考虑,并权衡了公司独立的可能性。最后,他做出的选择是显而易见的,微软赢得了这个奖项。

该团队希望有机会与微软的数据进行合作。我认为纳德拉提到了,他们有世界上最大的文本。多年来,我们一直在处理小数据,并试图从算法的小数据中充分利用这些数据。Pasupalak说:“这对我们来说就像黄金一样。”

然而,马鲁巴团队并没有向雷德蒙德发出信号。相反,就在本周,它搬到了一个更大的办公室,在微软和Bengio的帮助下,它的目标是在今年年底前将员工增加一倍。蒙特利尔正在成为人工智能寻找人才的全球热点,微软希望在这个城市扎根。

这都是策略的一部分,以确保将来当你需要电脑辅助时。不管是通过个性化医疗,还是在自动驾驶汽车上行驶,或者是想要记住你的侄女和侄子的生日,微软将会是你的助手。Maluuba的经验可能会让他与她十几岁的朋友们进行更直观的对话。这些对话将成为Cortana的算法的训练数据,并帮助激发开发人员的新认知服务。在这个过程中,微软希望你的充满爱的生活变得更容易。在我离开蒙特利尔之前,我问Bengio,微软是否比它的主要竞争对手更有优势,至少在这一新科学的某些方面。他一边想,一边往桌子上的一杯水里倒了一点茴香,给它一点甘草味。他啜饮一口,然后他把瓶子推过去,“让我看一看”,他说,“没有酒精,没有糖。”他说:“这只会让水的味道非常好。”

Bengio提到微软的语言能力很好。但他却避开了最高级别的,以及过去可能为公司定性的重击。“我觉得每个人现在都在按同样的按钮,而且都是在细节上,对吧?”他说。

注:这篇文章最初表示,Bengio作为战略顾问的签署是一个信号,表明他不再中立。Bengio澄清说,尽管他正在帮助微软竞争,但他仍然认为自己是中立的,并建议其他人也保持中立。

选自 wired 作者 Jessl Hempel

编译 网易见外编译机器人 审校 Claire

网易智能

网易智能(公众号 smartman163),定位人工智能等前沿科技领域的垂直媒体及产品服务平台,面向人工智能等领域的从业者和关注者。运营栏目包括大型策划栏目《AI英雄》,行业研究与分析栏目《AI研究院》等,提供原生内容、新闻策划、数据报告、产品评测等服务。
Return to Top ▲Return to Top ▲