IT思维

文章页右侧顶部广告

苹果 AI 这一年

2017-06-09 14:52:44 0 企业思维 | , ,

在周一举行的苹果WWDC 2017发布会上,苹果展示了其人工智能研究的最新成果。我们看到了新版的Siri助手,其智能程度足以理解用户所有意图;我们也看到了更新版Metal 2,一个专门为机器学习设计的图形界面;我们还看到了集成各种功能的照片应用程序,在断网情况下仍可工作。在一系列人工智能产品的背后,是苹果公司在重新定位自己。

尽管苹果早在2010年就发布了数字助手Siri,但在人工智能领域苹果一直落后于竞争对手。令人惊叹的是苹果在短短一年的时间内完成了如此多的产品研发。当然,从技术层面讲相关产品研发进行了三年的时间,然而苹果在前两年遇到了不少麻烦。

2010年,当苹果首次发布Siri时,科技世界很快就失去了理智。“Siri和Mac一样具有革命性,”哈佛商业评论如是指出。CNN甚至发现很多人担心该公司已经发明了天网的雏形。但是,Siri的光芒很快就消失了。一旦普及,公众就意识到了这个系统存在的诸多缺陷。

时间来到2014年,苹果公司的数字助理功能已经被Siri存在的语音采集和理解问题所终结。该公司意识到,对Siri进行微调无法解决其根本问题,需要推倒重来。所以他们就这么做了。最初的Siri依赖于后台的Markov模型,这是一种用来模拟时间序列数据的统计工具(其本质上是重建一个基于输出数据的状态序列),被Siri通过时间模式识别用户手写和语音信息。

苹果公司用各种机器学习技术取代并完善了这些模型,其中采用了深度神经网络以及“长短期记忆网络”(LSTMN)等人工智能技术。这些神经网络实际上是广义版的Markov模型。然而,因为这些神经网络具有记忆功能,可以分析语义背景,而不是像Markov模型那样的简单学习模式,因此其能够理解语法和标点符号的细微差别,从而更接近用户的真实意图。这个新系统很快就超越了原有的Siri。

正如Steven Levy指出的那样,“当手机识别出陌生来电者,但最近他给你发了邮件,你就会看到这个电话。”或者,当你解锁屏幕的时候,就会得到一个你可能会打开的应用程序列表。或者收到一个还没来得及列入日程安排中的约会提醒,(你就会意识到这个人工智能的强大)。早在2016年度苹果开发者大会上,其在人工智能研究领域就取得了一些扎实的进展。

“我们可以分辨出在季后赛中的金莺队以及在公园里玩耍的孩子们之间的区别,”苹果公司的高级副总裁Craig Federighi对与会者说。该公司还在全球开发者大会上发布了它的神经网络API,其能够让第三方开发者在苹果设备上开发神经网络相关应用。

然而此时苹果还没有赶上谷歌和亚马逊之类的公司,后者都已经发布了配备数字助理的智能家居设备,或者是即将发布。在一定程度上这是因为苹果在招募以及留用人工智能领域顶尖人才方面遇到了严重困难,因为它坚决拒绝让研究人员发表自己的研究结果。这并不令人惊讶,因为苹果常以对研发成果保密而闻名,它曾因为一名工程师在帕洛阿尔托一家酒吧里留下一部原型手机而起诉过一家新闻媒体。

“苹果在保密方面要求过高,”多伦多大学计算机科学学院教授Richard Zemel在2015年对彭博社说。其完全脱离了常态。苹果对研发的保密级别如此之高,以至于据报道称,苹果要求新招聘的人工智能团队不得在社交媒体上公布自己的职位。蒙特利尔大学计算机科学教授Yoshua Bengio对彭博社说:“他们不可能只作为旁观者,而不融入其中借助大势。”“我相信,如果他们不改变自己的态度,他们就会落后。”

幸运的是,苹果的态度确实发生了变化,而且反应很快。2016年8月,苹果以大约2亿美元的价格收购了西雅图机器学习公司Turi,10月份又从卡内基梅隆大学聘请了人工智能专家Russ Salakhutdinov。正是Russ Salakhutdinov的影响力最终促使苹果的人工智能业务走出了阴影,进入了同行的视野。

2016年12月,在巴塞罗那举行的神经信息处理系统会议上,Salakhutdinov在宣布苹果将开始发布其研究成果时,这一消息语惊四座,Salakhutdinov如是指出,“我们可以发表吗?是的。我们是否可以与学术界接触?是的。”

当月晚些时候,苹果公司就Salakhutdinov的发言做出了良好承诺,发表了首篇人工智能论文《通过对抗网络使用模拟和非监督图像训练》(Learning from Simulated and Unsupervised Images through Adversarial Training)。该论文研究了利用模拟对象来训练机器视觉系统的不足之处。

研究结果显示,虽然模拟图像比照片更容易用于训练,但现实效果却不是很好。苹果的解决方案是采用了一种深度学习系统,即一种熟知的可生成对抗网络(GANs),通过两种神经网络相互对抗生成足够相似的图片,从而骗过第三方“鉴别”网络。通过这种方式,研究人员可以利用模拟图像轻松地训练神经网络,使其在现实中应用时也不会出现性能下降。

2017年1月,苹果加入了亚马逊、Facebook、谷歌、IBM和微软在人工智能领域的合作组织,进一步表明了其对于人工智能的态度。该行业组织旨在人工智能研究领域建立伦理、透明度和隐私准则,同时促进其成员之间的研究和合作。

接下来的一个月,苹果公司大幅扩展了其位于西雅图的人工智能办公室,在两个联合广场租下整整两层楼,雇佣了更多员工。苹果公司的机器学习主管Carlos Guestrin告诉GeekWire:“我们正在努力寻找最优秀的人才,他们要对人工智能和机器学习感到兴奋,不仅要对研究和长期思考感到兴奋,而且也将这些想法引入产品之中,能够影响和取悦我们的客户。”

到2017年3月,苹果已经在人工智能领域取得了更大进展。在旧金山举行的EmTech数字会议上,Salakhutdinov阐述了公司人工智能研究的现状,探讨了如何使用“注意力机制”到更好地描述照片的内容,以及将像Freebase和WordNet这样的知识来源与深度学习算法结合起来,让人工智能更智能、更高效。“我们怎样才能把之前的知识融入到深度学习中去呢?”Salakhutdinov说,“这是一个巨大的挑战。”

一旦苹果完成今年5月宣布的神经引擎芯片研发,这一挑战可能很快就会变得更容易。谷歌是将人工智能的计算过程转移到云端,从而让张量处理单元处理这些任务。

与此不同的是,苹果设备则在传统上将CPU和GPU加载的负载分成了两部分。该神经引擎将把人工智能进程作为一个专门的独立组件来处理,从而为另外两个芯片释放出更多有效处理能力。这不仅通过分担GPU负载节省更多电量,还会提高设备的增强现实功能,并帮助进一步提升Siri的智能水平,或许使其超过谷歌助手和亚马逊Alexa的能力。

即使没有专门人工智能芯片所能提供的额外帮助,苹果最近在这一领域的进步也令人印象深刻。

仅仅在一年中,苹果公司成功地推出了神经网络API,大幅扩展了人工智能领域的研究工作,从美国最顶尖大学挖走了美国最顶尖的人工智能领域人才,逆转了两年来的反向政策,加入了该行业组织成为一名特许成员,最后终于推出更聪明的Siri助手。明年的开发者大会肯定会更加疯狂。

本文由网易见外智能翻译平台提供翻译服务,英文来源:engadget,校对:晗冰

网易智能

网易智能(公众号 smartman163),定位人工智能等前沿科技领域的垂直媒体及产品服务平台,面向人工智能等领域的从业者和关注者。运营栏目包括大型策划栏目《AI英雄》,行业研究与分析栏目《AI研究院》等,提供原生内容、新闻策划、数据报告、产品评测等服务。
Return to Top ▲Return to Top ▲