IT思维

文章页右侧顶部广告

Peter Lee:AI 就像印刷术 它将是人类转折点

彼得·李(Peter Lee),他是一名计算机科学家,现任微软研究院副总裁,他领导微软的新体验和技术组织(NExT),最终目标是创造以研究为驱动的技术和产品,通过研究提高人类的知识水平,在就职于微软之前,彼得·李在政府和学术界均从事相关工作,曾任职于美国国防部高级研究计划局时,他创立了一个专攻计算和相关领域研发项目的部门。

这次,他和我们共同探讨有关人工智能的话题,包括智能的定义、维恩图、转移学习、图像识别和微软小冰等。

何为人工智能?它有没有标准的定义?

【问】:我喜欢从一个看似简单的问题开始,但这种问题其实并没有那么简单,什么是人工智能?

【彼得】:这根本不是一个简单的问题,我想一个简单直接的答案是,人工智能是智能机器科学或对智能机器的研究,而且,我意识到这是一个循环定义,我想你能明白,这是最基本的难题,因为这个定义有一个问题:什么是智能?我认为人们有很多不同的方式去思考什么是智能,但是,在我们的世界里,智能是“我们如何去计算以怎样的方式在这个世界上设定并实现目标。”从根本上说,这就是我们现在在人工智能领域所追求的。

【问】:这真的很吸引人,因为你是对的,对于智能,生活,或者死亡,从来没有一致的定义。所以,我会问这样一个问题:为什么你认为我们很难定义智能?

【彼得】:我认为我们只有一种智能模型,这是我们自己的模型,所以当你想要定义智能时,它其实是一个如何定义我们自己的问题。这从根本上来说就很困难。这种基本的循环定义本身也很困难。如果我们能在星际飞船中飞离目的地,找到一种不同的智能模式,或者我们认为是拥有智能的不同物种,也许我们会有机会冷静地研究这个问题,然后得出一些结论。但当你看到这样一种需要人们自省的事物时,事情就会很困难。

当你进入计算机科学研究领域时,至少在微软研究院,你必须找到专注于具体问题的方法;因此,我们最终把研究方向集中在四个大类中的人工智能上,粗略地说,集中在人工智能的技术开发上,我认为这些分类的研究要更容易一些。第一种是感知——就是赋予机器看和听的能力,就像我们一样。第二种是学习——如何让机器利用经验让自己变得更好?第三种是推理——你如何进行推理、逻辑推理、对世界用常识推理?第四种是语言——我们如何让机器在与他人和我们互动时通过语言进行交流?这四个方面——感知、学习、推理和语言——它们并没有定义什么是智能,但它们至少给了我们一些明确的目标和方向。

【问】:好吧,我不会太纠结于这些细枝末节,但我认为这真的很有趣,在什么意义上,你认为才是人工智能?因为机器要么拥有人工智能,只是由机械制造,或者说只是我们对它的一种简单称呼——或者说机器拥有人工智能,但这种智能不是真正的智能。你使用的是像“看”,“听和理性”这样的词。你是否在使用这些词语委婉地表达,计算机真的能看到或听到任何东西,或者它能推理?还是说你只是在字面意义上表达它们的能力?

【彼得】:你抓住了问题的重点,因为我们真的也不知道。如果你要画维恩图,你要先画一个大圆圈,叫智能,现在你想给人工智能画一个圆圈。我们不知道这个圆圈是否与智能的圆圈相同,二者是分离还是重叠,又或者人工智能是否是智能的一个子集。这些是我们讨论的基本问题,人们对这些问题有不同的看法,但我们无法给出答案。然后便是一些实际发生的事情,这些事情让我们兴奋,我们把一些想法付诸实践,让它们成为了现实。其中大部分都是这些宏大想法的小小一部分;只要专注于机器学习,还有从大量的数据中学习,这些模型实际上就能够完成一些有用的任务,比如识别图像。

人工智能就像中世纪的印刷术 将成人类转折点

【问】:没错,我当然想在一分钟内深入探讨这个问题,但我很好奇,那么,关于人工智能有很多不同的观点。我们应该害怕人工智能吗?还是我们应该热爱人工智能?它会带领我们进入一个新的黄金时代吗?它真的会这样做吗?它会受到限制吗?通用人工智能有可能吗?

【彼得】:我认为关于这个问题有很多争论,因为这个问题非常重要。每种技术都是一把双刃剑。每一种技术既能用于好的方面,也能用于不好方面,所带来的结果也同样有着好坏之分。通常来说,计算机技术的有趣之处在于,特别是在人工智能这一强大的概念上,与其他强大的技术相比,比如说在生物科学、核工程、交通等领域,人工智能有潜力实现高度民主化,并将其内置到工具和技术当中,从而让地球上的每个人都能接触到这些技术。所以,这个问题变得极为重要:当智能机器的力量对于世界上每个人来说都触手可及之时,会发生什么样的结果?会有什么样的可能性?正因为如此,你所问的所有问题都成了大问题,也是对我们来说非常重要的问题。人们关心这些未来的事情,但我不得不说,就现在看来,在科学知识方面我们还尚未清楚。

我有时会用类比的方式来谈论,在中世纪时期,有人发明了大规模生产的活字印刷术,以及第一台印刷机。在短短15年的时间里,他们将整个欧洲的3万册书籍,印刷出了大约30万本。这是第一个技术方面的摩尔定律(Moore’s Law)。知识的传播,为人类做出了惊人的贡献。印刷术确实使普通人能够接触到书籍,接触到知识,但它在当时也是非常具有破坏性的,而且一直以来都是如此。

在某种程度上,我们看到人工智能的潜力与印刷术是非常相似的,它甚至可能是人类历史上更大的转折点。所以,虽然我不能对你所问的关于人工智能的局限性和智能的本质给出确切的答案,但这个问题确实很重要;我认为人们问这些问题并且正在对此认真思考是件好事。

【问】:如果我们在宇宙中所知道的唯一拥有智慧、拥有通用智能的物质是我们的大脑,你认为功能可以被机械地复制这个问题是一个已经解决的问题吗?

【彼得】:恰恰相反的是,并没有证据证明这一点。我们在大脑中以任何一种方式来看自己的行为中,都能看到机械系统的影子。所以,原则上,如果我们对我们自己的大脑的机械系统是如何运作的有足够的了解,那么我们就应该能够,在最低程度上复制那种系统。现在来说,当然,就那种技术的发展方式来看,我们倾向于以不同的方式制造东西,所以我认为,我们最终建立的智能机器很有可能与我们自己的智能不一样。但没有证据表明,至少到目前为止,这与我们可以用机械的方式复制智能的论点是相悖的。

【问】:所以,有时也要反过来思考一下。有人可能会说,完全没有证据表明我们可以论证这一点,原因如下。第一,我们不知道大脑是如何工作的。我们不知道思想是如何被编码的。我们不知道如何读取思想。除此之外,我们不知道大脑是如何运作的。我们不知道这一切究竟是如何实现的。我们拥有的能力似乎超出了大脑中一大块灰质所能赋予我们的能力——我们有创造力,我们有幽默感,还有其他所有的能力。我们拥有意识,我们甚至没有一门科学语言来理解意识是如何产生的。我们甚至不知道如何去问这个问题,或者从科学角度来寻找答案。所以,其他人可能会看着它说,“没有任何理由相信我们可以机械地复制智能。”

【彼得】:我要在此引用一句话,来自于一个非技术专家塞缪尔·戈尔德温,这位过去的电影大亨。当我陷入困境时,就像现在,我总是能想起这句话,“这绝对不可能,但仍不能放弃”,我们目前的理解是,大脑本质上是封闭的系统,所以我们学得越来越多。事实上,我们所学习到的东西轻松地启迪了我们在人工智能系统中所做的一些事情,并取得了进步。进步有多大?就像你说的,并不清楚进步有多大,因为还有很多的秘密,但看起来的确有很多的可能性。

什么时候迁移学习会被普遍的适用?

【问】:为什么你认为人工智能非常困难?因为人类获得智能似乎很简单,对吧?你把小孩子放在幼儿园,你给他们展示一些红色的东西,然后你给他们展示数字“3”,然后他们就会一下子明白三个红色的东西是什么意思。我的意思是,我们会自然地变得聪明起来,然而我经常打电话给我的常客计划系统,当我告诉它我的电话号码时,它很多时候就无法明白。你为什么觉得这么难?

【彼得】:你说的是真的,尽管你花了很多年才想到这一点。即使是一个能做到你刚才所说事情的孩子也需要有多年的生活才能想到这一点。至少在今天,我们有所期待之时,尤其是在智能机器的商业领域,有时会有一点耐心。但话虽如此,我认为你说的是对的。

我之前提到过维恩图,所以,有一个大的圆圈,那就是智能,我们假设其中有很大一部分是人工智能。然后你把它放大,就这样,人工智能泡泡里面的一个小气泡就是机器学习,这只是机器利用经验变得更好。然后,这个小气泡里的一个小气泡是机器学习数据,这些数据中可提取出模型,将已经学过的东西整理出来,这些模型都是分析大量数据后提取出来的。这就是我们今天所处的位置,在这个大泡泡中的小泡泡里面的小泡泡里,我们称之为人工智能。

值得注意的是,不论我们的理解有多么狭隘,大多数令人兴奋的进步都源于这个小小的、狭隘的用数据进行机器学习的概念中,而且在这个小泡泡里还有一个更小的泡泡,我们称之为一种监督的方式。即便这么小,我们也从中看到了巨大的力量,一种巨大的能创造出新的计算系统的能力,而这些系统能做出一些令人印象深刻且具有价值的事情。对于微软这样的公司来说,这样的价值无法估量。与此同时,我们对智能的了解又是如此之少。

举个简单的例子,比如你提到的一次性学习,你可以向一个小孩展示一辆消防车的卡通图片,如果那个孩子此前在她的生活中没见过消防车,你可以带她到大街上,而一旦在她面前行驶而过第一辆真正的消防车,孩子马上就会认出。你是说得对,我们现有的系统并不擅长这种一次性学习。

虽然我们对利用数据进行机器学习取得的进步感到非常兴奋,但有关智能的一些东西对我们来说仍然很神秘,而且我们对此所了解的相当有限。有时候,当这一点很重要的时候,我们的限制就会阻碍我们的发展,这就产生了一个想法,那就是人工智能的发展仍然非常困难。

【问】:你说的是学习迁移。你会说那个小女孩可以完成一次性学习原因是,她下一次看到了一幅画着香蕉的画,然后马上就看到了一根香蕉?然后下一次,她看到了一幅画着猫的画和一只猫。所以,这并不是一次性学习。

你认为学习迁移对人类有什么作用?因为这似乎是我们非常擅长的事情。我们可以把我们在一个地方学到的东西转移到另一个地方。你知道,如果有人跟我说,“找到自由女神像被涂上了花生酱的那幅画”,我可以把这幅画我挑出来,因为从来没见过涂上了像花生酱或者其他东西的自由女神像。

你认为这是一个我们还不知道怎么完成的简单诀窍吗?这就是你设想的人工智能的未来发展目标?就像是突然灵机一动,你发现了基本思想。或者你认为这是一百个小窍门,并且在我们脑海里的学习迁移只是一些喝醉了的程序员在截止日期之前写的意大利面条毫无头绪的代码对吧?你觉得那是什么?这是一件简单的事情,还是一及其复杂的事情?

事实证明,对于微软来说,迁移学习是一件非常有趣的事情,既有研发价值也具有商业价值,也是发展公司业务的支柱。有趣的是,什么时候迁移学习会更普遍适用,而不是不切实际?

【彼得】:例如,在我们的语音处理系统中,也就是微软提供的实际的商业语音处理系统,我们经常使用迁移学习。当我们训练我们的语音系统来理解英语,然后我们训练这些相同的系统来理解葡萄牙语,或者汉语,或者意大利语,在此过程中。我们得到了学习迁移的效果,对语音系统理解第二种,第三种,第四种语言的训练需要更少的数据和更少的计算能力。与此同时,我们添加的每一个后续语言都提高了系统理解早期添加语言的能力。因此,训练基于英语语言的系统去理解葡萄牙语实际上提高了我们的英语语音系统的性能,所以这里有学习迁移的效果。

在我们的图像识别任务中,有一个叫做“ImageNet”的计算机视觉识别挑战赛,我们参加了很多年,我们上一次参加比赛是在两年前,也就是2015年。有五个方面图像处理分类的竞赛。我们训练我们的系统在第一类中做得很好,尤其是在基本的图像分类方面。然后我们使用学习迁移的方式不仅赢得了第一类别的胜利,还有所有其他四类的竞赛。因此,没有任何进一步的专业培训,就会产生一种学习迁移效应。

实际上,学习迁移似乎确实发生了。在我们的深层神经网络中,存在着深度学习研究活动,学习迁移效果。当我们看到这些时,真的令人陶醉。它会让你思考我们作为人类所做的事情。

与此同时,这似乎是一件不现实的事情。我们并不一定了解这种学习迁移效果何时有效、如何有效。对该方面研究所得出的早期证据是,有不同形式的学习,而且,即使是很小的孩子也擅长一次性学习,这似乎已经超出了我们目前正在研究的深层神经网络系统的范围。即使是你已经表达了学习迁移的直观想法,我们看到,在某些情况下,它也能很好地发挥作用,对我们来说甚至能产生商业价值,但我们也看到了简单的学习迁移任务,这些任务中的系统似乎都失败了。所以,即使是这些事情现在对我们来说也很神秘。

【问】:我没有任何证据来支持这一点,但似乎就我的直觉看来,你所描述的并不是纯粹的学习迁移,而是你所说的“我们建立了一个非常擅长翻译语言的系统,它可以在很多不同的语言中使用。”

在我看来,学习迁移的精髓便在于你把它带到不同的学科之时,例如,“因为我学会了第二语言,所以我现在是一个更优秀的艺术家。因为我学会了第二语言,我现在是一个更厉害的厨师了。”我们借用某一门学科当中的知识,增加了我们知识的丰富性和深度,而这样的一种方式对我们的人际关系产生了深远的影响。

有一天我在和一个人聊天,他说学习第二语言是他做过的最有价值的事,他使用第二语言的个性和他使用英语时是不一样的。我知道你在说什么,我认为这些都促使我们朝正确方向发展。但我想知道,它的核心是否是多维度的,是否类似于人类的行为,这就是为什么我们可以进行一次性学习,因为我们所做的事情与现实生活中的东西所画成的卡通画毫无关系。你对此有什么回应吗?

【彼得】:至少在我们目前对研究领域的理解中,有一件事是,学习和推理是有区别的。我喜欢的举的一个例子是,我们在语言理解方面做了很多工作,特别是在机器阅读方面,你想要能够阅读文本,然后回答关于文本的问题。你测试机器阅读能力的一个典型场合是SAT考试口试环节当中的部分。SAT考试的好处是你可以试着回答问题,你可以通过考试获得的分数来衡量进步。这种情况正在稳步改善,不仅是在微软的研究领域,而且还在相当多的大学研究领域和中心。

现在,把同样的系统用在三年级的加州成绩测验上,智能系统就不起作用了。如果你看一看三年级学生的学习能力,有一种常识性的推理能力似乎超出了我们在机器学习系统中的努力范围。所以,举个例子,你会在三年级的成绩测试中得到一个问题,也许是四幅卡通画:草地上有一个球,一些雨滴,一把伞,还有一只小狗,你必须知道如何给这四幅画配对。三年级学应该能够从正确的生活经历中找到正确的逻辑推理,正确的常识推理,将两两组合在一起,但我们实际上并没有可靠的人工智能系统能够做到这一点。这种常识性的推理似乎是,至少在今天,就现在的科学和技术知识的现状,超出了机器学习的领域。这不是我们认为机器学习最终会学会的东西。

这种区别对我们很重要,甚至在商业上也是如此。今天我在看一封电子邮件,微软的某个人让我准备今天和你谈谈。电子邮件上说,就在我正前方,“这是明天早上播客的简报。如果你今晚想复习的话,我明天就给你打印出来。”目前,该系统已经强调了“今晚想要回顾”的内容,以及它强调的原因是,它在某种程度上做出了合乎逻辑的常识性推论,那就是我可能想要在日程表上设置,提醒自己查看简报文件。但值得注意的是,它成功做到了这一点,因为它还提到了明天早上和今晚。所以,做这些常识性的推断,做那种推理,仍然是非常困难的,而且还需要很多聪明的研究人员做出大量的努力来实现。

【问】:这很有趣,因为你说,你只有一行代码,解答三年级的测试问题不是机器学习的任务,那我们怎么解决这个问题呢?或者换句话说,我经常问这些图灵测试系统,“哪个更大,一个五分镍币还是太阳?”没有一个人能回答这个问题。因为“太阳”和“五分镍币”的这两个词也许都有意义不明确。

不论如何,如果我们不使用机器学习技术,我们如何达到三年级的水平呢?或者我们甚至不用担心三年级的难度,因为我们在生活中遇到的大多数问题都不是三年级的难度,而是我们真正想让机器解答的是12年级难度的问题。我们希望他们能够翻译出不匹配小狗图片的文件。

微软小冰可以做什么?它现在到底有多智能?

【彼得】:当然,如果你看看像微软这样的公司以及整个科技行业正在做什么,我认为,至少在10年的时间里,我们都能看到机器学习给全世界人们带来的巨大价值。机器学习有着巨大的可能性,所以我认为我们将会非常专注于机器学习,这至关重要。它将让人们的生活变得更好,它将为微软等公司提供大量的商业机会。但这并不意味着利用常识进行推理不再重要。几乎所有你想要帮助进行的任务,即便是一些简单的事情,比如规划旅旅程,购物,或者更大的事情,比如得到医疗建议,关于你自己教育方面的建议,这些任务几乎永远涉及到一些你所谓的常识推理的元素,会得出一些不太常见的推论,这些推论对你来说非常特殊和具体,也许是以前从未见过的推论。

现在,话虽如此,在科学界中,在我们的研究中,在我们的研究人员中,存在着很多争论,有关于可以通过机器学习来获取何种程度上的推理能力,还有关于机器通过观察人类行为足够长时间所能从中学习并获取的能力大小。但是,至少对我来说,我看到的是,有一种不同的科学,如果我们想要获得那种常识性的推理,我们确实需要进一步开发。

为了让你们了解这场辩论,我们一直在做的一件事,也是中国正在进行的一项实验,那就是,我们在中国有了一种新型的聊天机器人技术,它有一个人名,叫微软小冰。微软小冰是活跃在中国社交媒体上的一个人物角色,拥有数千万的粉丝。

通常,当我们思考美国市场上的聊天机器人和智能代理时,比如微软小娜、Siri、谷歌助理或Alexa,我们尤为强调语义理解;我们真的想让聊天机器人在语义层面上理解你所说的话。对于微软小冰,我们进行了一项不同的实验,我们并没有试图植入高程度的语义理解能力,而是研究了人们在社交媒体上的言论,我们使用自然语言处理来挑选出语句响应对,并将它们放入一个大数据库当中。所以现在,如果你在中国对微软小冰说些什么,小冰就像其他人回应这样的话语那样回应你。也许它会根据其他人的行为给出一百种可能的回答,然后我们用机器学习来对可能的反应进行排序,试图优化谈话的乐趣和参与度,从而优化对话参与者继续对话的可能性。随着时间的推移,小冰在这方面变得非常有效。事实上,对于那些每天与小冰进行互动的20万人来说,每个人与小冰的对话已经超过了二十三次。

值得注意的是,有关人工智能中什么是重要的,以及什么是智能的重要方面,引起这些争论的原因在于,小冰的核心部分根本不了解你在说什么。在某种程度上,它非常聪明地模仿别人在成功的对话中的言谈。这就提出了一个问题,当我们谈论机器和仿佛拥有智能的机器时,什么才是真正重要的呢?这真的纯粹是一个机械的、句法的系统,就像我们在做小冰的实验一样,或者是我们想要使用诸如微软小娜这样的工具将我们对世界的语义理解、以及这种语义理解的运行方式和我们所采用的方式进行编码。

这些都是人工智能领域的一些根本争论。至少我在微软的日常工作中,有一点很酷,那就是我们不仅能够,并且也允许,在这些事情上做基础研究,还可以建立和部署非常大型的实验,看看会发生什么,并从中学习。这很酷。与此同时,我不能说这已经告诉了我答案是什么。还没有。这只是让我有了很棒的体验,我们分享了我们在世界上所学到的东西,但要确切地说这些东西意味着什么,要难得多。

【问】:1950年,阿兰图灵曾说过:“机器能思考吗?”那仍然是许多人无法达成一致意见的问题,因为他们不一定就条文达成一致。但你说的没错,聊天机器人在理论上可以通过图灵测试。在第二十三次谈话时,如果你不告诉别人这是一个聊天机器人,它有可能通过图灵测试。

但你是对的,虽然让人或多或少不满意,但微软小冰也还算是一个巨大的里程碑。因为如果你把它看成是一位慢吞吞的用户,你问了一个问题,然后它先进行查询,接着抽出上百个答案,再对这些答案进行等级排序,然后看看有多少能成功地继续对话或者是得到竖大拇指或者笑脸表情作为回复,最后给你一个答案……这就是微软小冰的运作方式,一旦你对此了解,它就不那么有趣了。

【彼得】:这是真的。至于要在使用小冰聊天机器人的帮助下实现目标,或者完成任务,在某些情况下,微软小冰确实能给予极大帮助。如果有人说,“我在市场上买了一款新的智能手机,我想要的是更大的平板手机,但我还是希望它能装进我的钱包里。”小冰能出奇有效地告诉你这个问题的答案,因为这个问题是很多人在购买新手机时都在谈论的。

但与此同时,小冰可能不太擅长帮助你决定住在哪家酒店,或者帮助你安排下一个假期计划。它或许能提供一些指导,但也许并不完全是深思熟虑后的正确指导。还有一件事要说的是,今天,至少在我们谈论的规模和实用性上来说,在很大程度上,我们是在从数据中学习,而这些数据本质上是来源于人类思想和活动的数字产出。还有另一种观点,小冰虽然通过了图灵测试,但它在某种程度上还是受到了人类智能的限制,因为它所能做的几乎每件事都是通过别人的行为来观察和学习。我们不能低估未来系统的可能性,届时,这些系统对数据依赖程度较低,能够理解世界的结构还有一些问题,并从中学习。

我注意到,我从来没有回答过这个问题。我从来没有给出答案,所以它还是无法回答。

【问】:我们应该在某个时候试试这个实验。

【彼得】:你为什么认为我们赋予了这些人工智能人的特性?我想,你知道魏岑鲍姆(Weizenbaum)和伊丽莎,还有所有相关的人和物。当人们与一个谎言产生亲密关系时,他感到非常不安,因为他知道这是一个聊天机器人。他非常担心人们会向机器倾吐心声,他说,当机器说“我明白”时,这只是一个谎言。机器人从来都没有自我认知,也理解不了任何事情。你是否认为这会混淆人与人之间的关系,而且我们现在还不了解这些技术的拟人化会给我们带来的意想不到的后果?

我总是责怪自己,因为我喜欢将机器学习和人工智能系统拟人化,但我并不是唯一这样做的人。即使是最有经验、最实干的研究人员和科学家也同样如此。我认为这是人类真正的核心所在。我们拥有的最基本的魅力,以及推动人类繁衍的动力,都成为了我们创造拥有自主智慧生物的重要原因。这不仅仅是人工智能,而是回到了弗兰肯斯坦式的故事中,这些故事以不同的情节出现,并以不同的形式贯穿整个人类历史之中。

我认为我们只是有一个巨大的动力去建造机器,或者其他的物体和生物,它们以某种方式捕获和编码,这也因此说明,人类意味着什么。没有什么能够定义,什么样的特征才更符合人类而不是同样适用于描述某种人类智能的编码,尤其是能实现自动化、自我决定、自我选择向前发展的人类智能。这是我们所有人最原始的特征。即使在人工智能研究中,我们也在努力训练自己,并且也限制自己不要创造太多与生物系统毫无根据的联系,但我们总是难以停止使用生物智能的语言。甚至是我在谈话开始时提到的四个类别:感知、学习、推理、语言,这些都是由生物启发的词汇。我只是觉得这是人性中很重要的一部分。

正如我们之前讨论过的,每种技术都是一把双刃剑,在十年前,“技术很好,越多越好”这一理念或多或少成为了当时的一种风气。我认为现在有了更多的启迪。我认为,我们不能推动科技发展的进步,但重要的是,至少作为一个社会,我们真的在努力思考,思考潜在的好坏的可能性。我认为这给了我们更好的机会,让我们获益更大。

我们谈了谈关于人工智能导致人类失业的问题!

【问】:关于自动化对就业的影响,以及这些技术对于地球的影响,人们有很多实际的担忧。关于这一切将如何展开,你有什么看法吗?

【彼得】:当然,我认为很有可能会严重干扰世界的运行方式。我提到了印刷机,印刷术,活字印刷术,这些都产生了难以想象的破坏。当你在五十多年的时间里便能看见图书和印刷机的传播数量翻了九番中的时候,那是真正的中世纪摩尔定律。如果你想想,那种破坏性的影响在16世纪早期时,你就会发现,教育孩子的全部意义,突然都是为了确保他们能够阅读和写作。这是一项需要花费很多费用并经过多年的正规培训才能习得的技能,这种技能会产生巨大的影响。因此,尽管对世界和社会的总体影响是积极的,实际上,印刷机为启蒙运动和文艺复兴奠定了基础。它对于人们在世界上取得成功的有着绝对的颠覆性影响。

我敢肯定,人工智能将会产生同样的颠覆性的影响,因为它具有和图书传播一样的民主化力量。因此,对于我们来说,我们一直在努力专注于,“我们能做些什么,让人工智能掌握在人们的手中,真正赋予他们力量,并增强他们的能力?人工智能技术能让人们在生活中取得更大的成功吗?”我认为,我们的研究实验室和我们的公司所专注的问题,是非常重要的,因为这需要我们能够接触到的很多搞发明创新的天才去试图将行业发展指向正确的方向。

【问】:跟我谈谈你现在正在做的一些有趣的工作。从医疗保健方面开始,你能告诉我们什么?

【彼得】:医疗保健是非常有趣的。我想可能有三个方面让我很兴奋。一个是基本的生命科学,通过机器学习、大规模机器和数据分析,我们可以看到一些令人惊讶的机会和见解。这些数据是通过基因测序,以及我们测量大脑信号的能力,以更低的成本生产出来的。有趣的是,在其他领域,如果你把伟大的创新研究人才和机器学习专家与数据和计算基础设施结合在一起,你就会得到意想不到的创新成果。现在,在医疗保健领域,我们刚刚达到这样一个阶段:我们能够以这样一种方式来安排世界,让我们能够将非常有趣的健康数据送到这些创新者手中,而基因组学便是其中一个非常有趣的领域。

然后,这有一个基本的问题:“医生和护士的日常生活又会有什么变化?”据很多最近的研究显示,如今,医生们平均每天要花108分钟的时间,把健康数据输入到电子健康记录系统中。尽管这非常重要,因为它成功地将人们的健康史数字化了,但这对那些医生来说是一个巨大的负担。但我们现在看到的是,智能机器能够观察和倾听医生和病人之间的对话,并极大地减轻医生在数据记录方面的负担。因此,医生们可以不再做办公室文员和数据记录员的工作,而是开始更多地与病人接触。

第三个领域让我很兴奋,但可能有点让人喜欢不起来,它决定了我们如何创建一个系统,如何创建一个云端,让更多的数据向更多的创新者开放,那些真正想要改变健康状况的大学的优秀研究人员,还有创业公司的伟大创新者们,可以给他们提供一个平台和云端,让他们能够接触到大量有价值的数据,这样他们就可以创新,创造出能做巨大成就的模型。

这三件事真的让我很兴奋,因为我认为这三者的结合能够真正地让医生、护士和其他临床医生的生活变得更好;能够真正地带来新的诊断方法和治疗技术,释放出伟大的天才和创新者的潜力。退一步说,这实际上相当于创建了一个系统,允许创新者、数据和计算基础设施在一个地方聚集在一起,然后你要相信,当你这样做的时候,伟大的事情就会发生。医疗保健只是一个巨大的机会领域,我对此非常有激情。

【问】:我们会达到这样的程度,就是你可以通过智能手机拥有世界上最好的医生,最好的心理学家,最好的理疗师,以及最好的一切,对吧?并且全部都是免费的。我想,如果你有无穷无尽的时间和耐心去寻找,互联网总会提供一些抽象的信息。而人工智能的前景,也是你正做的是,就是你所说的学习和推理之间的区别,人工智能未来要弥补这一差距。所以,请给我描绘一下你的想法,就像在医疗保健领域一样,明天的世界会是什么样子。是什么让你兴奋?

【彼得】:实际上,我并不认为医疗保健从本质上讲是人与人之间的活动。这是非常重要的。事实上,我预测,医疗保健在很大程度上仍将是一种地方性的活动,你将从根本上与你所在地区的另一个人取得联系。这其中有很多原因,但在医疗保健方面,有一些非常私人的东西,最终还是要建立在人际关系的基础上。我认为,未来的人工智能将减轻医疗领域工作者们,如医生、护士、管理人员等等,那些毫无意义的、平凡的负担,从而提供个人服务。

因此,举例来说,我们已经在一些医疗机构使用我们的聊天机器人技术进行了试验。这款聊天机器人技术能够满足用户的需求,在与患者的对话中,回答一些日常生活中常见的一些健康问题。它可以使用教科书上记录的疾病特征完成普通的分诊,然后,在完成所有这些之后,智能连接到本地的医疗服务提供者,对医疗保健提供者进行有效的总结,然后真正地让医疗服务提供者充分发挥其创造性的潜力和注意力,使其得到充分利用。

下周我们将在一个大型的放射学会议上向全世界展示的另一件事是利用计算机视觉和机器学习来学习放射科医生的习惯和技巧,他们正在做放射治疗计划。现在,放射治疗计划需要在放射图上一个像素点一个像素点进行点击,这是非常重要的步骤;它对精确度要求高,但也有一定的艺术性。每个优秀的放射科医生都有他或她的不同的方法来解决这个问题。所以,今天机器学习基本计算机视觉的一个好处是,你可以观察和了解放射科医生的工作,他们的做法,然后以不可思议的速度减轻许多日常的工作量,这样一来,我们就可以把这些非创造性的方面自动化,让放射科医生花上15分钟,甚至半个小时来真正思考放射学的创造性。因此,它更像是一种赋权模式,而不是取代那些医疗工作者。它仍然依赖于人类的直觉,还有人类的创造力,但它会通过完成一些平凡的、耗时的工作来让人类更多地利用自己的这种直觉,这种创造力。

我认为这些方法非常人性化,不仅让医疗工作者更有效率,而且让他们在每天的工作中更快乐、更满足。用人工智能来解锁人类的创造力,这是我觉得非常重要的东西。不仅仅是在微软的我们这样思考,我看到了一些非常有启发意义的工作,尤其是我们的一些在学术领域的合作者。我发现,看到什么是可能的,真的很鼓舞人心。基本上,我在反驳这样一种观点,即我们将能够取代医生,取代护士。我不认为那是我们想要的世界,我甚至不知道这是正确的想法。我不认为这必然会带来更好的医疗保健。

我认为可以接触到更多的医疗资源的确很好。即使有一些我们正在试验的健康聊天机器人的试点部署,你也可以看到它的潜力。如果人们生活在他们有访问机器人权限的地方,那么可以向聊天机器人发送消息,这是一件令人惊奇的事情,而且它还能随时准备好倾听,并回答你的问题。当然,这类事情意义重大。与此同时,真正的回报是,当这样的技术让医疗保健工作者,那些真正伟大的医生和临床医生清楚明白,他们的创造性潜能可以服务到更多的人,因此,医患两端都能从中受益。你既可以通过自动化获得即时访问,也可以通过扩大和提高诊所和临床医生处理的患者数量来获得成功。在这方面,这是一个双赢的局面。

【问】:听起来你对未来很乐观,你认为这一技术整体上是一股强大的力量,还是只对你来说是这样?

【彼得】:我想我们对此考虑了很多。我想说的是,在我自己的职业生涯中,我必须同时面对好与坏的结果,既有科技带来的积极影响,也会有意想不到的结果。

技术有双刃剑的特性,因此,毫无疑问,我们试图将这种想法带入我们在微软研究院的每一个研究项目中,这促使我们更好的参与其中,比如人工智能的合作涉及到大量的行业和学术参与者,因为我们希望让技术、行业和研究领域变得更加深思熟虑,并对这些想法有所启发。所以,是的,我们很乐观。我对未来持乐观态度,但我认为乐观主义是建立在良好的现实基础上的,如果我们不采取积极主动的措施来获得启发,不管是好的还是坏的可能性,好的还是坏的结果,那么好的事情不会从天而降。所以,这是我们现在正在努力做的事情,我想说的是,这是我们工作的底线。这是我们赢来的的乐观心态。

选自:薛雅芹

编译:网易见外编译机器人

审校:小小

网易智能

网易智能(公众号 smartman163),定位人工智能等前沿科技领域的垂直媒体及产品服务平台,面向人工智能等领域的从业者和关注者。运营栏目包括大型策划栏目《AI英雄》,行业研究与分析栏目《AI研究院》等,提供原生内容、新闻策划、数据报告、产品评测等服务。
Return to Top ▲Return to Top ▲