IT思维

文章页右侧顶部广告

专访谢殿侠:别只盯着智能音箱 语音交互将重构 APP

作者 | 小羿

智能音箱终于火起来了。”

见到谢殿侠,他正坐在北京一个临时的办公室中,第一句话脱口而出。

从上海到北京,谢殿侠创立的海知智能已经历了三年的时间。作为专注中文语义理解的创业公司,海知智能体量不大,但机会风暴正在袭来。

智能音箱,在中国事儿有多大

亚马逊Echo的火热已经蔓延到了中国。在看到了语音交互的发展前景之后,中国科技企业,不管是巨头公司,还是创业机构,亦或是传统制造厂商,都开始进入智能音箱领域。

但一个悲催的事实是,智能音箱在美国已经具备了年销量千万级的市场,在中国这一数字目前不到百万。

差距为何如此之大?在谢殿侠看来,中国智能音箱市场起步速度不会很快,成熟度也不会那么高,这是因为智能音箱在中国家庭中扮演的角色远没有美国重要。

“为什么亚马逊成功了?因为Echo的美国用户多是家庭主妇,习惯于在做饭、休整庭院的时候与Echo交互。比如Echo的一个重要使用场景是厨房,美国家庭主妇一般是在做饭的时候听背景音乐。这是因为美国人的厨房大多是开放式厨房,而且他们做饭相对中国的煎炒烹炸来说显得安静。”谢殿侠分析到。

谢殿侠认为,相比之下,中国没有形成家庭主妇的社交群体,晚上又因为应酬较多不在家,而中国家庭一般没有开放式厨房,大多数的习惯是看电视。这几点原因导致中国音箱用户少,使用场景、时间段都被压缩。

“所以,即使中国厂商可以把智能音箱做得比Echo更漂亮、更便宜,内容服务也更好,但是纯粹作为单品音箱来讲,其成功的程度和速度都不及美国。”谢殿侠说到。

有业内人士认为,目前投放到智能音箱上的“热钱”都已经砸进来了,初期的市场规模一定会起来。“我认为中国智能音箱市场明年销量能达到千万台的级别”,谢殿侠认为,像小米将价格打到299元,其实是想切传统蓝牙音箱的蛋糕,如果能将这部分存量市场进行转化也是不错的。

“后面就是产能的事情了”,谢殿侠说到,“下半年如果你看到很多智能音箱降价,或者市场上出现大量一两百元的智能音箱出来的时候,都不会是令人惊奇的事情。”

“但中国智能音箱的活跃度、黏性、留存率未必有美国市场那么高。”谢殿侠补充到。

去中心化,所有家居都能说话

语音交互本身就是很大的一个入口,但是语音交互的入口是不是智能音箱?现在谁也不知道。

在谢殿侠看来,智能音箱在语音交互初期会扮演很大的作用,甚至会成为继电视、手机之后的市场量级很大的一个单品。但是,智能音箱或许不能成为中枢控制设备,去控制其他家电。未来在中国家庭中,应该是去中心化的。

在中国,相比其他家电设备,智能音箱是一个新兴的市场,而电视、冰箱、空调却是一个存量市场。“没准智能语音交互的电视会跑得更快。”谢殿侠称,“未来真正在家庭中起到重要作用的,可能还是电视,另外我还看好智能台灯、儿童故事机等。”

对于智能音箱在智能家居中的地位,谢殿侠认为,智能音箱的本质是机器人的MVP(最小可用功能体)。它可以装入各种机器人和智能家居设备中,可以具备叫起床、查星座、运势、黄历,读取百科、菜谱等诸多功能。谢殿侠说,“过去这些功能可能需要通过好几个APP来搞定,现在只需要一句话的事儿。”

“语音交互机器人是未来的发展方向,未来的语音交互将是Always On(实时在线),家庭中所有的电器都应该具备语音交互能力。”谢殿侠这样憧憬到。

升维,语音交互将重构APP

在谢殿侠看来,智能音箱等语音交互的家居产品只是下一个大时代的冰山一角。

“现在的手机APP与过去PC上的网页和软件有什么区别?主要的区别就是APP进行了升维,这个维度就是诸多的传感器、麦克风以及相机。”谢殿侠说到。

“因为有了GPS传感器,才有了滴滴、Uber、ofo这些公司;这个基础上再加上语音、麦克风,就有了微信、WhatsApp;如果再加上摄像头,就有了Instagram、美图秀秀。”谢殿侠如是说。

根据谢殿侠的观点,当APP升维之后,就产生了PC时代没有的公司和产品。未来有了语音交互之后,就又增加了一个维度,肯定会产生划时代的新产品。

“语音交互增加的是控制维度,这个控制维度并不是语音控制开关灯那么简单。“谢殿侠认为,过去的传感器只是感受,现在又增加了“控制”,将单向交互变为双向,想象力非常巨大,尤其是语义理解起来之后,未来的产品形态会发生翻天覆地的变化。

“比如你跟冰箱说,今天有点累了,它会给你推荐你喜欢吃的而特别有营养的东西。”谢殿侠称,以后所有的业务服务都会升级成skill(技能),这种skill的关键不是它能识别,是它能懂你说的事情,能够像专家一样给你推荐东西。“所以,未来所有的APP都会重构,这种重构可能是把一个单品升级为一个Skill,也可能是过去相互隔离、推崇单点极致的APP思维互相打通。”谢殿侠说到。

巨头略晚,创业稍早

“巨头跟进略晚,自己在这个领域创业稍早。”谢殿侠这样总结自己前三年的创业。

2014年,谢殿侠在美国硅谷碰到自己在北大的同学丁力,当时的谢殿侠一直在做知识管理工作,而丁力则在做语义网(也就是后来的知识图谱),并推出第一款语义搜索引擎。两人在咖啡馆聊天,谈到了当时智能硬件市场的兴起,认为万物互联的时代很快就能到来,而语义理解大展宏图的时机也不远。所以两人一拍即合,回国创业。

“我当时认为,智能硬件的生态能够打通,技术也趋于成熟,所以自己对智能硬件市场有点儿过于乐观。”谢殿侠说到。

一开始,两人开发出了一款智能日历应用,可以识别和理解时间、地点、事件。小试牛刀打通产品技术环节之后,开始按计划做基于语义理解API的开放技术平台。“这个过程中比较艰辛,开始是和机器人、智能音箱厂商合作,但是机器人产业链并没有成熟,市场销量一直很惨淡,而蓝牙音箱的厂商一般说不需要语音交互,他们认为加上手机APP就是智能音箱。”谢殿侠回忆到。

虽然笃定语音交互终将爆发,但是当时巨头公司依然没有介入,随着联网硬件的消退,海知智能也进入了最黑暗的时候。谢殿侠称,那是2016年上半年,我们遇到了很大的一个坎。当时,虽然当时海知为贤二机器僧提供了语义理解技术,在市场上获得了一些知名度,但时机仍未成熟。

“到2016年下半年,情况发生了转变,很多企业开始主动找海知合作。”谢殿侠向网易智能表示,目前海知在语音交互方面已经与海尔、小米等大厂商进行了深度合作,得以将自己储备的语义理解技术快速释放出来。

另外,海知还在to B的跑道上开始布局,从智能客服到招标采购/营销分析等企业智能化上,帮助企业降低成本、提高分析决策的能力。不过在谢殿侠看来,bot+skill平台才是他最终的梦想。

打造bot+skill平台,做语音时代的应用商店

在谢殿侠的规划中,海知智能在做知识图谱,但目的是为了打造各种各样的Skill,比如天气、音乐、影视、饮食、百科等等,把每个领域的数据信息加工通过自然语言理解技术加工成知识图谱,变成机器能够理解的语言。“海知实际上想做的是一个集合众多skill的bot生成平台,帮助移动互联网上的APP变成语音平台上的skill,生成一个个的bot。”谢殿侠说到。

在谢殿侠看来,未来的进化趋势是,APP会变成bot(聊天机器人),而APP上的内容和服务会变成Bot上的Skill。海知将搭建skill技能商店,一方面帮助有数据、内容服务的公司生成skill,另一方面将skill推送给各种各样的bot使用。

“在中国,各种各样的公司都想做自己的语音交互平台,我们作为创业公司,主要是还为大家提供技术服务。”谢殿侠称,我们一方面要吸引更多的开发者甚至是普通人来这里做skill,另一方面要将自己的skill商店导入到各家平台,比如说小米和百度的语音交互平台。据谢殿侠透露,小米智能音箱目前已经配备了海知智能提供的17个skill,后者目前也在参与小米的水滴开放平台。

“一方面我们练好内功,完善我们的bot+skill的工具,让非工程师和开发人员也能使用,将海知的数据整合能力、知识图谱构建、机器学习训练开放出来;另一方面帮助开发者做skill,并且对接给第三方语音平台,为他们导入用户和流量。”谢殿侠准备用这样方式来吸引开发者。

据透露,目前海知的skill开发平台还处于内测阶段,官方的技能插件已经有50多个,还有一小批合作伙伴开发的技能。谢殿侠向网易智能透露,海知的skill平台将在9月底正式对外开放。未来一年,海知这个开放平台开放接入国内外主要bot开放平台,而在海知平台上的技能数量能够突破1万个。

在笔者看来,谢殿侠的规划是让海知成为语音交互时代初期的第三方技能商店,一如智能手机发展初期的苹果应用商店一样。谢殿侠的理由是,语音交互时代初期市场太分散,平台的技能数量整体偏少,和用户开口说话所需要的技能相比缺口巨大,更多的应该是合作而不仅仅是竞争。

“也许三五年之后,平台才会集中,竞争有可能大于合作。”谢殿侠说到。

网易智能

网易智能(公众号 smartman163),定位人工智能等前沿科技领域的垂直媒体及产品服务平台,面向人工智能等领域的从业者和关注者。运营栏目包括大型策划栏目《AI英雄》,行业研究与分析栏目《AI研究院》等,提供原生内容、新闻策划、数据报告、产品评测等服务。
Return to Top ▲Return to Top ▲