IT思维

文章页右侧顶部广告

小米AI这一年

2020-11-12 14:05:48 0 企业思维 | , ,

公众号/AI前线

作者 | 刘燕

“手机×AIoT”双引擎战略下,小米 AI 提速。

明年再扩招 5000 名工程师,小米加速储备人才

小米在招揽人才上再使出 “大招”。

近日,雷军在小米 2020 年小米开发者大会上宣布,小米在 2021 年将在十大领域扩招 5000 名工程师,占小米目前员工总数的 20% 以上。

“人才是创新之源,提升技术实力的第一步,就是聚拢最顶尖的人才”,雷军表示,小米目标创造最好的工作环境,以激发工程师的创造力和创新力。“未来十年,我的愿望之一就是,要继续努力将小米打造成工程师们向往的圣地”。

小米在招人上一直不遗余力。雷军以相机技术部门举例,2018 年相机部成立时工程师只有 122 人,目前相机部工程师已达 826 人,增长了近 6 倍,这还不包括 AI 实验室为相机提供技术支持的 350 多位工程师。小米相机研发中心的选址也主要以人才聚集地作为主要考虑因素。目前,小米已在北京、巴黎、东京、圣地亚哥等城市设立了九地研发中心,共设立 5 个国际研发中心。

今年受到疫情”黑天鹅”影响,不少互联网公司减少或者关闭招聘编制。但小米启动了创业以来规模最大的校园招聘。2020 年,小米共入职了 2252 名大学生,其中研究生学历达 1470 人。

这两年,小米 AI 引入了不少学术界、业界的重量级人才。2018 年 8 月,中科院研究员王斌博士加盟小米,出任小米 NLP 首席科学家,负责自然语言处理基础平台的构建及前沿技术的探索与创新。2019 年 2 月,小米进行组织架构调整,王斌被任命为人工智能部 AI 实验室主任,负责推动 AI 技术的预研和落地。同年 11 月,语音识别大牛 Kaldi 之父 Daniel Povey 博士加入小米,出任小米语音首席科学家,将负责开发下一代 Kaldi 。

上周,根据全球三大知名调研机构的数据,小米在全球智能手机市场的份额重回世界第三。这是继小米在 2014 年后再次回归全球第三。雷军认为,这次回归是 6 年来积极补课、夯实基础的结果,也反映了小米过硬的技术实力。

雷军提到,今年小米今年研发投入将超过 100 亿元,研发投入在科创板所有上市公司研发成本总和的一半,在所有上市和未上市的高科技公司中,也能进入前 20。他表示,小米未来还会继续死磕硬核科技。小米还将在相机、屏幕、充电、IoT、智能制造等多个领域继续加强研发投入。

手机×AIoT战略下,小爱同学 5.0 版本 5 大升级

小米集团副总裁、技术委主席崔宝秋博士在开发者大会上发布了四大新技术:小爱同学 5.0 升级;新一代 Kaldi;物联网软件平台 Xiaomi Vela;开放三大系统影像能力,包括手机影像能力向第三方 APP 开放,手机影像处理能力为 IoT 设备赋能,复眼分布式相机开放协议。

小爱同学 5.0 将产品定位从语音助手升级为智能生活助手,这一变化是顺应小米战略升级做出的。今年 8 月,小米公布了新战略 — “手机×AIoT”战略来构建智能生活。为配合该战略,小爱同学进行了相应的升级,她现在不只是语音助手,还覆盖了在智能生活上的方方面面,希望降低用户使用智能产品的门槛。

小爱同学 5.0 共有五大升级,包括全场景智能协同、对话式主动智能、多模态融合交互、个性化情感声音和智慧学习助手。其中,全场景智能协同包括了协同唤醒、协同响应和协同提醒,能对家庭中的家居基于用户的意图进行统一决策,多设备协同配合,用户不用担心多设备协作配合的问题,小爱同学降低了使用智能设备的负担。

在引导对话方面,小米人工智能部副总经理、小爱同学研发总负责人王刚博士在接受 InfoQ 等媒体采访时表示,小爱同学开发了对话式主动智能,会用比较自然的对话方式,更主动与用户进行交互,在 UI 交互上不打扰用户,在对话过程中,小爱会主动抛出一些带有用户专属信息的话题与用户沟通,拉近与用户的距离,和用户亲近地打招呼,关怀提醒。在 5.0 版本中发布了“个性化动态语音识别”、“协同唤醒”等多项自研技术,新版本的小爱同学在语音交互上理解更准确,对话更加自然。

据悉,截止 6 月 30 日,小爱同学累计唤醒次数达 617 亿次,全球激活设备数 2.28 亿,小爱同学月活跃用户达到 7840 万。

小米 AI 的 2020

小米 AI 实验室主任、NLP 首席科学家王斌介绍了小米 AI 技术在过去一年来的进展与应用。

王斌表示,小米 AI 需求主要来自于公司内部,包括硬件产品、电商及新零售、互联网服务等“铁人三项”业务。

基于此需求,小米的 AI 战略分为两个部分,一是打造核心 AI 能力,二是通过开放合作建立合作关系,并将技术输送给社会。

小米 AI 目前已经建立了比较完整的技术图谱。

王斌详细介绍了小米在计算机视觉、语音、声学、NLP、知识图谱、机器学习等 AI 技术方面的进展。

在计算机视觉方面,大的突破主要来自 HDR/ 超级夜景、超级分辨率、文档 /OCR、魔法换天、魔法分身、Vlog 等技术。HDR 技术助力下,小米手机今年两次获得 DXOMARK 评测相机拍照第一名。

语音技术近一年的成果主要体现在唤醒、识别、生成和声纹技术等方面。声学在手机降噪、阵列唤醒、分布式放音、评测等方面取得了很大进展。声学、语音技术广泛落地到小爱同学以及手机、电视、音箱等产品。

在知识图谱技术上,小米在知识问答,智能坐席辅助、智能外呼、客服机器人等技术获得多项创新。

小米在机器学习方面近一年的成果主要包括,推出了面向微处理器的深度学习推理框架 MACE Micro,打造了面向广告推荐的自研稀疏模型自动优化架构 AutoSparseDL,进一步完善深度学习云服务平台 CloudML 等等。

在自然语音处理技术方面,小米自然语言处理平台 MiNLP 平台最新版 3.0 版发布,包括 26 个模块,落地 30 多个业务,目前 MiNLP 每天调用 80 亿次。抗噪机器翻译、统一机器翻译技术取得进展,目前已经落地手机、小爱同学等业务。在多模态内容理解方面,能够联合文本、语音、视频进行联合分析,已落地信息流、广告等业务。人机对话上,改写回复、生成式对话,多样性回复等技术已应用在小爱同学的闲聊技能上。对联、诗歌写作等技术已经落地到小米多个业务中,得到了很好的反馈。

值得一提的是,MiNLP 平台后续准备开源。

小米集团副总裁、技术委员会主席崔宝秋在开发者大会现场发布了 MiNLP 平台开源计划,MiNLP 的分词功能将于 11 月中下旬正式对外开源,词性标注功能将于明年一季度开源,命名实体识别功能将于明年二季度开源,语义相关功能将于明年三季度开源。

王斌介绍说,开源的 NLP 工具主要源自学术界或者工业界。来自学术界的开源 NLP 工具一般会侧重考虑学术实验场景,能为对学术研究带来很大的帮助。而来自工业界的开源工具,则倾向于考虑实际应用场景。目前业内一些公司诸如百度、腾讯等也都开源了一些 NLP 工具。

王斌介绍,小米 MiNLP 平台来自业务需求的驱动,更倾向于实际落地场景。不少模块自上线以来历经多个工业界实际上线场景的考验,小米开源的就是这个经历过考验的最新版本。

谈到与学术界和工业界已开源工具的区别,王斌博士表示,小米 MiNLP 在设计时充分借鉴了已有工具的一些思想和理念,并根据我们的实际经验进行了区别性设计,有自己的一些特点。比如,工业界最有力的干预机制,小米事先在设计时靠考虑到框架的灵活性,不用重新训练模型,就能方便地支持有效的干预机制。这样,用户就可以很灵活地将自己的东西放上去,并在短时间内获得一个更符合线上需求的版本。

目前,小米 AI 应用中的大部分核心技术以自主研发为主导,这些技术已经全面赋能到小米的各个产品和业务线。

谈到小米人工智能的未来,小米人工智能部总经理叶航军博士表示,小米 AI 已有了比较明确的短期目标和长期目标。

短期目标目前有两个大方向,一个是 AI 产品和小爱同学要支持好小米的智能生活战略,即“手机×AIoT”构建智能生活的战略。因为在这个战略中,小爱同学是非常重要的环节,可以认为,她发挥的是一个入口和落地的作用。另一个是 AIOT 方向,这六大技术方向现在都有非常明确的业务和落地场景。现在大家对 AI 的期望很高,其实它有非常多的技术问题解决得还很不好。这是小米后面要努力把这个事情做好的一个决心。

长期目标也主要有 2 个,一个是要把各个环节的智能化做的更深入一些。现在很多环节其实并不智能,在整个小米的业务体系里面,需要把各个层面的智能做得很深入。除了用户可见的产品体验以外,还有一些不太容易注意得到的场景,比如客服也是需要智能的。现阶段用户对客服的体验可能还不太好,大部分客服的问题其实是相对比较简单的问题,对目前的 AI 来说,都是能解决的问题。因此,针对这个方面,小米也在加大投入。

第二个长期目标是,往产业的上游去做。例如,小米将智能制造作为非常重要的场景。除了向消费者直接提供产品之外,小米也希望通过技术来帮助整个国内的制造业提升制造水平,智能制造里非常重要的技术就是 AI 技术。

IT思维

IT思维(itsiwei.com)是互联网首个定位在科技与电商“思维”韬略的平台,我们时刻关注互联网电商行业新动向; 诚邀行业资深从业者加入“思维客家族”!

发表留言

Return to Top ▲Return to Top ▲