IT思维

文章页右侧顶部广告

Lucid Robotics 创始人:我是怎么启动AI创业项目的?

2018-03-24 9:05:28 0 人工智能 | , ,

这里是油管 Artificial Intelligence Education 专栏,原作者 Siraj Raval 授权雷锋字幕组编译。

原标题 How to Start an AI Startup

公众号/AI研习社 翻译 | 李振  J叔 余杭   字幕 |  凡江   整理 | 廖颖

我们正处在一个AI大革命的开端,每周都有新的创新出现。例如 Tetra 利用语音识别技术,从你的手机中生成详细的笔记;Hyper Science 通过利用 OCR 从表单中轻松提取数据;Jet Lore 利用消费者行为作为一个模型的输入,输出结构化数据。在本期视频中,我将结合自己的创业经验,告诉你们如何启动一个 AI 的创业项目。

  推荐的学习材料

现在是 2018 年,如果你希望今年加入创业大军的话,首先就要学习 AI。如果你自己不了解这个神奇的技术是怎么工作的话,你不可能创造出 AI 解决方案。如果你刚刚开始看教程,记得按照这个顺序——先学习面向数据科学的 python,接着是 Tensorflow 的介绍,接着是 Deep Learning 的介绍,最后是关于人工智能的数学知识。

另外 ,Andrew Ng 的最新 Deep Learning 课程是必选项,Jeremy Howard 的Fast.Ai 课程也非常棒。我最喜欢的关于深度学习的书是 lan Goodfellow 著的 Deep Learning。这本书的电子版是免费的,它对你理解关于 Deep Learning 的数学知识非常有帮助。Deep Learning 被证实在广泛的范围内,可以帮助每一个其他的机器学习模型。

所以,关于 AI 的炒作是有道理的。然而你需要确切地知道,其他机器学习模型是怎么工作的。在无法获取大量数据的情况下,你只能建立一个简单的预测模型。这种情况下,支持向量机,甚至一个简单的决策树,都比深度神经网络更有用。

知道什么时候用什么模型的唯一方法是,建立关于 AI 的直觉——这种直觉在学习和掌握大量 AI 知识资源后才能得到。当掌握了构建 AI 算法的全貌时,你需要找到一个激发你浓厚兴趣的问题去研究——世界上大多数成功的公司都是从解决问题开始的。

记录遇到的问题

记录你和你朋友面临的问题,以及在生活中亟待解决的问题吧,这会是非常好的选择。这些问题困扰着你关心的人,于是你就会有解决它的热情。

如果没有好的想法,你可以使用社交网络主动寻找想要寻找解决方案的人。利用关键字或关键词,找到人们发布的遭遇很大挫败感的话题,例如我该怎么做,寻找问题解决方案,或者关于这个工作做的不好等。你可以在 Reddit 或 Twitter 等社交媒体上找到这些信息。

  读万卷书,行万里路

我认为最好发现问题的方法是旅行,和不同人接触。我在前几年曾历时三个月环游欧洲,在伦敦偶然碰到了 Alex macaw,他给了我启发,让我在大学前几年的主修方向,从商学转为计算机科学。这是我这一生最重要的改变,才能让我成立了机器人创业公司 Lucid Robotics。

我在剑桥读三年级的时候,在南亚和东南亚旅行了四个月。这次旅行帮助我以不同的角度看待同一个事物。离开硅谷以后,我会亲自去发现人们面对的问题,他们日常的生活问题,关系到基础设施、商业活动,当然还有教育,对我的影响非常大。当地人进行许多简单的交流,最终形成了我自己的想法,形成了一个大的计划——即关于AI的教育。

  前期调研

像马斯克说过:“创业就像披荆斩棘,筚路蓝缕”。如果你对解决一个问题没有热情,你就无法坚持。当遇到不论多少负面的评论。我总持保留意见,因为这不是针对我的,而是针对解决 AI 问题的。一旦你有了待解决的目标问题,就该做一些市场调查,包括你的客户,他们在哪里购买,他们的承受能力,这是产品还是服务,配置的花销,市场的历史怎么样等等。

这方面的内容可以参考 dot.com ( 互联网 )和大数据分析公司。根据公布的关于一般 AI 创业公司的报告,AI 型创业公司大致分为两类:第一类是水平方向的 AI 创业公司,主要针对服务于不同行业的基础问题,比如自然语言处理;第二类是垂直方向的创业公司,针对非常具体的客户群体,为他们解决问题,属于一类具体的行业。

每个主流的技术公司都非常注重 AI,他们雇佣 AI 方面的大牛,从 Hinton 到 LeCun 都是天才。他们多年来从用户那收集了大量数据,而这些只对他们自己的研发团队开放,因此这些科学巨人拥有巨大的优势。他们建立水平方向的产品,可以被用在很多行业,例如图像识别,语言翻译或者其他的基础设施。

而你所拥有的优势,是可以根据一个独立的问题,针对垂直方向的领域展开快速的行动。他们没有时间去处理简单的小问题,但是你有。

总的来说, 他们关注客户多过于关注企业,你可以帮助企业,建立个人主页,描述你的产品,注册获得发布版本,在社交网络上发布它。一个提升你产品认知度的方法,是提升你自己的形象,把自己包装成一个 AI 思想领袖,建立博客或者其他形式回答 AI 的基础问题。当你注册时,让观众看到,如果你做的非常好,你产品的价格也会跟着增长——它和你可以提供的成正比,这至关重要。

  寻找数据

如果你将 AI 从公司剥离,但如果在正确的轨道上的话,它仍是一个有价值的产品。如果 AI 是你唯一的东西,没有消费者或者投资者会满意的。当你开始市场调研,就是建立你产品的最佳时机。建立模型的时候,你需要尽可能地组织和标注你的数据——高质量的数据经常是机器学习流水线中最重要的部分,重要程度甚至超过模型结构——在垃圾中分析垃圾什么也得不到。

最简单的方法是寻找公布的数据,Github 上有非常棒的数据库,California Irvine 有巨大的 ML 数据资源库,Kaggle 也有很多很棒的数据。如果这些都不管用,用你已有的数据建立自己的数据库,例如当你尝试着对手写字体进行分类,你可以通过增加噪声的方法,从已经存在的数据中生成新的数据。如果你有未标注数据,通过 Amazon 的 Mechanical Turk 进行众包是一个好的选择。你可以找人来标注他们。另外还有像 data circle 这样的数据市场,你可以直接从其他人手中购买或者交换数据。

最后,如果你够有创意,可以利用 scrapy 库或者 web service 来编写 python 脚实现自动抓取数据,就像在 diggernaut.com 上一样。当你开始建立模型,Tensorflow 仍然是最能经受考验的机器学习框架。Tensorflow 的生态圈有一大堆的工具,比如 产品化的 Tensorflow Serving。建议一个模型,用你的数据通过 AWS google cloud 或者 FloydHub 来训练这个模型。利用你的模型进行预测——这就是你的产品。数据越多意味着算法越智能,同时也意味着产品更优秀,用户更多以及数据越多,这个环状结果往复循环。

  融资

融资是一个加速拓展业务的方法,或许 ICO 圈子现在非常热门,但如果你长时间处身其中,可能产生法律问题,这里就不谈了。我的一个朋友—— Aetherium 的第一个设计者,他不希望给他的公司做 ICO,于是采用众筹的方法筹钱。

我们可以发现他的做法很具有启发性,我有一篇文章,详细地描述了这件事。风险投资(VC)是另一选项,通过重复使用一些流行语来使 VC 投资人相信你的产品很棒。其中,最好的 VC 投资人可以很好地理解你的产品,所以你需要准备好向他们解释其中的技术。

如果你可以在一些高档的地方和 VC 投资人交流,说明你已经获得了一些现金流;如果没有,就不用。这就是我在纽约被那么多 VC 投资人拒绝的原因——我还没证明我的机器人能够有很好的销售市场,因此我并没有得到很多的投资,我所做的是建立一个受众群体。我可以接受被挑剔,但是我现在不关注融资。

  招聘

接下来是招聘。极少数的天才分布在全球各地,所以从 kaggle 的全球排行榜招人是有道理的,即最招最有用的人 —— 我很难找到适合帮助我编辑视频的人。如果你真心喜欢一件事情, 是很难放弃的。如果你找到合适的人,事情变得简单了。

Steve Jobs 说过,最高兴的事情是你拥有一个核心团队——可能是 10 个优秀的人。它是可以自控的,某种程度上,你可以选择退出。不论之后是被 Aqua 或其他的大型技术公司雇佣,还是被 IPO 雇佣,如果都没有,可以走咨询公司这条路,只是没有开发产品那么具有诱惑力,但是找几个朋友开一家咨询公司总能填饱肚子,得到一些初始用户,慢慢做好品牌,证明自己。

视频原址 https://www.youtube.com/watch?v=9bbS-trc8ys

IT思维

IT思维(itsiwei.com)是互联网首个定位在科技与电商“思维”韬略的平台,我们时刻关注互联网电商行业新动向; 诚邀行业资深从业者加入“思维客家族”!
Return to Top ▲Return to Top ▲