公众号/
编辑 | 白菜叶
图示:其封装中所示的 MLSoC 是第一款专用芯片,不仅可以处理嵌入式用例中 AI 的矩阵乘法运算,还可以处理需要在同一应用程序中运行的计算机视觉的传统功能。(来源:SiMa)
在人工智能计算机芯片的广阔前景中,服务于「边缘」市场的产品,包括无人机、物联网设备、电话和低功耗服务器环境,为供应商提供了肥沃的土壤,成为少有的市场之一。与数据中心技术相比,市场上的发达地区。
正如媒体早些时候报道的那样,数十家初创公司已经获得了数千万美元的风险投资,用于制造用于移动和其他嵌入式计算用途的人工智能芯片。由于边缘市场不太稳定,供应商有很多不同的方法来解决这个问题。
2022 年 8 月 30 日,人工智能芯片初创公司 SiMa dot ai 正式推出了其所谓的 MLSoC,这是一种用于以更低功耗加速神经网络的片上系统。该公司表示,已开始向客户发货的新芯片是唯一「专门构建」的部件,用于处理高度重视计算机视觉任务的任务,例如检测场景中是否存在物体。
「每个人都在构建机器学习加速器,仅此而已。」SiMa.ai 的联合创始人兼首席执行官 Krishna Rangasayee 在接受采访时说。
Rangasayee 表示,「嵌入式边缘市场与云计算的不同之处在于,人们正在寻找端到端的应用程序问题解决者」,而不仅仅是用于机器学习功能的芯片。
「他们正在寻找可以在芯片上运行整个应用程序的片上系统体验。」
Rangasayee 认为,竞争对手只能通过执行机器学习的神经网络功能来「处理一小部分问题」。
「每个人都需要机器学习,但这是整个问题的一部分,而不是整个问题。」Rangasayee 表示。
SiMa.ai 芯片采用台积电的 16 纳米制造工艺制造,将多个部件制成单个芯片。这些部件包括一个机器学习加速器和代号为「Mosaic」的专用于作为神经网络处理基础的矩阵乘法。
板载还有一个 ARM A65 处理器内核,通常在汽车中找到,以及各种功能单元以帮助视觉应用的特定任务,包括一个独立的计算机视觉处理器、一个视频编码器和一个解码器、4 兆字节的片上内存,以及大量的通信和内存访问芯片,包括一个与 32 位 LPDDR4 内存电路的接口。
芯片硬件附带 SiMa.ai 软件,可以更轻松地调整性能并处理众多工作负载。
SiMa.ai 的产品针对各种市场,包括机器人、无人机、自动驾驶汽车、工业自动化以及医疗保健和政府的应用。
「这是一个价值数万亿美元的市场,仍在使用几十年前的技术。」Rangasayee 观察到各种民用和政府应用。
Rangasayee 说,当今许多用于自主飞行器和其他应用的计算机视觉系统都使用「传统的负载存储架构、冯诺依曼架构」,他指的是市场上大多数计算机芯片的基本设计。
他说,用于机器学习和计算机的芯片在处理计算带宽和数据相互结合的方式方面并没有进步。
「我们拥有独特的 ML SoC,这是第一个包含 ML 的片上系统,因此人们可以在一个单一架构中进行经典的计算机视觉,并解决除 ML 之外的遗留问题。」Rangasayee 说。
「sima」这个词是梵文「edge」的音译。
Edge AI 一词已成为一个笼统的术语,指的是不在数据中心内的所有事物,尽管它可能包括位于数据中心边缘的服务器。它的范围从智能手机到使用谷歌移动人工智能的 TinyML 框架消耗微瓦功率的嵌入式设备。
SiMa.ai 与众多移动和嵌入式竞争对手抗衡。在边缘市场,竞争对手包括 AMD、ARM、高通、英特尔和英伟达。然而,这些公司传统上一直专注于以更大功率运行的更大芯片,大约几十瓦。
SiMa.ai 芯片拥有其创造者所说的在市场上完成典型任务的最低功耗预算之一,例如 ResNet-50,这是处理 ImageNet 标记图片任务的最常见的神经网络。
图示:SiMa 在评估板上提供 MLSoC,用于应用测试。(来源:SiMa)
该公司表示,该部件每秒可以执行 50 万亿次运算,或「teraoperations」,每瓦每秒 10 teraoperations。这意味着该部件在执行神经网络任务时将消耗 5 瓦,尽管在使用其他功能时它可能会更高。
以几瓦特运行的这类芯片使 SiMa.ai 成为许多初创公司的公司,包括 Hailo Technologies、Mythic、AlphaICs、Recogni、EdgeCortix、Flex Logix、Roviero、BrainChip、Syntiant、Untether AI、Expedera、Deep AI、Andes 和 Plumerai 等。
Rangasayee 说,「在我们的视线范围内」的唯一公司是 Hailo 和 Mythic。但是,「我们最大的区别在于他们只构建 ML 加速器。我们正在构建完整的 ML SoC。」
得益于 SiMai.ai 在 ARM 内核和专用图像电路以及 Mosaic 神经网络代码中的构建,客户将能够在添加来自 PyTorch 和 TensorFlow 等流行 ML 框架的代码的同时运行现有程序的能力更强。
Rangasayee 告诉媒体:「对我来说有趣的是,对支持传统的专用平台的被压抑的需求非常高。」 「他们几乎可以从第一天开始运行他们的应用程序——这是我们拥有的巨大优势。」
「我们是第一家破解解决任何计算机视觉问题的代码的公司,因为我们不关心代码库,它可以是 C++、Python 或任何 ML 框架。」Rangasayee 解释说。
他认为,对项目的广泛支持使公司倾向于将自己视为芯片的「埃利斯岛」。「把你的穷人给我们,把你累的给我们……我们会把他们都拿走!」
Rangasayee 断言,这种广泛的支持意味着该公司拥有更多的客户群,而不仅仅是一个利基市场。
根据 Rangasayee 的说法,该芯片的另一个优势是它的性能是任何可比部件的十倍。
Rangasayee 说,「我们的客户关心的是每瓦每秒的帧数」,即每瓦功率的图像帧数。「我们至少是任何人的 10 [倍]。我们日复一日地向每一位客户展示这一点。」
该公司尚未根据广泛引用的 MLPerf 基准分数提供基准规格,但 Rangasayee 表示,该公司打算在未来进一步这样做。
「现在,首要任务是赚钱。」Rangasayee 说,「我们是一家非常小的公司」,拥有 120 名员工。「我们不能让一个团队单独做 MLPerf。」
「你可以围绕基准做很多调整,但人们关心的是端到端性能,而不仅仅是 MLPerf 基准。」
「是的,我们有数字,是的,我们比任何人都做得更好,但与此同时,我们不想把时间花在建立基准上。我们只想解决客户问题。」
尽管 8 月 30 日的公告是关于芯片的,但 SiMa.ai 特别强调其软件能力,包括它所谓的「新型编译器优化技术」。该软件可以支持「广泛的框架」,包括 TensorFlow、PyTorch 和 ONNX,机器学习用于开发和训练神经网络的主要编程库。
该公司表示,其软件允许用户「运行任何计算机视觉应用程序、任何网络、任何模型、任何框架、任何传感器、任何分辨率」。
Rangasayee 说:「你可以在一个应用程序上花费大量时间,但如何让成千上万的客户通过终点线?这确实是一个更难的问题。」
Rangasayee 说,为了实现这一目标,公司的软件工作包括两件事:「前端」的编译器创新和「后端」的自动化。
该编译器将支持「120 多种交互」,这提供了「灵活性和可扩展性」,可以将比通常情况下更多种类的应用程序引入芯片。
该软件的后端部分使用自动化来允许更多应用程序「映射到您的性能」,而不是「等待数月才能得到结果」。
Rangasayee 说:「大多数公司都在让人参与以获得正确的性能。」
「我们知道我们必须以一种巧妙的方式实现自动化,以便在几分钟内获得更好的体验。」
他说,这项软件创新旨在利用 MLSoC「按钮」,因为「每个人都想要 ML;没有人想要学习曲线。」 这也是 Rangasayee 的前雇主 Xilinx 也采用的一种方法,试图使其嵌入式 AI 芯片更加用户友好。
「我在以前的公司了解到软件的重要性。这真的取决于我们软件的实力。」Rangasayee 说,「是的,我们的硅非常棒,我们为此感到非常自豪,没有硅,你就不是一家公司。」
「但对我来说,这是必要的功能,而不是足够的功能;足够的功能是提供轻松的 ML 体验。」
相关报道:https://www.zdnet.com/article/ai-startup-sima-debuts-purpose-built-ai-chip-for-edge-computing/