AI芯片初创公司，“替代英伟达”很难

热搜大全 > 新闻热搜 > 科技热搜 > 正文

AI芯片初创公司，“替代英伟达”很难

热搜大全 2023-10-31

AI芯片初创公司，“替代英伟达”很难

题图来自：视觉中国

近期的一些消息显露出 AI 芯片初创公司的前景，似乎不太妙。Wave Computing 破产关闭的还历历在目，现在 AI 芯片领域的初创公司似乎正遭遇前所未有的挑战。在英伟达的 " 阴影 " 下，一些潜在的投资者对初创公司望而却步。面对全球经济的不稳定性不断增强，投资者因而变得愈发审慎，他们对风险的忍受度显著降低，这进一步增加了 AI 芯片制造商在筹资时的困难。根据 PitchBook 的数据，对专注于人工智能的芯片制造商的风险投资，从 2021 年的 90 亿美元降至 40 亿美元。

虽然像 Cerebras Systems、Graphcore 和 SambaNova 这样的企业成功筹集了大量资金，并在自己的技术领域取得了一定的成就，但要撼动英伟达这样的行业巨擘仍非易事。尤其是在像 ChatGPT 这类大型模型应用兴起之际，英伟达的地位愈发稳固，其 GPU 芯片在众多 AI 应用中都扮演着不可或缺的角色，这使得任何试图挑战英伟达的初创公司都面临着巨大的压力。这些 AI 芯片初创企业需要不懈努力，以证明他们的技术不仅能与英伟达媲美，甚至具有超越的潜力和价值。

资金流动性的减少、创新步伐的放缓，以及消费者信心的衰退，都在很大程度上制约了这些初创公司的成长。在这种大环境下，AI 芯片初创公司不仅要与技术巨头竞争，还要在经济大潮的冲击下稳住阵脚，这无疑对它们的生存和发展提出了更高的要求。

几近破产、融资困难、裁员，艰难的 AI 芯片公司

Mythic是模拟 AI 芯片的一家明星公司，但是据科技网站 The Register 报道，这家专注于模拟内存计算（CIM）的 AI 芯片初创公司总共筹集了约 1.6 亿美元资金，去年现金耗尽，几乎被迫停止运营。好在 2023 年 3 月，它成功筹集到了 1300 万美元投资。Mythic 首席执行官 Dave Rick 表示，英伟达 " 间接 " 加剧了整体 AI 芯片公司的融资困境，因为投资者希望投资巨额、回报丰厚的全垒打型投资。

在资金筹集方面，Graphcore堪称欧洲半导体初创企业中的佼佼者。这家公司由 Nigel Toon 和 Simon Knowles 在 2016 年创立，此前他们将自己的硬件公司卖给了英伟达。Graphcore 致力于开发 IPU（智能处理单元），这一点与目前主流的针对人工智能应用的 GPU（图形处理单元）截然不同。Graphcore 称，其 IPU 在满足人工智能的特定需求方面，比 GPU 更具有优势。据 PitchBook 的数据显示，截至目前，Graphcore 已经成功筹集了超过 6 亿美元的投资。然而，相比所筹集的资金，Graphcore 的收入却相对微薄。

故事在 2020 年出现了重大转变，当时微软决定在其云计算中心停用 Graphcore 的芯片，这一举措使得 Graphcore 失去了一个主要客户，从而面临了更加严峻的挑战。根据金融时报的报道，到 2022 年，Graphcore 的收入骤降了 46％，仅为 270 万美元，同时税前亏损增加了 11%，高达 2.046 亿美元，年终现金余额为 1.57 亿美元。

Graphcore 表示，到明年 5 月份需要进一步融资才能实现收支平衡。公司将这一不利局面归咎于 " 宏观经济环境的逆境 " 和 " 关键战略客户 " 的硬件采购推迟，尤其是来自 " 中国的主要客户 "。据消息，Graphcore 关闭了在挪威、日本和韩国的业务，并缩减了在其他国家的业务。目前，Graphcore 也开始重新调整业务方向，将其 IPU 芯片从数据中心转向部署在云计算环境中。

Rivos，一家服务器芯片制造商，正面临苹果公司的诉讼，被指控非法挖角其工程师并窃取商业机密。今年八月，Rivos 裁减了大约二十名员工，约占公司员工总数的 6%，在此过程中，管理层向留下的员工透露，公司获取新资金的可能性正在减少。联合创始人还向部分员工透露，苹果针对该公司及其几位前苹果员工的诉讼，严重阻碍了他们的筹资活动。

芯片公司烧钱是常态，巨额的研发投入、激烈的市场竞争以及对顶尖人才的争夺，都使得这些公司在成长的道路上不得不投入大量的资金。如今，人工智能领域初创公司给予初级工程师的薪酬往往十分可观，这一方面反映了人才市场的供不应求，另一方面也凸显了这些初创公司对技术人才的极度渴求。

然而，这种高薪策略是否可持续，却是一个值得深思的问题。对于 AI 芯片初创公司而言，成功融资是其发展的关键一步，但资金的有效利用同样至关重要——这不仅关乎公司的现阶段运营，更影响到其长远的战略目标和市场地位。

英伟达的一些劲敌？

Cerebras是一家 " 一鸣惊人 " 的公司，该公司因为芯片大，而捕获了行业的眼球。英伟达的 A100 GPU 已经相当大了，差不多 826 平方毫米。但 Cerebras 的新型芯片 WSE-2 芯片，面积为 45225 平方毫米，几乎覆盖了 8 英寸硅晶圆的整个表面。自 2016 年成立以来它已筹集了 7.3 亿美元。

根据 CB Insights 全球独角兽俱乐部的数据，该公司目前估值为 40 亿美元。目前，Cerebras 已经与阿布扎比 G42 合作建造了九台人工智能超级计算机中的第一台，这台超级计算机的造价超过 1 亿美元。Cerebras 也正在朝着生成式 AI 领域奋进，虽然它已经证明了其 CS-2 在 GPT 模型中训练的速度，但是其仍没有获得大型厂商的采用。

AI芯片初创公司，“替代英伟达”很难

Cerebras 研究人员首次在 Andromeda AI 超级计算机上训练了一系列七个 GPT 模型，参数分别为 111M、256M、590M、1.3B、2.7B、6.7B 和 13B

Tenstorrent也是业界很看好的一家初创公司，由顶级芯片设计师 Jim Keller 于 2016 年所创立。截至目前，该公司已经融资了近 3.35 亿美元，最近的一次投资者中包括三星和现代，目前估值约为 10 亿美元。Tenstorrent 将利用 RISC-V 和 Chiplet 技术打造 AI CPU，以此来挑战英伟达的 AI 主导地位。最近，Tenstorrent 刚与三星达成生产合作的协议，计划使用三星的 4nm 工艺来生产芯片。

该公司拥有全面的路线图（如下图所示），其中包括基于 RISC-V 的高性能 CPU 小芯片以及先进的 AI 加速器小芯片，有望为机器学习提供强大的解决方案。目前，Tenstorrent 有两款产品：一种名为 Grayskull 的机器学习处理器，可提供约 315 INT8 TOPS 的性能，可插入 PCIe Gen4 插槽；另一种是联网 Wormhole ML 处理器，可提供约 350 INT8 TOPS 的性能并使用 GDDR6 内存子系统，一个 PCIe Gen4 x16 接口，并具有与其他机器连接的 400GbE。

今年他们将推出其 Black Hole 独立 ML 计算机芯片。该公司的重头戏 Grendel 将于 2024 年推出，这是一种高配置、高性能的 ML 芯片设计，将 CPU 芯片与专用的 ML/AI 芯片相结合，与英伟达的 GH200 和 Grace/Hopper 超级芯片的实现方式类似。

AI芯片初创公司，“替代英伟达”很难

Tenstorrent 的 AI 芯片路线图（图片来源：Tenstorrent）

成立于 2017 年的SambaNova，已成为 AI 芯片创业领域中资金最雄厚的公司之一。截至目前，该公司已成功筹集了高达 10 亿美元的融资，投资方包括如软银和英特尔等知名机构。这使 SambaNova 不仅成为融资额最高的 AI 芯片初创公司，也被视为英伟达最有力的新兴竞争者之一，公司估值达到了 50 亿美元。

SambaNova 最近推出了其最新的第四代 SN40L 处理器。这款处理器拥有超过 1020 亿个晶体管，采用了台积电的 5nm 工艺，其计算速度高达 638 teraflops。独特的三层内存系统（包括片上内存、高带宽内存和高容量内存）旨在处理与 AI 工作负载相关的庞大数据流。SambaNova 宣称，一个只有 8 个此类芯片组成的节点就能够支持多达 50 万亿参数的模型，这几乎是 OpenAI 的 GPT-4 LLM 报告规模的三倍。

该公司的首席执行官 Rodrigo Liang 表示，使用标准的 GPU 来执行相同任务将需要数百个芯片，这意味着总成本只有使用标准方法的 1/25。然而，SambaNova 并不直接将芯片销售给其他公司。相反，它提供对其定制技术栈的访问权限，其中包含了为运行最大型 AI 模型而专门设计的专有硬件和软件。

避免与之正面竞争，会否是 AI 芯片初创公司的新出路？

尽管英伟达在人工智能计算领域占据主导地位，但该公司并没有牢牢锁定该领域，市场机会仍然有很多。如果按照英伟达的冯 · 诺依曼架构 HBM 先进工艺互联这样的路线，可能将无人能敌英伟达，而且 GPU 价格和功耗一直在上涨，这对于人工智能行业本身来说是不可持续的。所以一些 AI 芯片公司选择不与英伟达正面竞争，另辟蹊径，走出一些差异化的路线，试图在市场中分一杯羹。

d-Matrix：存内计算芯片

d-Matrix 公司也是一家 AI 芯片初创公司，该公司认为，随着生成式人工智能的爆发，当前的基础设施无法维持成本和需求，生成式人工智能需要变革性的计算范式。所以 d-Matrix 设计的芯片具有数字 " 内存计算 " 功能，使人工智能计算机代码能够更有效地运行。d-Matrix 宣称可以将 TCO 降低十倍，并在性能和延迟方面具有二十倍的优势。

据 The Register 的报道，这家初创公司的最新芯片名为 Jayhawk II，将采用通过高速结构连接的八个小芯片，总共 2GB 的 SRAM，而且只需要 350 瓦就能提供大约 2000 TFLOPs 的 FP8 性能和多达 9600 TOPs 的 Int4 或块浮点数学性能。

AI芯片初创公司，“替代英伟达”很难

d-Matrix 路线图（来源：d-Matrix）

该芯片可帮助 ChatGPT 等生成型 AI 应用提供支持。不过该公司所针对的仅是人工智能的推理部分，训练部分则不涉猎，也就是说他们不与英伟达正面竞争，而是发力在 300-600 亿参数模型领域。对于这种尺寸的模型，在人工智能推理方面，英伟达的 H100 不一定是最经济的选择。运行这些模型的大部分成本都归结于快速高带宽内存的使用。相比之下，d-Matrix 加速器中使用的 SRAM 更快、更便宜，但容量也有限。

d-Matrix 已经在微软的支持下融资 1.1 亿美元，微软已承诺在明年推出该芯片时对其自用进行评估。d-Matrix 预计两年内年收入为 7000 万至 7500 万美元，并实现收支平衡。

Ceremorphic：模拟计算 AI 芯片

Ceremorphic 正在设计一款采用台积电 5nm 工艺的超低功耗超级计算芯片，利用其自己的专利技术和多线程处理架构 ThreadArch®。该公司的创始人兼首席执行官 Venkat Mattela，此前他所创立的 Redpine Signals 于 2020 年 3 月以 3.14 亿美元的价格出售给了 Silicon Labs。Ceremorphic 所研发的芯片的核心在于数字电路之下的模拟电路，在芯片功能的层次结构的最低层进行模拟计算，更高层次上则不做模拟计算。该公司的创始人兼首席执行官 Venkat Mattela 认为，模拟乘法将比数字乘法更有效地利用电压，更好地实现低功耗。

该公司的主要技术包括可靠、低能耗和安全的机器学习、图形神经处理器、抗量子和硅高效安全处理器、高性能模拟电路、可靠的时序电路和系统级互连，使产品能够针对不同的细分市场进行扩展。右图描绘了 Ceremorphic 的技术组合，涵盖当前和未来的计算需求。

AI芯片初创公司，“替代英伟达”很难

Ceremorphic 的技术组合

结语

目前的事实证明，在英伟达所主导的 GPU 生态中，初创芯片公司想要活下来并不容易，" 替代英伟达 " 很难。强如 AMD 和英特尔都很难撬动这块大蛋糕。对于这些 AI 芯片公司而言，机会窗口很窄，英伟达已经发布了其最新的路线图。而且，大型的云厂商几乎都已经躬身自研芯片了，亚马逊拥有 Inferentia 芯片，谷歌最近展示了其第五代张量处理单元，微软即将发布其自研芯片，这进一步挤压了希望通过云提供商进入市场的初创企业的机会。

芯片初创企业所承担的风险甚至超越了传统软件初创公司，因为它们不仅需要巨额资金来支持复杂的半导体设计和软件开发，还要承担实物产品的制造成本。随着时间的推移，我们可能会目睹一些此类企业的破产倒闭、被收购，但它们中的每一个都怀揣着成为下一个英伟达的梦想。

本文来自微信公众号：半导体行业观察（ID：icbank），作者：杜芹 DQ