
题图来自:视觉中国
近期的一些消息显露出 AI 芯片初创公司的前景,似乎不太妙。Wave Computing 破产关闭的还历历在目,现在 AI 芯片领域的初创公司似乎正遭遇前所未有的挑战。在英伟达的 " 阴影 " 下,一些潜在的投资者对初创公司望而却步。面对全球经济的不稳定性不断增强,投资者因而变得愈发审慎,他们对风险的忍受度显著降低,这进一步增加了 AI 芯片制造商在筹资时的困难。根据 PitchBook 的数据,对专注于人工智能的芯片制造商的风险投资,从 2021 年的 90 亿美元降至 40 亿美元。
虽然像 Cerebras Systems、Graphcore 和 SambaNova 这样的企业成功筹集了大量资金,并在自己的技术领域取得了一定的成就,但要撼动英伟达这样的行业巨擘仍非易事。尤其是在像 ChatGPT 这类大型模型应用兴起之际,英伟达的地位愈发稳固,其 GPU 芯片在众多 AI 应用中都扮演着不可或缺的角色,这使得任何试图挑战英伟达的初创公司都面临着巨大的压力。这些 AI 芯片初创企业需要不懈努力,以证明他们的技术不仅能与英伟达媲美,甚至具有超越的潜力和价值。
资金流动性的减少、创新步伐的放缓,以及消费者信心的衰退,都在很大程度上制约了这些初创公司的成长。在这种大环境下,AI 芯片初创公司不仅要与技术巨头竞争,还要在经济大潮的冲击下稳住阵脚,这无疑对它们的生存和发展提出了更高的要求。
几近破产、融资困难、裁员,艰难的 AI 芯片公司
Mythic是模拟 AI 芯片的一家明星公司,但是据科技网站 The Register 报道,这家专注于模拟内存计算(CIM)的 AI 芯片初创公司总共筹集了约 1.6 亿美元资金,去年现金耗尽,几乎被迫停止运营。好在 2023 年 3 月,它成功筹集到了 1300 万美元投资。Mythic 首席执行官 Dave Rick 表示,英伟达 " 间接 " 加剧了整体 AI 芯片公司的融资困境,因为投资者希望投资巨额、回报丰厚的全垒打型投资。
在资金筹集方面,Graphcore堪称欧洲半导体初创企业中的佼佼者。这家公司由 Nigel Toon 和 Simon Knowles 在 2016 年创立,此前他们将自己的硬件公司卖给了英伟达。Graphcore 致力于开发 IPU(智能处理单元),这一点与目前主流的针对人工智能应用的 GPU(图形处理单元)截然不同。Graphcore 称,其 IPU 在满足人工智能的特定需求方面,比 GPU 更具有优势。据 PitchBook 的数据显示,截至目前,Graphcore 已经成功筹集了超过 6 亿美元的投资。然而,相比所筹集的资金,Graphcore 的收入却相对微薄。
故事在 2020 年出现了重大转变,当时微软决定在其云计算中心停用 Graphcore 的芯片,这一举措使得 Graphcore 失去了一个主要客户,从而面临了更加严峻的挑战。根据金融时报的报道,到 2022 年,Graphcore 的收入骤降了 46%,仅为 270 万美元,同时税前亏损增加了 11%,高达 2.046 亿美元,年终现金余额为 1.57 亿美元。
Graphcore 表示,到明年 5 月份需要进一步融资才能实现收支平衡。公司将这一不利局面归咎于 " 宏观经济环境的逆境 " 和 " 关键战略客户 " 的硬件采购推迟,尤其是来自 " 中国的主要客户 "。据消息,Graphcore 关闭了在挪威、日本和韩国的业务,并缩减了在其他国家的业务。目前,Graphcore 也开始重新调整业务方向,将其 IPU 芯片从数据中心转向部署在云计算环境中。
Rivos,一家服务器芯片制造商,正面临苹果公司的诉讼,被指控非法挖角其工程师并窃取商业机密。今年八月,Rivos 裁减了大约二十名员工,约占公司员工总数的 6%,在此过程中,管理层向留下的员工透露,公司获取新资金的可能性正在减少。联合创始人还向部分员工透露,苹果针对该公司及其几位前苹果员工的诉讼,严重阻碍了他们的筹资活动。
芯片公司烧钱是常态,巨额的研发投入、激烈的市场竞争以及对顶尖人才的争夺,都使得这些公司在成长的道路上不得不投入大量的资金。如今,人工智能领域初创公司给予初级工程师的薪酬往往十分可观,这一方面反映了人才市场的供不应求,另一方面也凸显了这些初创公司对技术人才的极度渴求。
然而,这种高薪策略是否可持续,却是一个值得深思的问题。对于 AI 芯片初创公司而言,成功融资是其发展的关键一步,但资金的有效利用同样至关重要——这不仅关乎公司的现阶段运营,更影响到其长远的战略目标和市场地位。
英伟达的一些劲敌?
Cerebras是一家 " 一鸣惊人 " 的公司,该公司因为芯片大,而捕获了行业的眼球。英伟达的 A100 GPU 已经相当大了,差不多 826 平方毫米。但 Cerebras 的新型芯片 WSE-2 芯片,面积为 45225 平方毫米,几乎覆盖了 8 英寸硅晶圆的整个表面。自 2016 年成立以来它已筹集了 7.3 亿美元。
根据 CB Insights 全球独角兽俱乐部的数据,该公司目前估值为 40 亿美元。目前,Cerebras 已经与阿布扎比 G42 合作建造了九台人工智能超级计算机中的第一台,这台超级计算机的造价超过 1 亿美元。Cerebras 也正在朝着生成式 AI 领域奋进,虽然它已经证明了其 CS-2 在 GPT 模型中训练的速度,但是其仍没有获得大型厂商的采用。

Cerebras 研究人员首次在 Andromeda AI 超级计算机上训练了一系列七个 GPT 模型,参数分别为 111M、256M、590M、1.3B、2.7B、6.7B 和 13B
Tenstorrent也是业界很看好的一家初创公司,由顶级芯片设计师 Jim Keller 于 2016 年所创立。截至目前,该公司已经融资了近 3.35 亿美元,最近的一次投资者中包括三星和现代,目前估值约为 10 亿美元。Tenstorrent 将利用 RISC-V 和 Chiplet 技术打造 AI CPU,以此来挑战英伟达的 AI 主导地位。最近,Tenstorrent 刚与三星达成生产合作的协议,计划使用三星的 4nm 工艺来生产芯片。
该公司拥有全面的路线图(如下图所示),其中包括基于 RISC-V 的高性能 CPU 小芯片以及先进的 AI 加速器小芯片,有望为机器学习提供强大的解决方案。目前,Tenstorrent 有两款产品:一种名为 Grayskull 的机器学习处理器,可提供约 315 INT8 TOPS 的性能,可插入 PCIe Gen4 插槽;另一种是联网 Wormhole ML 处理器,可提供约 350 INT8 TOPS 的性能并使用 GDDR6 内存子系统,一个 PCIe Gen4 x16 接口,并具有与其他机器连接的 400GbE。
今年他们将推出其 Black Hole 独立 ML 计算机芯片。该公司的重头戏 Grendel 将于 2024 年推出,这是一种高配置、高性能的 ML 芯片设计,将 CPU 芯片与专用的 ML/AI 芯片相结合,与英伟达的 GH200 和 Grace/Hopper 超级芯片的实现方式类似。

Tenstorrent 的 AI 芯片路线图(图片来源:Tenstorrent)
成立于 2017 年的SambaNova,已成为 AI 芯片创业领域中资金最雄厚的公司之一。截至目前,该公司已成功筹集了高达 10 亿美元的融资,投资方包括如软银和英特尔等知名机构。这使 SambaNova 不仅成为融资额最高的 AI 芯片初创公司,也被视为英伟达最有力的新兴竞争者之一,公司估值达到了 50 亿美元。
SambaNova 最近推出了其最新的第四代 SN40L 处理器。这款处理器拥有超过 1020 亿个晶体管,采用了台积电的 5nm 工艺,其计算速度高达 638 teraflops。独特的三层内存系统(包括片上内存、高带宽内存和高容量内存)旨在处理与 AI 工作负载相关的庞大数据流。SambaNova 宣称,一个只有 8 个此类芯片组成的节点就能够支持多达 50 万亿参数的模型,这几乎是 OpenAI 的 GPT-4 LLM 报告规模的三倍。
该公司的首席执行官 Rodrigo Liang 表示,使用标准的 GPU 来执行相同任务将需要数百个芯片,这意味着总成本只有使用标准方法的 1/25。然而,SambaNova 并不直接将芯片销售给其他公司。相反,它提供对其定制技术栈的访问权限,其中包含了为运行最大型 AI 模型而专门设计的专有硬件和软件。
避免与之正面竞争,会否是 AI 芯片初创公司的新出路?
尽管英伟达在人工智能计算领域占据主导地位,但该公司并没有牢牢锁定该领域,市场机会仍然有很多。如果按照英伟达的冯 · 诺依曼架构 HBM 先进工艺 互联这样的路线,可能将无人能敌英伟达,而且 GPU 价格和功耗一直在上涨,这对于人工智能行业本身来说是不可持续的。所以一些 AI 芯片公司选择不与英伟达正面竞争,另辟蹊径,走出一些差异化的路线,试图在市场中分一杯羹。
d-Matrix:存内计算芯片
d-Matrix 公司也是一家 AI 芯片初创公司,该公司认为,随着生成式人工智能的爆发,当前的基础设施无法维持成本和需求,生成式人工智能需要变革性的计算范式。所以 d-Matrix 设计的芯片具有数字 " 内存计算 " 功能,使人工智能计算机代码能够更有效地运行。d-Matrix 宣称可以将 TCO 降低十倍,并在性能和延迟方面具有二十倍的优势。
据 The Register 的报道,这家初创公司的最新芯片名为 Jayhawk II,将采用通过高速结构连接的八个小芯片,总共 2GB 的 SRAM,而且只需要 350 瓦就能提供大约 2000 TFLOPs 的 FP8 性能和多达 9600 TOPs 的 Int4 或块浮点数学性能。

d-Matrix 路线图(来源:d-Matrix)
该芯片可帮助 ChatGPT 等生成型 AI 应用提供支持。不过该公司所针对的仅是人工智能的推理部分,训练部分则不涉猎,也就是说他们不与英伟达正面竞争,而是发力在 300-600 亿参数模型领域。对于这种尺寸的模型,在人工智能推理方面,英伟达的 H100 不一定是最经济的选择。运行这些模型的大部分成本都归结于快速高带宽内存的使用。相比之下,d-Matrix 加速器中使用的 SRAM 更快、更便宜,但容量也有限。
d-Matrix 已经在微软的支持下融资 1.1 亿美元,微软已承诺在明年推出该芯片时对其自用进行评估。d-Matrix 预计两年内年收入为 7000 万至 7500 万美元,并实现收支平衡。
Ceremorphic:模拟计算 AI 芯片
Ceremorphic 正在设计一款采用台积电 5nm 工艺的超低功耗超级计算芯片,利用其自己的专利技术和多线程处理架构 ThreadArch®。该公司的创始人兼首席执行官 Venkat Mattela,此前他所创立的 Redpine Signals 于 2020 年 3 月以 3.14 亿美元的价格出售给了 Silicon Labs。Ceremorphic 所研发的芯片的核心在于数字电路之下的模拟电路,在芯片功能的层次结构的最低层进行模拟计算,更高层次上则不做模拟计算。该公司的创始人兼首席执行官 Venkat Mattela 认为,模拟乘法将比数字乘法更有效地利用电压,更好地实现低功耗。
该公司的主要技术包括可靠、低能耗和安全的机器学习、图形神经处理器、抗量子和硅高效安全处理器、高性能模拟电路、可靠的时序电路和系统级互连,使产品能够针对不同的细分市场进行扩展。右图描绘了 Ceremorphic 的技术组合,涵盖当前和未来的计算需求。

Ceremorphic 的技术组合
结语
目前的事实证明,在英伟达所主导的 GPU 生态中,初创芯片公司想要活下来并不容易," 替代英伟达 " 很难。强如 AMD 和英特尔都很难撬动这块大蛋糕。对于这些 AI 芯片公司而言,机会窗口很窄,英伟达已经发布了其最新的路线图。而且,大型的云厂商几乎都已经躬身自研芯片了,亚马逊拥有 Inferentia 芯片,谷歌最近展示了其第五代张量处理单元,微软即将发布其自研芯片,这进一步挤压了希望通过云提供商进入市场的初创企业的机会。
芯片初创企业所承担的风险甚至超越了传统软件初创公司,因为它们不仅需要巨额资金来支持复杂的半导体设计和软件开发,还要承担实物产品的制造成本。随着时间的推移,我们可能会目睹一些此类企业的破产倒闭、被收购,但它们中的每一个都怀揣着成为下一个英伟达的梦想。
本文来自微信公众号:半导体行业观察 (ID:icbank),作者:杜芹 DQ
科技热搜 喜马拉雅 天猫精灵 手表 设备 韭菜 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-08-07
科技热搜 华为 芯片 余承东 华为mate 雷蒙 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-09-29
科技热搜 华为mate google pixel oppo find x iphone 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-11-17
娱乐热点 导演 a股 李产 股市 陈真 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-01-18
娱乐热点 造型 韩国 尺度 中国人 穿着 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-02-04
曾被卖出19万美元高价!这台初代iPhone太猛了
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13