16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

热搜大全 > 新闻热搜 > 科技热搜 > 正文

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

热搜大全 2023-11-30

最强云计算、最快 GPU,联手出大招了!

就在刚刚,云计算霸主亚马逊云科技英伟达宣布:

推出首款云 AI 超级计算机,结合了英伟达 H200 Grace Hopper 超级芯片和亚马逊 UltraCluster 扩展功能。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

据悉,该合作项目代号为Project Ceiba,而这个超级计算机是配备了 H200 NVL32 与 Amazon EFA 互连技术的大规模系统,将部署在亚马逊云科技之上。

它共计搭载了16384 颗英伟达 H200 超级芯片,能够处理 65 exaflops 速度等级的 AI 运算。

为了这个合作项目,老黄也是亲自来到亚马逊云科技年度盛会 re:Invent 的现场站台,重视程度可见一斑。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

左:亚马逊云科技 CEO:Adam Selipsky;右:英伟达 CEO:黄仁勋

与此同时,亚马逊云科技也成为了英伟达 H200 Grace Hopper 超级芯片的第一个大客户。

而之所以两大巨头要这般合作,双方的目标也是非常明确——剑指生成式 AI

亚马逊云科技 CEO Adam Selipsky 在现场表示:

我们与英伟达合作了 13 年,推出了最广泛的英伟达 GPU 解决方案可用于各种工作负载,包括绘图、游戏、HPC 高性能计算、机器学习,以及现在的生成式 AI。

我们将会让亚马逊云科技成为运行 GPU 的最佳云端环境。

黄仁勋也对生成式 AI 与云计算发表了他的观点:

生成式 AI 正改变各种云端负载,为多元内容创作在底层注入加速计算动能。

我们共同目标是为每个客户提供具有成本效益、先进生成式 AI,为此英伟达与亚马逊云科技在整个计算堆栈展开合作,横跨 AI 基础设施、加速库、基础模型以及生成式 AI 服务。

而这次强强联手的合作,也仅仅是亚马逊云科技 re:Invent 活动中的一隅。

现在,我们就来一同看下更多的重磅发布。

亚马逊云科技升级 AI 芯片

除了与英伟达展开合作之外,亚马逊云科技自家的芯片也迎来了大升级。

首先便是发布了升级后的通用 AI 芯片——Graviton4

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

据了解,与上一代 Graviton3 相比,Graviton4 的计算性能提高了 30%,核心数量增加了 50%,内存带宽增加了 75%。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

Graviton4 带来的一个新转变之一,便是通过对所有快速物理硬件接口的全面加密,这就显著提升了它的安全性。

亚马逊云科技透露,这款芯片将被应用于内存优化型的 Amazon EC2 R8g 实例,帮助客户提升高性能数据库、内存缓存和大数据分析工作的效率。

而且,R8g 实例的大小更大,其 vCPU 和内存容量比前一代的 R7g 实例最多增加了三倍。

搭载 Graviton4 的电脑预计在接下来的几个月内上市。

亚马逊云科技进一步表示:

自从大约五年前推出 Graviton 项目以来,他们已经生产了超过 200 万个 Graviton 处理器。

而且,亚马逊云科技 EC2 的前 100 位用户都已经选择使用 Graviton,这证明了其在市场上的受欢迎程度。

亚马逊云科技在大会中带来的第二款升级芯片,则是Trainum2

如其名,这款芯片的主要用途就是针对拥有超大参数模型的训练。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

相比于上一代 Trainium1,Trainum2 在速度上快出了 4 倍,同时在能效方面也有 2 倍的提升。

在亚马逊云科技内部,Amazon EC2 Trn2 实例将采用的正是 Trainium2,每个实例内置 16 个 Trainium 芯片。

这些 Trn2 实例的目的是为了支持客户在下一代 EC2 UltraCluster 中大规模扩展,最多可达 10 万个 Trainium2 芯片,通过亚马逊云科技弹性织物适配器(EFA)的 petabit 级网络连接,能够提供高达 65 exaflops 的强大计算能力。

有了这种规模,客户就可以在数周而不是数月时间内训练 3000 亿参数的大语言模型!

正如 Claude 背后公司 Anthropic 的联合创始人 Tom Brown 所述:

我们正在与亚马逊云科技密切合作,使用 Trainium 芯片开发我们未来的基础模型。

Trainium2 将帮助我们大规模构建和训练模型,我们预计它比第一代 Trainium 芯片快至少 4 倍,适用于我们的一些关键工作负载。

据悉,Trainium2 将从明年开始用于支持新的服务。

Amazon Q:亚马逊工作版 ChatGPT 出道

在生成式 AI 方面,亚马逊云科技还发布了自家工作版的 ChatGPT ——Amazon Q,重新构想了未来的工作方式。

Amazon Q 主要面向的是企业用户,它让员工可以利用公司的数据和专业知识获得答案、解决问题。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

Amazon Q 基于亚马逊云科技 17 年的知识来训练,所以很懂亚马逊云科技,于是在使用亚马逊云科技过程中,可以随时随地提供帮助。

Adam 说,Amazon Q 改变了开发人员在亚马逊云科技上构建、部署和操作应用程序的方式。

它可以通过提出问题来了解亚马逊云科技功能和工作原理,或者确定最佳服务。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

Amazon Q 不仅能介绍亚马逊云科技的各项功能,还可以根据用户需求,提供利用亚马逊云科技各项服务构建应用的方法。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

在使用亚马逊云科技遇到问题和故障时,Amazon Q 也可以一键分析原因并想办法解决。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

在亚马逊云科技控制台之外,Amazon Q 还可以在 IDE 中调用,实时帮助开发者生成或解释代码,并进行测试和优化。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

更为精彩的是,Amazon Q 可以完成从计划到代码,再到完成后的测试和用户文档的全流程自动开发

假如要给应用添加新功能,开发人员只需要用自然语言描述需求,然后检查 Amazon Q 给出的建议并进行必要调整就可以了。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

不过,开发不是一劳永逸,程序的维护和升级也至关重要。

而如果这之中涉及到了编程语言的更新迭代,开发者可能需要花费几个月甚至几年对代码进行逐行调整。

而 Amazon Q 的代码转换功能,将这一时间缩短到了几分钟。

开发人员只需在 IDE 中打开他们想要转换的代码,然后要求 Amazon Q 对其进行 "/transform" 即可。

最近,5 名开发人员用 Amazon Q 在短短两天内将 1000 个应用从 Java 8 升级到 Java 17,平均每个用时还不到 10 分钟。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

除了面向开发者的 Builder 版本, Amazon Q 还有为商业从业者提供的 Business 版本。

可以在亚马逊 QuickSight 数据分析平台和亚马逊云科技 Connect 中使用。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

将 Amazon Q 连接到企业系统,还能得到定制版的 Q,我们还可以看到 Amazon Q 帮助用户分析了下游客户的需求。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

在此基础之上,Amazon Q 更是可以直接充当使用者的客服代表,解决下游用户提出的问题。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

做个总结的话,Business 版本的 Amazon Q 一共拥有四重 " 专家 " 身份:

亚马逊云科技专家,对亚马逊云科技的每一个功能、模块都有充分的了解。

生意专家,能够分析行业状况下游客户的需求。

商业智能专家,能够对大量商业数据进行分析。

客服专家,对用户企业情况充分了解,可以充当智能客服工作。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

价格方面,Business 和 Builder 版本的价格分别是每用户每月 20 美元和 25 美元。

还有其它发布

与这些芯片和聊天机器人 Amazon Q 同时发布的,还有全新的云存储服务亚马逊云科技 S3 Express One Zone。

它的速度是标准版 S3 的 10 倍,可以在 1 分钟之内处理数百万次请求,请求成本和计算成本分别降低了 50% 和 60%。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

工具层面,生成式 AI应用搭建平台 Bedrock也值得关注。

Adam 将其称作最简单的利用大模型搭建和扩展生成式 AI 的方式。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

此外还有和 Trainium 芯片配套的ML 优化 SDK  亚马逊云科技 Neuron。

排行前 100 的 ML 模型中,亚马逊云科技 Neuron 支持 93 种。

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

按照基础设施层、工具层和应用层这三个层级进行划分,此次发布中涉及生成式 AI 的产品都在下面这张图里了:

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

One More Thing

据说这届亚马逊云科技的 re:Invent 活动吸引了来自全球的 5 万多人。

来,感受一下 Keynote 结束后的人山人海

16000颗H200超级芯片!最强云计算亚马逊云科技和英伟达“合体”了:推出云AI超级计算机

用户对喜马拉雅的“一台设备一充值”的抱怨引发了网友的吐槽,认为这是一种花式割韭菜行为。

用户对喜马拉雅的“一台设备一充值”的抱怨引发了网友的吐槽,认为这是一种花式割韭菜行为。

科技热搜 喜马拉雅 天猫精灵 手表 设备 韭菜 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-08-07

“遥遥领先”,一个华为热梗的走红

“遥遥领先”,一个华为热梗的走红

科技热搜 华为 芯片 余承东 华为mate 雷蒙 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-09-29

华为 Mate 60 Pro  DXOMARK 影像测试结果出炉:总分157,位列排行榜第 1 名

华为 Mate 60 Pro DXOMARK 影像测试结果出炉:总分157,位列排行榜第 1 名

科技热搜 华为mate google pixel oppo find x iphone 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-11-17

韩国女团大尺度造型惹争议,穿着令人费解,成员还有中国人

韩国女团大尺度造型惹争议,穿着令人费解,成员还有中国人

娱乐热点 造型 韩国 尺度 中国人 穿着 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-02-04

《繁花》:A先生最后一集终于露脸,为何是宝总的模样?

《繁花》:A先生最后一集终于露脸,为何是宝总的模样?

娱乐热点 导演 a股 李产 股市 陈真 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-01-18

曾被卖出19万美元高价!这台初代iPhone太猛了 曾被卖出19万美元高价!这台初代iPhone太猛了