
手机上跑大模型,有必要吗?
作者|武静静
编辑|栗子
小米的大模型在雷军 2023 年年度演讲中首次公开亮相。
雷军提到,和很多互联网平台的思路不同,小米大模型的重点突破方向是轻量化和本地部署,能在手机端侧跑通。
他称,目前,13 亿参数规模的 MiLM1.3B 模型已经在手机上跑通,且效果可以媲美 60 亿参数的大模型在云端运算的结果。在他晒出的成绩单中,小米端侧大模型在 CMMLU 中文评估的各项主题中都比智谱 AI 的 ChatGLM2-6B 模型表现好,和百川智能的 Baichuan-13B 大模型的得分差距约在 5 分左右。

(图源:小米)
此前,小米开发的大规模预训练语言模型 MiLM-6B/1.3B 已经登陆代码托管平台 GitHub,并在 C-Eval 总榜单排名第十、同参数量级排名第一,在中文大模型基准 "CMMLU" 上,"MiLM-6B" 排名第一。
当然,由于这些测试榜单的维度都是公开的,根据测试任务进行刷榜刷分对于很多大模型公司并非难事,所以这些测评结果只能作为参考,并不意味着效果上的绝对优秀。
同时,雷军也宣布小爱同学作为小米大模型第一个应用的业务,已经进行了全新的升级,并正式开启邀测。
这是从今年 4 月宣布新设立大模型团队以来,小米在 4 个月时间中做出的阶段性大模型成果。
小米的实践给大模型落地带来什么新思考?对于借助新技术迭代的手机厂商而言,又意味着什么?
小米在大模型路线上属于理性派——不追求参数规模,不做通用大模型。
此前在财报电话会上,小米集团总裁卢伟冰就对外称,小米会积极拥抱大模型,方向是与产品和业务深度结合,不会像 OpenAI 一样去做通用大模型。
根据深燃此前的报道,小米集团 AI 实验室主任王斌博士曾说,小米不会单独发布一款类 ChatGPT 产品,自研大模型最终会由产品带出来,相关投入约几千万人民币级别。
他说:" 对于大模型,我们属于理智派。小米有应用场景优势,我们看到的是大模型跟场景结合的巨大机会。"
他透露,在 ChatGPT 诞生之前,小米内部做过大模型相关的研发和应用,当时是通过预训练+下游任务监督微调的方式来做人机对话,参数规模在 28 亿到 30 亿。这主要是在预训练基座模型的基础上,通过对话数据的微调实现的,并非现在所说的通用大模型。
根据公开资料,目前小米大模型团队负责人为 AI 语音方向专家栾剑,向技术委员会副主席、AI 实验室主任王斌汇报。整个大模型团队有30 人左右。
栾剑曾是智能语音机器人 " 微软小冰 " 首席语音科学家及语音团队负责人,曾任东芝(中国)研究院研究员、微软(中国)工程院高级语音科学家。加入小米后,栾剑曾先后负责语音生成、NLP 等团队,以及相关技术在小爱同学等产品中落地。王斌 2018 年加入小米,2019 年起负责 AI 实验室,加入小米前曾是中国科学院信息工程研究所研究员、博导,在信息检索与自然语言处理领域有近 30 年研究经验。
做大模型也依托于小米背后的 AI 团队,雷军称,小米的 AI 团队经过 7 年时间,6 次扩展,已经超过 3000 人,覆盖了 CV、NLP、AI 影像、自动驾驶、机器人等多个领域。

(图源:小米)
小米之外,让大模型跑在手机上是很多科技公司当前的重点目标。
科技公司正在想象大模型带来这样一种可能性:不管你打开的是 WPS、石墨文档还是邮件,只要输入写作等指令,手机就可以调用本地能力生成完整的一篇文章或者一封邮件。手机端,所有的 App 都可以随时调用本地的大模型来帮忙处理工作和解决生活问题,人和手机上各种 App 的交互也不再是频繁的点击,而是通过语音就能进行智能召唤。
很多公司正在想方设法地压缩模型体积,让大模型在手机上的本地运行变得更实用且经济。在今年 5 月的 Google I/O 大会上,谷歌发布 PaLM2 时,按照规模大小分为四种规格,从小到大依次为 Gecko、Otter、Bison 和 Unicorn,其中体积最小的 Gecko 可以在手机上运行,并且速度很快,每秒可处理 20 个标记,大约相当于 16 或 17 个单词,也可支持手机离线状态运行。但当时谷歌没说这款模型会具体用在哪一款手机上。
目前已经拿出具体成绩的是高通。在今年 3 月的 2023MWC 上,高通在搭载第二代骁龙 8 的智能手机上,运行了超过 10 亿参数的文生图模型 Stable Diffusion。演示中,工作人员在一部没有联网的安卓手机上用 Stable Diffusion 生成了图像,整个过程用了15 秒。
6 月的计算机视觉学术顶会 CVPR 上,高通又展示了在安卓手机上运行 15 亿参数规模的 ControlNet 模型,出图时间仅用了11.26 秒。高通产品管理高级副总裁兼 AI 负责人 Ziad Asghar 称:从技术上,把这些超 10 亿参数大模型搬进手机,只需要不到一个月的时间。
最新的动作是高通宣布和 Meta 合作,探索基于高通骁龙芯片,在不联网的情况下,在智能手机、PC、AR / VR 头显设备、汽车等设备上,运行基于 Llama 2 模型的应用和服务。高通称,和基于云端的 LLM 相比,在设备本地运行 Llama 2 等大型语言模型,不仅成本更低,性能更好,且不需要连接到在线服务,服务也更个性化、更安全和更私密。
尚未官宣任何大模型动作的苹果也正在探索大模型在设备端侧的落地。据报道,苹果正在全面招聘工程师和研究人员来压缩大语言模型,以便它们能够在 iPhone 和 iPad 上高效运行,主要负责的团队是机器智能和神经设计 ( MIND ) 团队。
目前,在 Github 上,一个热门的开源模型 MLC LLM 项目就可以支持本地部署,它通过仔细规划分配和积极压缩模型参数来解决内存限制,可以在 iPhone 等各类硬件设备上运行 AI 模型。该项目是由 CMU 助理教授,OctoML CTO 陈天奇等多位研究者共同开发的,团队以机器学习编译(MLC)技术为基础来高效部署 AI 模型。MLC-LLM 上线不到两天,GitHub 的 Star 量已经接近一千。有人已经测试了在 iPhone 的飞行模式下本地跑大语言模型。
和国外谷歌、高通强调大模型在端侧本地部署,可以离线运行不同,目前国内手机厂商优先考虑的是将大模型落地在手机语音助手或者现有的图片搜索功能上,这种升级本质还是调用更多云端能力来使用大模型。
此次,小米就是将大模型用在了语音助手小爱同学上。但由于目前小米端侧大模型相关信息尚未披露,无法准确判断之后小米大模型的发展路径。从雷军强调的本地部署和轻量化的方向来看,未来小米可能会尝试大模型在手机端离线运行。
华为也在尝试大模型在手机端的落地,不过重点瞄准的依旧是手机语音助手和搜图场景。此前 4 月,华为新发布的手机 P60 上,智慧搜图新功能背后就是多模态大模型技术,过程中在手机端侧对模型进行小型化处理。近期,华为新升级的终端智能助手小艺也基于大模型进行体验优化,可以根据语音提示推荐餐厅、进行摘要总结等新功能。
OPPO、vivo 也在这个方向发力,8 月 13 日,OPPO 宣布,基于 AndesGPT 打造的全新小布助手即将开启体验,从资料中可以看到,小布助手集合大模型能力之后,在对话、文案撰写等方面的能力会有所加强。AndesGPT 是 OPPO 安第斯智能云团队打造的基于混合云架构的生成式大语言模型。
对于手机厂商而言,不管是本地部署,还是调用云端能力,大模型之于手机,都是一个不可错失的新机会。
让大模型跑在手机上不是一件容易的事。
算力是首要问题。在手机端使用大模型,不仅需要调用云端算力还需要调用终端设备的算力,由于大模型的大资源消耗,每一次的调用都意味着很高的成本。Alphabet 董事长 John Hennessy 曾提到,用大语言模型的搜索成本比此前的关键词搜索成本高出 10 倍。去年,谷歌有 3.3 万亿次搜索查询,成本约为每次五分之一美分。华尔街分析师预测,如果谷歌用大语言模型来处理一半的搜索问题,每次提供的答案为 50 个单词左右,到 2024 年,谷歌可能面临 60 亿美元的支出增长。

手机端运行大模型面对类似的成本难题,在高通发布的《混合 AI 是 AI 的未来》报告中提到,就像传统计算从大型主机和客户端,演变为当前云端和边缘终端相结合的模式一样,端侧运行大模型也需要混合 AI 架构,让云端和边缘终端之间分配并协调 AI 工作负载,从而能让手机厂商利用边缘终端的计算能力降低成本。让大模型实现本地部署就是出于这一成本问题的考量。
此外,手机作为每个人的私人物品,是数据产生的地方,本地也存放着大量的私人数据,如果能够实现进行本地部署,在安全性、隐私等方面为个人提供了保障。
这就带来了第二个难题,如果想更多地调用端侧能力来运行大模型,如何让手机的能耗很低,同时还能让模型的效果很强?
高通曾对外称,之所以能将大模型部署到手机等本地设备上,关键能力在于高通软硬件全栈式的 AI 优化,其中包括高通 AI 模型增效工具包(AIMET)、高通 AI 引擎和高通 AI 软件栈等相关技术,可以压缩模型体积,加速了推理,并降低运行时延和功耗。高通全球副总裁兼高通 AI 研究负责人侯纪磊曾提到,高通在高效能 AI 研发中,一个重要的部分是整体模型效率研究,目的是在多个方向缩减 AI 模型,使其在硬件上高效运行。
单模型压缩就是一个不小的难点。有的模型压缩会对大模型的性能造成损失,有一些技术方式可以做到无损压缩,这些都需要借助各种工具进行不同方向的工程化尝试。
这些关键的软硬件能力对于手机厂商而言都是很大挑战。如今,很多手机厂商都迈出了在手机上跑大模型的第一步。接下来,如何让更好的大模型,更经济、更高效地落在每一部手机中反而是更难、更关键的一步。
冒险才刚刚开始。
(封面图来源:小米)
END.
科技热搜 喜马拉雅 天猫精灵 手表 设备 韭菜 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-08-07
科技热搜 华为 芯片 余承东 华为mate 雷蒙 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-09-29
科技热搜 华为mate google pixel oppo find x iphone 新闻 资讯 直播 视频 美图 社区 本地 热点 2023-11-17
娱乐热点 导演 a股 李产 股市 陈真 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-01-18
娱乐热点 造型 韩国 尺度 中国人 穿着 新闻 资讯 直播 视频 美图 社区 本地 热点 2024-02-04
曾被卖出19万美元高价!这台初代iPhone太猛了
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13
科技热搜 2024-03-13