MHMarkets:AI手机或将重塑手机行业生态

发布于: 雪球转发:0回复:0喜欢:0

MHMarkets讯,AI手机:把大模型装进手机,智能终端演进的新方向。AI手机指的是通过端侧部署AI大模型,实现多模态人机交互,展现为非单一应用智能化的手机终端。我们认为AI手机当前的发展需要关注两个关键点,一是通过AI切实解决用户痛点;二是用户的数据安全及隐私问题。Counterpoint预测, 2027年全球AI手机渗透率约40%,出货量有望达5.22亿部。

MHMarkets:在模型侧,模型轻量化初显成效,手机厂商陆续发布端侧模型。一方面科技巨头如谷歌Meta等纷纷推出轻量化模型,另一方面手机厂商亦通过自研或在现有大模型基础上优化的方式,研发适配在手机端运行的模型。

在硬件侧,NPU算力升级,异构计算及内存升级,同时关注电池及散热。IDC与OPPO白皮书指出AI手机NPU算力需大于30TOPS;IDC指出AI手机至少需要16G内存。遵循算力及内存提升同时控制功耗的逻辑,我们看到芯片端三大升级趋势:1)AI工作负载增加,NPU算力提升成为重点;2)AI应用多样化,异构计算日益重要;3)AI推理需求增加,内存容量及带宽需求提升。此外,我们判断散热、电池及整机设计等亦或将带来升级。

在操作系统及应用侧:操作系统优化升级,移动端应用日新月异,商业模式有望跑通。端侧AI的运行需要大模型与操作系统、硬件及手机本地模型协同,AI agent与手机的结合也成为重要方向。从应用落地进展看,移动端的AI应用落地目前主要包括独立APP、应用程序集成进手机、集成进语音助手,我们认为未来移动端AI应用商业模式有望逐渐成熟。长期来看,我们认为手机端或有望形成新的流量入口,深刻影响手机厂商商业模式。

正文:

MHMarkets:AI手机:把大模型装进手机,智能终端演进的新方向

个性化定制的人工智能设备

AI手机指的是通过端侧部署AI大模型,实现多模态人机交互,展现为非单一应用智能化的手机终端。目前AI手机应用功能仍处于早期,终端定义标准及技术升级趋势主要集中在大模型及软硬件配置。根据Canalys,满足以下三大标准即可被确认为AI手机:1)大模型方面,智能手机能够在端侧运行LLM(如谷歌的Gemini、三星的Gauss等)和其他生成式AI模型(如Stable Diffusion等);2)硬件方面,智能手机的SoC芯片中包含能够加速AI运行的专用单元(如高通的Hexagon、联发科的APU和谷歌的TPU等);3)运行效果方面,端侧LLM的推理能力高于成人的阅读速度即10 token/s(基于LLaMA-2 7B, 或同等水平),同时端侧AI生成图像的时间要小于2秒(基于Stable Diffusion v1.5,20步,512*512分辨率,或同等水平)。

图表1:手机AI发展阶段

资料来源:艾瑞咨询,中金公司研究部

MHMarkets:我们认为AI手机当前的发展需要关注两个关键点。

一是通过AI切实解决用户痛点,如OPPO Find X7一键消除、三星Galaxy S24即圈即搜等的热门AIGC应用,促进用户从“尝新”到“常用”转变。OPPO首席产品官刘作虎表示,用户对OPPO Find X7 AI消除功能的热情较高,后台数据显示该功能的用户人均使用次数达15次,实现了从尝鲜到常用,根据OPPO官方微博,OPPO Find X7预售5分钟销量已达上一代的402%,首销当天全渠道销量是上一代的317%。同时OPPO销售端反馈,用户对于AI手机的概念并没有感知,但是当AI消除功能拿出来做展示后,产品的销售成功率或将变高,我们认为这进一步论证了端侧AI应用解决用户痛点,进而促进新形态终端落地的产业发展逻辑。

MHMarkets:二是用户的数据安全及隐私问题。根据谷歌官网,谷歌会搜集用户的Gemini应用对话内容、相关产品使用信息、用户位置相关信息以及用户反馈,并根据隐私权政策使用这些数据来提供、改进和开发谷歌产品、服务及机器学习技术。以Gemini为例,用户的Gemini应用活动记录会默认存储到谷歌账号并保留最多18个月。在此过程中,对于厂商而言,如何为用户设置安全数据保护墙以及合理运用数据进行训练或将成为AI手机能够持续发展的关键。

图表2:手机厂商数据安全解决方案

资料来源:各公司官网,中金公司研究部

手机厂商加速,抢滩AI手机市场

Counterpoint预测,2024年全球AI手机渗透率约4%,出货量有望超1亿部;2027年全球AI手机渗透率约40%,出货量有望达5.22亿部。

图表3:各品牌最新发布的AI手机

注:统计时间截至2023年3月13日,为不完全统计

资料来源:谷歌官网,小米官网,vivo官网,中金公司研究部

图表4:全球AI手机出货量及渗透率预测

图表5:中国AI手机出货量及渗透率预测

行业升级:关注端侧芯片及手机应用落地进展

模型侧:模型轻量化初显成效,手机厂商陆续发布端侧模型

MHMarkets:谷歌Meta开源模型奠定手机端轻量化模型基础

与AIPC类似,基于安全隐私、降低云端使用成本等因素考量,AI手机也将采用端云结合的方式。因此一方面科技巨头如谷歌Meta等纷纷推出轻量化模型,另一方面手机厂商亦通过自研或在现有大模型基础上优化的方式,研发适配在手机端运行的模型。

图表6:AI手机行业主要进展

注:图表中预计均为对应厂商各自的产品计划

资料来源:各公司官网,中金公司研究部

手机厂商陆续发布手机轻量化模型

当前各厂商发布的轻量大模型参数量在10亿~130亿之间,涌现能力相差不大,而在模型数量、自研深度、开源程度等方面存在着一些初期的差异化发展。

► 模型数量方面,华为、荣耀 、小米谷歌、传音推出1-2个轻量化模型;vivo推出自研通用大模型矩阵,具体包括1B端侧、7B端云两用、70B云端主力、130B云端、175B云端5款自研通用大模型以实现不同的功能需求;根据OPPO官网,OPPO发布安第斯大模型AndesGPT,覆盖了从十亿至千亿以上的多种不同参数规模,在手机端实现三级大模型部署策略。

► 自研深度方面:手机厂商中华为、小米、vivo、荣耀均为自研,谷歌推出的gecko(壁虎)模型为自研PaLM 2的轻量版,Gemini Nano和Gemma也为自研。OPPO发布会表示AndesGPT是自主训练;传音是基于业界模型,通过自建的语音数据库进行训练。

► 开源程度方面:vivo 7B蓝心大模型是手机厂商中第一个开源的大模型,同时vivo也发布了对应的开发套件BlueKit,使得中小开发者可以直接调用大模型的端侧推理能力。

图表7:手机轻量化模型推出情况

资料来源:华为官网,小米官网,OPPO官网,vivo官网,荣耀官网,联想官网,宏碁官网,谷歌官网,Meta官网,中金公司研究部

硬件侧:NPU算力升级,异构计算及内存升级,同时关注电池及散热等变化

考虑手机SoC市场中,高通、联发科及苹果为主要参与厂商,因此我们在下述分析中,也会以这几家头部厂商为重点。由于目前苹果并未明确提出AI手机芯片的方案,在上一篇AIPC报告中,我们也重点介绍了苹果M3芯片情况,因此在下文中不赘述。近期高通、联发科陆续发布了面向手机市场的新一代SoC,重点强调了算力的提升及内存的升级。

图表8:高通及联发科新一代手机SoC情况

资料来源:高通官网,联发科官网,中金公司研究部

变化一:AI工作负载增加,NPU算力提升成为重点

当前手机中基本不存在独立的AI芯片,而是将CPU、GPU、DSP、NPU等集成在一颗SoC芯片中。由于CPU、GPU是通用处理器,因此其本职工作是进行操作系统、软件等应用的处理;而NPU(Neural Network Processing Unit)则是专门用于处理深度学习等运算的专用处理器,擅长标量、向量和张量数学运算,专门用于运行AI工作负载。

由于其专用的设计目的,NPU在AI计算的时延、功耗、性能、能效比等各方面均高于CPU、GPU,因此各厂商纷纷在手机SoC芯片中集成NPU并提升其性能:1)高通骁龙8 Gen 3芯片集成的Hexagen NPU通过提高矢量加速器的时钟速度等实现比上一代推理速度提升98%,能效提升40%;2)联发科天玑9300芯片搭载的APU 790深度适配Transformer模型,速度提升为上一代芯片的8倍。

图表9:高通NPU演进过程

资料来源:《通过NPU和异构计算开启端侧AI》(高通,2024年),中金公司研究部

图表10:芯片厂商NPU布局情况

MHMarkets:AI应用呈现多样化,异构计算发挥重要作用

高通指出,生成式AI用例需求存在多种类型,具有复杂性、并发性和多样性,对应对芯片的性能及资源调用提出不同要求。在此背景下,异构计算架构能够支持处理多样性的特点就具有较大吸引力,从而充分发挥每个处理器的优势:CPU擅长顺序控制和即时性;GPU适合并行数据流处理;NPU擅长标量、向量和张量数学运算。

从更加远期的角度看,未来个人助手或在AI手机上成为标配,因此语音识别、大语言模型、语音模型等多种模型可能会并行运行,因此高通提出需要在NPU、GPU、CPU和传感器之间分布处理模型,进行整体的方案设计。

图表11:AI需求(AI个人助手)工作负载分配过程

资料来源:《通过NPU和异构计算开启端侧AI》(高通,2024年),中金公司研究部

SoC多核架构持续升级,AI功能受到重视。SoC设计的另一个延伸方向是如何从芯片架构上进行优化。主流手机SoC(主要是CPU)设计主要使用Arm核,ARM架构在手机市场市占率超过99%。从SoC的设计架构发展历程看,CPU等处理器经历了从单核高频率、多核、大小核、“大核+中核+小核”“超大核”的变化,频率和核心数也相应不断增加,意在提升SoC性能。但另一方面,由于移动端性能和功耗平衡的限制,SoC的核数不能无限制增加。

图表12:高通及联发科新一代手机SoC情况

资料来源:高通官网,联发科官网,中金公司研究部

Arm架构升级助力芯片性能提升,持续增强AI能力。根据Arm官网,2021年发布的Arm V9架构是当前旗舰手机采用的最新一代架构,其中2023年发布的Armv9.2指令集包括新的QARMA3 PAC算法、浮点能力增加和PMU增强等,意在强化手机芯片的AI计算能力。根据Arm在MWC2024大会上的介绍,随着 Arm CPU 提供的AI能力每两年实现翻番,通过搭载Arm 2023 全面计算解决方案 (TCS23) 的智能手机,Arm在该手机的Arm Cortex CPU上借由LLaMa2-7B参数演示AI推理。演示性能接近每秒生成10个Token,这大约是普通成年人读取速度的两倍。

此外,在GPU方面,不同于此前手机厂商均采用ARM公版GPU方案,各厂商开始自研GPU以形成差异化竞争优势。

图表13:各厂商自研GPU情况

注:统计时间截至2024年3月14日

资料来源:各公司官网,量子位,中金公司研究部

变化三:AI推理需求增加,内存容量及带宽需求提升

除了计算,AI手机同样会对存储提出更高要求。根据联发科无线事业部AI技术高级经理庄世荣,130亿参数量大模型运行需要有13GB的内存容量(INT8),同时智能手机运行安卓操作系统需要4GB的内存,同步相对流畅的运行其他手机APP需要6GB的内存,AI模型端侧推理部署的手机存储量应该达到23GB才能够实现较好的用户软件使用体验。OPPO刘作虎也提到,70亿参数大模型正常的模型大小是28GB,为了真正在端侧部署,OPPO对模型进行压缩和轻量化,最后压缩到最小的3.9GB左右,无论是存储还是内存占用都是这个量级。vivo副总裁黄韬表示大模型对手机运行内存性能的要求,起码是8G起步。IDC指出,16GB RAM将成为新一代AI手机的基础配置。

图表14:AIPC内存容量需求

资料来源:Omdia,中金公司研究部

图表15:手机内存升级趋势

资料来源:IDC,中金公司研究部

MHMarkets:关注散热、电池及整机设计等变化

在其他硬件变化方面,为了适配大模型及其计算需求,同AIPC,我们判断AI手机在散热、电池及整机设计等环节亦或将带来升级变化。

电池:硅碳负极提升电池能量密度。传统PC或手机电池采用石墨作为负极,石墨负极理论克容量为372mAh/g,但硅基负极理论克容量可高达4200mAh/g,因此便出现了通过给负极掺硅碳复合材料的方式来提升电池能量密度的技术尝试。目前在小米、荣耀的新一代旗舰手机上,均出现了高密度硅碳负极电池的身影。其中小米“金沙江电池”容量达到5300mAh,最高硅含量6%,电池体积降低8%,续航提升高达17%。而在AI时代,随着算力提升带来的功耗提升,对电池续航能力的要求也更高。

图表16:小米新一代小米14 Ultra采用硅碳负极电池

资料来源:小米官网,石墨资讯,中金公司研究部

散热:随着AI计算带来的功耗增大,如何提升散热亦成为重点。当前手机散热技术路径主要有石墨片、均热板、热管。从新材料和技术上,当前石墨烯等新材料的采用成为了可能。由于芯片算力提升,对应对散热的要求也会提升,但同时还要满足手机在重量、厚度等方面的整体设计要求,因此目前各家厂商的散热方案并不完全一致,但通过提升散热能力降低发热的整体思路一致。

操作系统&应用侧:操作系统优化升级,移动端应用日新月异,商业模式有望跑通

操作系统:差异化OS系统成为竞争焦点,AI Agent加快手机端落地

操作系统提供了软件运行的环境,成为AI端侧落地的重要一环。在日常运行交互过程中,手机端侧大模型不断学习用户的价值观、需求、行为偏好、顾虑等数据形成用户画像并持续更新,从而使得用户在操作系统交互中能得到更加智能的个性化体验。我们认为,经历了功能创新匮乏、硬件堆叠定义手机的长周期,大模型能力的加持使得手机来到软件体验定义产品的新时点。

长期来看,端侧AI的运行需要大模型与手机OS操作系统、手机硬件及手机本地模型协同。OPPO提出来智慧OS的概念,与智能手机相比,在AI手机时代,应用的生态从原本的独立APP演变为多个场景,同时智慧OS也要能够实现多模态融合的交互。

MHMarkets:AI agent与手机的结合也成为另一个重要方向。目前OpenAI正开发两款革命性的Agent软件,其中一款能够有效接管客户的设备来自动执行复杂的任务,从移动端AI的发展趋势看,我们认为未来AI Agent与手机的结合或具有较大可能。手机端AI Agent的发展方向是Agent自主调用手机端应用,让用户享受到专属手机智能助理的服务,从而打破APP的隔阂,通过自主的规划决策实现跨应用的操作。