文章作者、来源:半导体产业纵横
当性能迈入过剩时代,AI、影像、系统体验与生态协同,正在取代 SoC 成为手机竞争的新战场。
Omdia的最新预测显示,2026年全球智能手机出货量将同比下降12.2%至10.93亿部,但同期市场总值反而同比增长6.1%。量少了,钱多了。全球智能手机平均售价预计从2025年的467美元涨至2026年的565美元,涨幅21%、涨价98美元,两项数据均创行业历史新高。
推动价格的是存储成本。2026年第一季度,DRAM和NAND闪存均价环比上涨超过80%,AI服务器对HBM的需求激增,把内存厂商的产能大量吸走,留给消费电子的供给随之收紧。Omdia预计,即便下半年涨幅放缓至个位数,组件成本仍将维持高位,厂商只能持续将压力转嫁至零售价格。市场结构随之分化:低端机型因成本上涨被迫缩减,高端机型反而在份额上受益,翻新二手市场同步扩大。
对此,中国政府的回应方向是需求侧补贴:6月18日,商务部等八部门发布《关于加快“人工智能+消费”发展的实施意见》,明确用个人消费贷款财政贴息政策支持消费者购买AI手机、智能电脑、AI眼镜等产品。手机涨价的同时,AI手机被列为国家消费战略品类。
手机整体在降,高端在涨。发布会上,手机厂商们已经不再讨论处理器有多快。
2026年夏天上市的旗舰手机,处理器几乎是同一颗骁龙8 Gen 5。小米在讲7000 mAh金沙江电池,vivo在讲折叠屏续航天花板,iQOO在讲电竞散热,moto在讲折叠机身里塞进6000 mAh。安卓阵营里,SoC性能话题淡去,处理器芯片像4G一样在发布会中隐形了。
手机厂商被夹在中间,只能在别的地方找出路。
端侧AI的参数军备竞赛,在数字上打得很热闹。Counterpoint的报告指出,2026年具备GenAI能力的智能手机将占全球出货量的45%,但分析师同时指出:有能力跑AI的设备,和用户真正在日常里使用AI功能的设备之间,存在明显的缺口。硬件能力堆上去了,用户行为并没有跟着改变。
联发科和vivo联合演示了在天玑9300上跑33B参数大模型;华为宣称麒麟旗舰能本地推理千亿参数稀疏模型;小米高调宣称旗舰跑通了千亿MoE。7B、13B、33B、100B,数字每隔几个月往上翻一次。然后vivo做了一个反向的决定:把主力端侧模型从7B换回了3B。不是因为技术不行,而是因为3B模型只占2GB内存、功耗约750mA,能持续跑128K长文本。在日常使用里,3B做到的事情和7B差不多,但手机不会发烫,电池不会狂掉。用户要的不是参数更大的模型,而是一个真正改变日常使用体验的AI,随时响应、不发烫、不费电,能在打开手机的每一个场景里实际帮到用户。
这个判断的背后还有一个行业里不常被提的事实:那些动辄百亿、千亿的端侧参数,本质是稀疏MoE架构——总参数量很大,但每次推理实际激活的只有几十亿,再经过INT4量化压缩,实际运行的计算量和7B Dense模型差不多。千亿是仓库的总容量,不是每次用到的东西。
这一趋势意味着手机的AI能力由LPDDR5X内存容量、NPU算力和功耗预算共同决定,稳定落地的口径几乎都收敛在7B附近。7B模型经INT4量化后约需4GB内存,处于旗舰手机12-16GB LPDDR5X的可用范围内;联发科明确天玑9300的APU 790可以约20 tokens/s的速度推理7B模型,OPPO将7B端侧模型部署用于超过100项AI功能,高通虽然不公布参数量,但其AI引擎的实际对标量级相同。再往上,对手机内存容量和散热的要求就会超出大多数旗舰机的实际边界。
这个数字对芯片行业的含义随之改变。过去评判NPU的标准是峰值TOPS,算力越高越好。但当整机厂开始主动用小模型替换大模型,NPU真正需要做的事情是:在750mA的功耗预算下,稳定运行一个长上下文的推理任务,而不是冲峰值跑分。
片上SRAM用于KV Cache的空间、内存带宽的调度效率、INT4/FP8低精度格式的原生支持,这些指标,比TOPS数字更接近用户实际感受到的AI体验。
推理的瓶颈不只在NPU算力,也在存储带宽能不能及时把模型权重喂进去。10.8GB/s的读取速度直接影响模型加载速度和KV Cache刷新效率,这和NPU的TOPS数字一样决定用户感受到的AI响应速度。
存储厂商已经意识到这件事。三星6月23日发布的UFS 5.0方案,顺序读取速度达到10.8GB/s,是上一代UFS 4.1的两倍以上,整体能效提升超40%。三星把这款产品定位为“端侧AI的核心底层基础设施”。但UFS 5.0要到今年四季度才开始规模量产,意味着它将出现在明年的旗舰里,不是今年的发布会上。Counterpoint的分析指出,存储约束是GenAI手机目前被锁在400美元以上价位的核心原因之一。UFS 5.0能带来性能跨越,但初期成本不会低,高端先受益的格局短期内不会改变。
手机AI竞争的重心,正在从设备本身转向设备上运行的AI模型层。Counterpoint的研究指出,在高端市场,Google Gemini正在成为这一层的核心,Gemini支撑着苹果重建的Siri,是三星Galaxy AI的基础,也驱动着中国主要手机品牌海外版本的AI能力。OEM厂商在模型之上负责编排逻辑、用户体验和生态整合,这才是下一阶段竞争真正发生的地方。
端侧AI的竞争逻辑变了,但有一件事没变,旗舰机产品在处理器层面已经没有差异化空间。两款手机可以用同一颗SoC,但发布会不能讲同一件事。差异化只能往SoC管不到的地方找:影像算法、游戏体验、续航调度,这些体验层的竞争,SoC的通用设计天然覆盖不到最优解。
整机厂的选择是:自己造一颗芯片,把SoC做不好的那件事做到极致。
自从苹果用A系列拉开了和安卓的性能代差,“自研SoC”就成了手机行业的终极想象。造芯的手机厂许多,但真是的数据表明,正面开发一颗能和高通、联发科竞争的旗舰SoC,是没有性价比的选择。
手机厂后来想清楚的事情是:不需要替代骁龙,只需要在骁龙覆盖不到的地方造一颗小芯片。
iQOO的Q2电竞芯片是一个标准样本。它不碰CPU、不碰GPU、不碰NPU,只做游戏画面的超分和超帧。骁龙8 Gen 5的Adreno GPU本来也能做这件事,但同时还要处理系统图形渲染、UI合成和其他负载,超分的效果和功耗不是最优解。Q2把这个任务单独抠出来,用专用芯片做到极致,主SoC反而能腾出资源保帧率稳定。
小米的自研影像芯片逻辑相同,不是替代骁龙的ISP,而是在ISP完成基础处理之后,承接计算摄影、多帧合成、长焦画质优化这些对算力和延迟要求更高的任务。两颗芯片分工,比一颗芯片全包效率更高,发热更少。
这条路线的性价比,远高于自研SoC。协处理器的功能边界清晰,开发周期短;大量采用12/16/28nm成熟工艺,流片成本只是先进制程的零头;不需要配套完整的编译器和驱动生态。一颗游戏芯片从立项到量产,可以卡在SoC换代周期之间完成,比等高通在下一代骁龙里更新GPU快一到两年。
这样的趋势对芯片行业的影响是双向的。成熟制程的专用芯片需求在增加,12/16/28nm产线的稼动率因此受益。与此同时,高通和联发科被迫适应这个趋势:整机厂的协处理器要顺畅接入SoC的数据通路,就需要开放更多底层接口,合作模式从“卖一颗芯片”变成“提供一个可以协同的平台”。
OpenAI计划在2028年推出一款以AI为核心的手机,合作造芯片的是高通和联发科。这个选择值得注意。全球最大的AI公司决定做手机时,没有试图自研SoC,而是直接找了两家现有的手机芯片平台。这再一次说明SoC这层不是重点,抢占Gemini已经在占据的模型层,才是它真正的目标。
这和手机行业正在发生的事情指向同一个方向:SoC正在成为基础设施,真正的差异化竞争分散到了三个层面,AI模型层、协处理器层和应用层。
AI模型层的竞争,是谁的端侧模型在750mA功耗下跑得更久,谁的编排逻辑让用户真正用起来;协处理器层的竞争,是谁能把游戏超分、影像处理这些特定场景做到极致;应用层的竞争,是谁能让在端侧AI真正改变用户的使用习惯。
手机芯片的需求,一端被AI推着往效率走,另一端被成本推着往整合走。两个方向都在压缩旗舰SoC的独占价值,也在给成熟制程、本土玩家打开新的空间。
未来手机的差价将来自厂商的创新力,AI的落地速度,这些真正带来突破的关键点。

