← 首页
全景
洞察
复盘
趋势
竞品
信号
下月
AI DEVICE ECOSYSTEM · MONTHLY
Vol.2026.01
01
AI 终端生态
月报
判断与驱动力 · 覆盖周期 2026-01-01 至 2026-01-31(W01-W05,5期周报)
3
核心趋势
1
预测复盘
4
下月关注
MONTH AT A GLANCE
本月全景
8 条
▾
2026 · 1
01-04
荣耀官方确认Robot Phone在CES首秀
竞品
01-08
小米官宣"大融合"战略
竞品
01-13
美台芯片框架达成
技术
01-14
特朗普政府第232号公告
技术
01-15
Anthropic Claude Cowork单周激活
320万
用户
算力
01-17
Apple与Google签署多年协议
竞品
01-26
Synopsys CEO预警内存短缺贯穿2026-2027年
技术
01-29
微软Maia 200进入生产环境规模部署
技术
宏观
算力
模型
技术
竞品
CORE INSIGHT
核心判断
2026年开局以"Agent功能加速 × BOM/能源成本压制"双主线锁定全年节奏——技术红利与供应链硬约束首次正面对撞。
五层蛋糕月度变化
L5 应用与终端
四家厂商CES/Davos同步亮牌Agent,小米大融合
$27.7
B投入,Apple签Gemini年
10亿
↑
Agent竞速启动,6-12个月窗口锁死
L4 模型
DeepSeek R1冲击,Llama 4开源端侧<500ms,Gemma 3下探270M,开源六强格局
↑
端侧模型选择面扩大,议价上升
L3 基础设施
Stargate
$500
B启动,云厂商2026 capex
$
6000亿
+36%
,AWS/Google推理边际逼近硬件极限
↑
云端推理成本崩塌反压端侧"成本必要性"
L2 芯片
NVIDIA Rubin推理成本降
10倍
,微软Maia 200量产,三家云自研推理芯片商用
↑
推理芯片分化,端侧NPU路径需重估
L1 能源
核能长约
+23%
至
$8
/MWh,IEA上修数据中心用电55→84GW,微软Meta签大额核电
→
能源成为算力扩张硬约束
L0 宏观环境
特朗普232号公告AI芯片加征
25%
关税,DRAM合约+55
-60%
,美台
$
2500亿
投资协议
↓
BOM成本上压,供应链二次重组
RETROSPECTIVE
上月预测复盘
1 条
▾
—
预测
无(v8首月,无上月预测可对照)
实际
—
自2026年2月起本栏正式启用
复盘小结
1月作为v8基线月,无上月预测可校验;2月起正式启用判断质量自审计机制。
KEY TRENDS
核心趋势
3 条
趋势 1
四大厂商同步亮牌——Agent终端进入产品化竞速
核心判断
置信度 高
Agent能力进入工程化拐点,行业从"模型采购"集体进入"系统集成"阶段,产品化竞速窗口锁定6-12个月。
W
What · 关键事实
2026-01-04:荣耀官方确认Robot Phone在CES首秀,配备3轴万向节和可旋转摄像头,获CNet"最具未来感技术"评价,MWC 2026计划展示完整功能演示和商用时间表
2026-01-08:小米官宣"大融合"战略,未来5年研发投入
200亿
元(约
$27.7
B),首次将自研芯片+HyperOS 3+大模型整合到单一产品,同步开源MiMo-V2-Flash边缘推理模型
2026-01-15:Anthropic Claude Cowork单周激活
320万
用户,覆盖文件管理、表格处理、邮件草稿等50+场景,高频任务速度提升5-
10倍
,验证端侧Agent需求规模化
2026-01-17:Apple与Google签署多年协议,Gemini成为新Siri核心引擎,年约
10亿
美元,Siri从"语音助手"演进为"多步骤任务代理",HomePod mini 2为首发平台
2026-01-21至01-23:Davos WEF期间Samsung/Apple/Huawei/Honor四家同步展示AI能力,从单点功能升级为系统级集成,三星本地处理覆盖
80%
任务
2026-01-28至01-31:企业软件分析机构预期2026年
90%
企业将部署Agent类应用并实现可量化收益
Y
Why · 驱动力
Agent能力进入工程化拐点
技术,加速,中期结构性
Cowork单周
320万
激活说明用户对"自动执行多步任务"的需求已被验证,技术从演示走向真实生产力。这把所有手机厂商从"模型采购方"推进到"系统集成方"——谁能把模型、操作系统、硬件传感器和第三方应用打通谁就赢,单纯堆参数没用。
头部厂商策略分化制造路径锚点
市场,转向,6-12个月窗口
小米走"自研芯片+OS+模型"全栈整合,Apple走"系统集成+外部模型授权"开放路径,三星走"本地处理优先",三种路径同期出现意味着终端Agent的最优架构尚未收敛。
反向力量
模型采购成本快速下降稀释自研价值
市场,对冲,长期
Apple这种自研能力最强的厂商都选择Gemini授权,说明大模型商品化速度让"自研"的护城河迅速变窄——全栈路径的优势被稀释,集成路径并非劣势。
S
So What · 对荣耀
锁定Agent架构选型
Q1内决策自研vs外采路线,Q2前给出Robot Phone工程样机
押注集成路径差异化
借Claude Cowork等成熟Agent框架快速补齐,避免重投自研模型
MWC兑现可量产证据
工程样机+供应链就位+商用时间表三项必须同时给出
抢占CES形象转化窗口
Q1结束前完成Robot Phone开发者生态预热
趋势 2
推理成本三重崩塌——端侧"成本必要性"叙事失效
核心判断
置信度 高
推理算法+硬件+商业三层同步降本,云端推理成本逼近硬件极限,端侧AI从"成本洼地"转为"差异化选择"。
W
What · 关键事实
2026-01-04至01-05:NVIDIA在CES官宣Rubin平台,相比Blackwell推理成本降
10倍
、MoE训练成本降
4倍
,三大云厂商和Oracle确认部署,
$1
T订单管道覆盖2026-2027
2026-01-11至01-13:研究机构数据交叉验证,GPT-4级推理成本3年从
$400
+/百万token降至
$0.40
/百万token,降幅
99.9%
;DeepSeek Engram架构注意力计算成本降
50%
2026-01-19至01-23:Meta Llama 4开源发布,4-bit量化版本可在高端手机<500ms延迟推理;Google Gemma 3下探至270M参数;与GPT-4o/Gemini 2.0误差<
3%
2026-01-22至01-23:AWS Claude推理降至
$0.075
/百万token、Google Gemini约
$0.05
、Microsoft订阅制约
$0.01
/token
2026-01-27至01-29:DeepSeek R1登顶iOS App Store,三天下载增
2.6倍
,
550万美元
训练成本声称冲击产业共识,NVIDIA单日跌
17%
蒸发
600亿
美元市值
2026-01-29:微软Maia 200进入生产环境规模部署,AWS/Google/Microsoft三家自研推理芯片均已商用
Y
Why · 驱动力
推理算法+芯片+商业三轴同步降本
技术×市场×资本,加速,中期结构性
NVIDIA硬件层降
10倍
、Engram架构层降
50%
、云厂商API层降至
$0.01
-0.05量级,三层同时压低推理成本,使"端侧能省钱"的传统论证不再成立——云端比本地便宜的场景已经出现。
开源模型质量收敛打破单一供应商壁垒
技术,转向,长期
Llama 4与GPT-4o差距<
3%
、Gemma 3端侧可跑、Llama量化版本500ms延迟,意味端侧也能跑接近闭源SOTA的模型。
反向力量
能源和内存约束设置降本天花板
资源,对冲,中期
HBM/DRAM Q1暴涨55
-60%
、核能合约价上升
20%
,硬件成本结构性上行;推理边际成本已逼近GPU+电力的硬件极限,进一步降价空间在2026下半年会放缓。
S
So What · 对荣耀
切换端侧叙事
立刻去除Robot Phone和Magic系列的"省钱"话术,改为"隐私/低延迟/离线可用"
重置架构权重
从"端侧优先"转为"场景最优"——通话翻译/隐私拍照/健康数据押端侧,长上下文Agent任务走端云协同
拓宽端侧模型选型
评估Llama 4 / Gemma 3 / Phi-4三家端侧版本,Q2前完成基准测试
锁定差异化场景
Q1末发布端侧AI白皮书,明确"三张牌"叙事抢占话语权
趋势 3
存储+能源+关税三重硬约束——硬件成本结构性上行
核心判断
置信度 高
DRAM Q1环比+55
-60%
、核能合约价
+20%
、特朗普
25%
关税三重供应链冲击同时落地,2026年终端BOM成本压力贯穿全年。
W
What · 关键事实
2026-01-03至01-10:TrendForce预测Q1 DRAM合约价环比暴涨55
-60%
,HBM3E/HBM4合约价同步上调
20%
、单颗成本增
$1200
-1500
2026-01-14:特朗普政府第232号公告,对NVIDIA H200/AMD MI325X等AI芯片加征
25%
关税自2月1日生效;高盛把2026云厂商资本开支增速预期由
+36%
下调至
+28%
2026-01-13:美台芯片框架达成,台企承诺
$
2500亿
投资换取关税优惠,TSMC产能在中美两地分配比例面临重组
2026-01-20至01-21:Stargate
$500
B计划正式启动(OpenAI/SoftBank/Oracle三方),获白宫背书,初期
$100
B、目标10GW核心功率
2026-01-21至01-23:美国核能长期合约价格从
$6.5
/MWh升至
$8
/MWh涨幅
23%
;IEA预测全球数据中心用电2年内从55GW增至84GW
2026-01-26:Synopsys CEO预警内存短缺贯穿2026-2027年,数据中心今年消耗全球
70%
内存产能,挤压消费类产品
Y
Why · 驱动力
AI数据中心抢占消费内存产能
资源,加速,中期结构性
数据中心吃掉全球
70%
内存产能,HBM和标准DRAM共用前端晶圆产能,AI需求直接挤压手机BOM。新产能从规划到投产要"最少两年",是2026-2027年的硬约束而非短期波动。
关税政策摆钟制造供应链不确定性
政策,转向,短期脉冲叠加长期重组
特朗普
25%
关税启动+众议院《AI Overwatch Act》对冲+美台
$
2500亿
投资换关税框架,三个方向同时博弈,意味芯片采购需要准备多套备选方案。
能源约束从成本问题升级为可行性问题
资源,加速,长期结构性
核电合约价上涨
23%
、新建数据中心20
-25%
成本流向电力和冷却,AI基础设施扩张速度从此被发电产能直接卡住。
反向力量
推理成本下降可部分对冲BOM压力
技术,对冲,中期
云端API价格战和Rubin降
10倍
可减少端侧大内存压力——如果产品定位允许"端云协同",可在某些SKU上用云推理替代本地大模型,但通话/隐私/离线场景无法绕开,对冲不完全。
S
So What · 对荣耀
启动供应链锁价谈判
Q1内完成与SK Hynix/Samsung的Q2-Q3锁价
拆分旗舰与中低端策略
旗舰用ASP消化BOM上行,中低端用规格调整对冲
加大$800+高端兵力
N系列旗舰化方向正确,借产业整体涨价打开定价空间
锁定芯片备选方案
Q1末前完成多套关税对冲采购预案,应对2月起的政策摆钟
COMPETITOR THREAT
竞品威胁矩阵
4 家
▾
华为
威胁 高
窗口 即刻
Davos展示端侧多模态模型与设备联动Agent,Pura 90系列预告4月中旬发布
Agent路径已实质推进,跨设备协同领先
小米
威胁 高
窗口 3月
大融合战略官宣,5年
200亿
研发,自研芯片+HyperOS 3+大模型三合一
全栈路径明确,最直接的国产竞争者;但全栈成本高、收敛慢
苹果
威胁 中
窗口 6月
与Google签Gemini多年协议(年约
10亿
美元),新Siri春季上线
自研AI路线实质放弃,转向集成;短期为竞品打开窗口
三星
威胁 高
窗口 即刻
Z TriFold上市
$2899
,Vision AI Companion家电平台亮相,S26系列2/25发布
家电协同代差领先,本地处理覆盖80%任务
SIGNAL EVOLUTION
信号演变
在动 8 · 静默 0
▾
本月在动
AI Agent终端落地
四大厂商同步亮牌,Claude Cowork单周激活
320万
验证用户需求
新出现
推理成本快速下降
Rubin降
10倍
+开源模型质量收敛+云端API
$0.01
-0.05量级,三轴同步降本
加强
推理专用芯片分化
微软Maia 200生产部署,AWS/Google/微软三家自研推理芯片商用
加强
开源模型梯队完成
Llama 4 / Gemma 3 / Phi-4 / SmolLM2全尺寸覆盖,与闭源差距<
3%
新出现
全球存储涨价
DRAM Q1环比+55
-60%
、HBM4合约价
+20%
,贯穿2026-2027年结构性短缺
加强
关税与AI芯片管制
特朗普
25%
关税生效,众议院AI Overwatch Act对冲,政策摆钟开启
新出现
AI数据中心能源约束
核能合约价
+23%
,IEA上调耗电预测,能源升级为可行性问题
加强
苹果转向开放平台
与Google签Gemini多年协议,自研AI路线实质放弃
新出现
NEXT MONTH
下月关注
4 项
1
MWC 2026 Robot Phone工程样机与商用时间表
事件
Robot Phone在MWC 2026(3月初)展示从CES概念走向产品化
2
特朗普关税政策摆钟与众议院AI Overwatch Act
事件
2月众议院投票AI Overwatch Act,可能逆转特朗普放宽决定
3
三星S26系列发布(2/25)和Apple新Siri春季上线
事件
S26是2026安卓旗舰AI集成的标准参考,新Siri定义Agent功能基准
4
DRAM/HBM Q2合约价走势
事件
Q1已暴涨55-60%,Q2能否企稳决定毛利率压力释放节奏
↑