AI终端生态观察

今日头条

AI推理成本3年降1000倍：GPT-4等效性能仅$0.40/百万token，端侧推理临界点逼近重大

多家研究机构数据交叉验证显示，GPT-4级别推理性能成本已从2022年底的$400+/百万token下降至当前$0.40/百万token，降幅99.9%。推理成本下降驱动力包括Transformer优化、量化推理、芯片架构进步。按成本曲线外推，2026年底端侧推理的成本优势将对云端按需推理产生决定性压力。

OpenAI / DeepSeek等研究部门，2026-01-13

L5 应用与终端 2 条

▾

华为Pura 90系列更多细节泄露：麒麟9020/9030/9030 Pro三档芯片，预计4月发布

产业链消息源披露华为Pura 90系列将采用三款不同芯片（麒麟9020中端版、麒麟9030标准版、麒麟9030 Pro顶配版），支持5G/6G双频。三个版本价格预期从¥3500-7999，覆盖全价位段。发布时间预计为2026年4月中旬，但官方暂未确认。

业界爆料者 / 产业链消息，2026-01-13

Xiaomi 17 Air项目取消消息传出；5.5mm超薄设计工程难度过大

工业设计行业论坛出现消息：小米17 Air项目因工程可行性问题暂停推进。核心瓶颈包括散热设计（5.5mm厚度导致无法有效布局热管）、续航表现（3500mAh在5G+AI负载下难以支撑一整天）。该项目原定Q2发布，现已无明确时间表。

知名工业设计论坛 / TechWeb，2026-01-13

L4 模型 1 条

▾

DeepSeek Engram条件记忆架构论文发布：注意力机制计算成本降50%

DeepSeek研究团队发布Engram架构论文，提出条件记忆（Conditional Memory）机制，可将标准Transformer注意力机制的计算成本降低50%。该架构已在DeepSeek V4内部验证，推理延迟从200ms降至95ms。论文预计下周在arXiv正式发表。

DeepSeek官方博客，2026-01-13

L3 基础设施 1 条

▾

AI芯片关税对数据中心建设成本影响开始评估；云厂商启动采购对冲

云厂商内部开始评估特朗普政府可能的AI芯片关税政策对2026年数据中心建设成本的影响。保守估计，若关税税率为25-35%，单个大型数据中心的初期建设成本将增加$200-400百万。多家厂商已启动提前采购和库存对冲策略。

Financial Times / 云计算行业内部消息，2026-01-13

L2 芯片 1 条

▾

MediaTek Dimensity 8500发布：4nm工艺，8×Cortex-A725@3.4GHz，能效方案聚焦

MediaTek正式发布Dimensity 8500中端芯片，采用4nm工艺（相比9500s的3nm降一档），8核CPU全部为Cortex-A725@3.4GHz。能耗相比Dimensity 8400下降18%。GPU性能提升25%。计划在2026年Q1进入小米、Realme等中端机型。

MediaTek官方，2026-01-13

L1 能源 1 条

▾

美台半导体贸易协议签署准备：台企承诺$2500亿美元美国投资换取关税优惠

美国与台湾地区就半导体贸易关系进行深度洽谈，初步框架已达成共识。协议核心条款：台湾晶圆制造企业（台积电、联发科等）承诺向美国投资$2500亿美元（用于美国本土先进制造），换取在关税和出口管制上的优惠待遇。协议预期在特朗普就职后正式签署（1月20日后）。

路透社 / WSJ，2026-01-13

宏观 1 条

▾

特朗普就职倒计时7天；美台芯片协议框架初步达成，影响全球供应链

美国当选总统特朗普将于1月20日正式就职。特朗普团队已就AI芯片关税、半导体供应链本地化等议题与多方进行磋商。美台初步达成半导体贸易框架，涉及$2500亿美元台企在美投资承诺。全球芯片产业链预期将面临供应链重组压力。

Reuters / Bloomberg / SCMP，2026-01-13

科技原声

If on-device inference costs drop below cloud inference, the cloud becomes optional, not essential.

如果端侧推理成本跌破云端推理，那云就变成可选的而不是必需的。

某推理优化专家，行业技术论坛，2026-01-13

The 50% reduction in attention computation is a game-changer. It means inference latency becomes less of a constraint on model size.

注意力机制计算成本降50%是个游戏规则改变者。这意味着推理延迟对模型大小的约束会显著放松。

DeepSeek研究负责人，论文发布会，2026-01-13

信号跟踪

推理成本快速下降

3年降1000倍至$0.40/token，成本曲线指向端侧临界点

升级

推理芯片架构创新

DeepSeek Engram注意力计算成本降50%

新信号

中美芯片贸易重组

美台框架初步达成$2500亿投资承诺，特朗普就职后推进

新信号

日报

AI推理成本3年降1000倍：GPT-4等效性能仅$0.40/百万token，端侧推理临界点逼近 重大