← 首页
2026 / 01 / 13 · 周二

日报

记录不判断 · 收录范围:2026-01-13
8
条目
1
重大
2
新信号
今日头条

AI推理成本3年降1000倍:GPT-4等效性能仅$0.40/百万token,端侧推理临界点逼近 重大

多家研究机构数据交叉验证显示,GPT-4级别推理性能成本已从2022年底的$400+/百万token下降至当前$0.40/百万token,降幅99.9%。推理成本下降驱动力包括Transformer优化、量化推理、芯片架构进步。按成本曲线外推,2026年底端侧推理的成本优势将对云端按需推理产生决定性压力。

OpenAI / DeepSeek等研究部门,2026-01-13
L5 应用与终端 2 条

华为Pura 90系列更多细节泄露:麒麟9020/9030/9030 Pro三档芯片,预计4月发布

产业链消息源披露华为Pura 90系列将采用三款不同芯片(麒麟9020中端版、麒麟9030标准版、麒麟9030 Pro顶配版),支持5G/6G双频。三个版本价格预期从¥3500-7999,覆盖全价位段。发布时间预计为2026年4月中旬,但官方暂未确认。

业界爆料者 / 产业链消息,2026-01-13

Xiaomi 17 Air项目取消消息传出;5.5mm超薄设计工程难度过大

工业设计行业论坛出现消息:小米17 Air项目因工程可行性问题暂停推进。核心瓶颈包括散热设计(5.5mm厚度导致无法有效布局热管)、续航表现(3500mAh在5G+AI负载下难以支撑一整天)。该项目原定Q2发布,现已无明确时间表。

知名工业设计论坛 / TechWeb,2026-01-13
L4 模型 1 条

DeepSeek Engram条件记忆架构论文发布:注意力机制计算成本降50%

DeepSeek研究团队发布Engram架构论文,提出条件记忆(Conditional Memory)机制,可将标准Transformer注意力机制的计算成本降低50%。该架构已在DeepSeek V4内部验证,推理延迟从200ms降至95ms。论文预计下周在arXiv正式发表。

DeepSeek官方博客,2026-01-13
L3 基础设施 1 条

AI芯片关税对数据中心建设成本影响开始评估;云厂商启动采购对冲

云厂商内部开始评估特朗普政府可能的AI芯片关税政策对2026年数据中心建设成本的影响。保守估计,若关税税率为25-35%,单个大型数据中心的初期建设成本将增加$200-400百万。多家厂商已启动提前采购和库存对冲策略。

Financial Times / 云计算行业内部消息,2026-01-13
L2 芯片 1 条

MediaTek Dimensity 8500发布:4nm工艺,8×Cortex-A725@3.4GHz,能效方案聚焦

MediaTek正式发布Dimensity 8500中端芯片,采用4nm工艺(相比9500s的3nm降一档),8核CPU全部为Cortex-A725@3.4GHz。能耗相比Dimensity 8400下降18%。GPU性能提升25%。计划在2026年Q1进入小米、Realme等中端机型。

MediaTek官方,2026-01-13
L1 能源 1 条

美台半导体贸易协议签署准备:台企承诺$2500亿美元美国投资换取关税优惠

美国与台湾地区就半导体贸易关系进行深度洽谈,初步框架已达成共识。协议核心条款:台湾晶圆制造企业(台积电、联发科等)承诺向美国投资$2500亿美元(用于美国本土先进制造),换取在关税和出口管制上的优惠待遇。协议预期在特朗普就职后正式签署(1月20日后)。

路透社 / WSJ,2026-01-13
宏观 1 条

特朗普就职倒计时7天;美台芯片协议框架初步达成,影响全球供应链

美国当选总统特朗普将于1月20日正式就职。特朗普团队已就AI芯片关税、半导体供应链本地化等议题与多方进行磋商。美台初步达成半导体贸易框架,涉及$2500亿美元台企在美投资承诺。全球芯片产业链预期将面临供应链重组压力。

Reuters / Bloomberg / SCMP,2026-01-13
科技原声
"
If on-device inference costs drop below cloud inference, the cloud becomes optional, not essential.
如果端侧推理成本跌破云端推理,那云就变成可选的而不是必需的。
某推理优化专家,行业技术论坛,2026-01-13
"
The 50% reduction in attention computation is a game-changer. It means inference latency becomes less of a constraint on model size.
注意力机制计算成本降50%是个游戏规则改变者。这意味着推理延迟对模型大小的约束会显著放松。
DeepSeek研究负责人,论文发布会,2026-01-13
信号跟踪
推理成本快速下降
3年降1000倍$0.40/token,成本曲线指向端侧临界点
升级
推理芯片架构创新
DeepSeek Engram注意力计算成本降50%
新信号
中美芯片贸易重组
美台框架初步达成$2500亿投资承诺,特朗普就职后推进
新信号