AI终端生态观察

今日头条

推理成本三年狂跌1000倍，GPT-4等效模型降至0.4美元/百万token 重大

据报道，大模型推理成本在过去三年内从每百万token 20美元降至0.4美元，跌幅超99.8%。GPT-4等效推理能力现已商用化，价格门槛低至百分之几美分。此轮成本内爆源于竞争加剧、量化技术成熟、端侧部署方案涌现，将重塑AI产业供给侧竞争格局。

industry analysis，2026-02-07

L5 应用与终端 2 条

▾

Meta与EssilorLuxottica就Ray-Ban眼镜利润分配产生分歧

财报期间传出Meta与EssilorLuxottica因Ray-Ban AI眼镜毛利分配比例存在争议，Meta要求提升利润分配至38%，EssilorLuxottica坚持保持35%现状。眼镜硬件销量虽突破700万，但终端成本控制与供应链毛利率矛盾突出。

Bloomberg，2026-02-07

小米Redmi Turbo 5/Note 15系列搭AI传感器上市

小米发布Redmi Turbo 5和Note 15系列手机，搭载小米自研AI传感芯片，支持本地AI图像处理和动作识别，续航相比上代提升12%。小米宣称AI传感器集成度业界首次在千元档实现。

小米官方发布，2026-02-07

L4 模型 1 条

▾

推理成本再破新低，GPT-4等效性能跌至0.4美元/M tokens

行业统计数据表明，大模型推理成本在过去三年内经历断崖式下跌，从2023年底的20美元/百万token降至当前0.4美元/百万token，跌幅达98%。驱动因素包括：模型量化技术成熟（4-bit整数化损失<1%）、多厂商竞争加剧、端侧部署方案涌现。

industry analysis，2026-02-07

L3 基础设施 1 条

▾

CoreWeave融资85亿美元GPU设施，AI基础设施融资模式创新

AI基础设施初创CoreWeave宣布完成85亿美元融资，用于建设美国东西部GPU数据中心，融资方式采用"GPU抵押财务"模型，打破传统设备融资思路。CoreWeave未来三年计划新增NVIDIA GPU超100万张。

CoreWeave官方，2026-02-07

L2 芯片 2 条

▾

联发科首席执行官：存储成本已占芯片成本50%，AI芯片拟占2026营收20%

联发科CEO Rick Tsai在财报会上披露，HBM和高端DRAM成本已占XPU（AI芯片）物料成本的50%，相比2024年同比增长2倍。联发科2026年AI芯片营收目标占总营收比例达20%，正加倍投资云端AI芯片和ASICs设计。

联发科财报电话会，2026-02-07

联发科数据中心芯片投资翻倍，转向AI ASIC设计

联发科公开投资计划，2026年数据中心业务投入相比2025年增加100%，重点围绕AI专用芯片（AI ASIC）和推理加速器开发。与NVIDIA、Groq形成差异化竞争，主要方向为语言模型推理、多模态处理。

联发科2026财报，2026-02-07

L1 能源 1 条

▾

NTT通过AI优化冷却系统降能耗20%，但仍被算力需求压倒

日本NTT东日本数据中心采用AI冷却优化系统，单个机房能耗相比传统模式下降20%，但由于AI工作负载增加，整体能耗仍同比增长18%。能源成本已成为数据中心运营第一大成本项。

NTT Press Release，2026-02-07

宏观 1 条

▾

苹果2025年关税负担达8-11亿美元/季度，供应链成本压力持续

苹果财报披露，2025年全年因美国关税新政承担的额外成本约32-44亿美元，相当于每季度8-11亿美元，主要来自中国进口关税上调和越南供应链税收变化。成本压力部分转嫁给消费者和供应商。

Apple财报，2026-02-07

科技原声

The inference cost drop is fundamentally changing where and how AI workloads run. Edge deployment is no longer a compromise—it's the economically optimal choice.

推理成本下跌从根本上改变了AI工作负载在哪里、如何运行。边缘部署不再是一种妥协，而是经济最优的选择。

Jensen Huang，NVIDIA CEO，GTC 2026主题演讲，2026-02-06

信号跟踪

推理成本快速下降

百万token单价从20美元三年跌至0.4美元，跌幅98%

升级

全球手机出货量下调+存储涨价

联发科披露存储占芯片成本50%，成本约束增强

升级

推理专用芯片分化

联发科、Groq等竞争对手加速推理芯片设计，GPU推理成本优化空间显现

延续

AI Agent终端落地

小米Redmi系列搭AI传感器，端侧AI能力进一步内嵌

延续

日报