← 首页
2026 / 02 / 07 · 周六

日报

记录不判断 · 收录范围:2026-02-07
9
条目
1
重大
0
新信号
今日头条

推理成本三年狂跌1000倍,GPT-4等效模型降至0.4美元/百万token 重大

据报道,大模型推理成本在过去三年内从每百万token 20美元降至0.4美元,跌幅超99.8%。GPT-4等效推理能力现已商用化,价格门槛低至百分之几美分。此轮成本内爆源于竞争加剧、量化技术成熟、端侧部署方案涌现,将重塑AI产业供给侧竞争格局。

industry analysis,2026-02-07
L5 应用与终端 2 条

Meta与EssilorLuxottica就Ray-Ban眼镜利润分配产生分歧

财报期间传出Meta与EssilorLuxottica因Ray-Ban AI眼镜毛利分配比例存在争议,Meta要求提升利润分配至38%,EssilorLuxottica坚持保持35%现状。眼镜硬件销量虽突破700万,但终端成本控制与供应链毛利率矛盾突出。

Bloomberg,2026-02-07

小米Redmi Turbo 5/Note 15系列搭AI传感器上市

小米发布Redmi Turbo 5和Note 15系列手机,搭载小米自研AI传感芯片,支持本地AI图像处理和动作识别,续航相比上代提升12%。小米宣称AI传感器集成度业界首次在千元档实现。

小米官方发布,2026-02-07
L4 模型 1 条

推理成本再破新低,GPT-4等效性能跌至0.4美元/M tokens

行业统计数据表明,大模型推理成本在过去三年内经历断崖式下跌,从2023年底的20美元/百万token降至当前0.4美元/百万token,跌幅达98%。驱动因素包括:模型量化技术成熟(4-bit整数化损失<1%)、多厂商竞争加剧、端侧部署方案涌现。

industry analysis,2026-02-07
L3 基础设施 1 条

CoreWeave融资85亿美元GPU设施,AI基础设施融资模式创新

AI基础设施初创CoreWeave宣布完成85亿美元融资,用于建设美国东西部GPU数据中心,融资方式采用"GPU抵押财务"模型,打破传统设备融资思路。CoreWeave未来三年计划新增NVIDIA GPU超100万张。

CoreWeave官方,2026-02-07
L2 芯片 2 条

联发科首席执行官:存储成本已占芯片成本50%,AI芯片拟占2026营收20%

联发科CEO Rick Tsai在财报会上披露,HBM和高端DRAM成本已占XPU(AI芯片)物料成本的50%,相比2024年同比增长2倍。联发科2026年AI芯片营收目标占总营收比例达20%,正加倍投资云端AI芯片和ASICs设计。

联发科财报电话会,2026-02-07

联发科数据中心芯片投资翻倍,转向AI ASIC设计

联发科公开投资计划,2026年数据中心业务投入相比2025年增加100%,重点围绕AI专用芯片(AI ASIC)和推理加速器开发。与NVIDIA、Groq形成差异化竞争,主要方向为语言模型推理、多模态处理。

联发科2026财报,2026-02-07
L1 能源 1 条

NTT通过AI优化冷却系统降能耗20%,但仍被算力需求压倒

日本NTT东日本数据中心采用AI冷却优化系统,单个机房能耗相比传统模式下降20%,但由于AI工作负载增加,整体能耗仍同比增长18%。能源成本已成为数据中心运营第一大成本项。

NTT Press Release,2026-02-07
宏观 1 条

苹果2025年关税负担达8-11亿美元/季度,供应链成本压力持续

苹果财报披露,2025年全年因美国关税新政承担的额外成本约32-44亿美元,相当于每季度8-11亿美元,主要来自中国进口关税上调和越南供应链税收变化。成本压力部分转嫁给消费者和供应商。

Apple财报,2026-02-07
科技原声
"
The inference cost drop is fundamentally changing where and how AI workloads run. Edge deployment is no longer a compromise—it's the economically optimal choice.
推理成本下跌从根本上改变了AI工作负载在哪里、如何运行。边缘部署不再是一种妥协,而是经济最优的选择。
Jensen Huang,NVIDIA CEO,GTC 2026主题演讲,2026-02-06
信号跟踪
推理成本快速下降
百万token单价从20美元三年跌至0.4美元,跌幅98%
升级
全球手机出货量下调+存储涨价
联发科披露存储占芯片成本50%,成本约束增强
升级
推理专用芯片分化
联发科、Groq等竞争对手加速推理芯片设计,GPU推理成本优化空间显现
延续
AI Agent终端落地
小米Redmi系列搭AI传感器,端侧AI能力进一步内嵌
延续