据报道,大模型推理成本在过去三年内从每百万token 20美元降至0.4美元,跌幅超99.8%。GPT-4等效推理能力现已商用化,价格门槛低至百分之几美分。此轮成本内爆源于竞争加剧、量化技术成熟、端侧部署方案涌现,将重塑AI产业供给侧竞争格局。
财报期间传出Meta与EssilorLuxottica因Ray-Ban AI眼镜毛利分配比例存在争议,Meta要求提升利润分配至38%,EssilorLuxottica坚持保持35%现状。眼镜硬件销量虽突破700万,但终端成本控制与供应链毛利率矛盾突出。
小米发布Redmi Turbo 5和Note 15系列手机,搭载小米自研AI传感芯片,支持本地AI图像处理和动作识别,续航相比上代提升12%。小米宣称AI传感器集成度业界首次在千元档实现。
行业统计数据表明,大模型推理成本在过去三年内经历断崖式下跌,从2023年底的20美元/百万token降至当前0.4美元/百万token,跌幅达98%。驱动因素包括:模型量化技术成熟(4-bit整数化损失<1%)、多厂商竞争加剧、端侧部署方案涌现。
AI基础设施初创CoreWeave宣布完成85亿美元融资,用于建设美国东西部GPU数据中心,融资方式采用"GPU抵押财务"模型,打破传统设备融资思路。CoreWeave未来三年计划新增NVIDIA GPU超100万张。
联发科CEO Rick Tsai在财报会上披露,HBM和高端DRAM成本已占XPU(AI芯片)物料成本的50%,相比2024年同比增长2倍。联发科2026年AI芯片营收目标占总营收比例达20%,正加倍投资云端AI芯片和ASICs设计。
联发科公开投资计划,2026年数据中心业务投入相比2025年增加100%,重点围绕AI专用芯片(AI ASIC)和推理加速器开发。与NVIDIA、Groq形成差异化竞争,主要方向为语言模型推理、多模态处理。
日本NTT东日本数据中心采用AI冷却优化系统,单个机房能耗相比传统模式下降20%,但由于AI工作负载增加,整体能耗仍同比增长18%。能源成本已成为数据中心运营第一大成本项。
苹果财报披露,2025年全年因美国关税新政承担的额外成本约32-44亿美元,相当于每季度8-11亿美元,主要来自中国进口关税上调和越南供应链税收变化。成本压力部分转嫁给消费者和供应商。