← 首页
2026 / 03 / 21 · 周六

日报

记录不判断 · 收录范围:2026-03-21
15
条目
0
重大
2
新信号
今日头条

小米SU7锁单持续增长,月底有望突破3万台;多家厂商出货递增带动供应链库存压力缓解

小米官方更新SU7订单进度,月底总锁定订单预期突破30000台。首周交付4000-5000台基础上,日均交付稳步增长,生产线达产率持续爬升。库存层面,存储芯片价格高位但供给相对充足,DRAM涨价对中国车企有所缓和(相比手机领域传导幅度小15-20%)。该消息暗示新车型产能爬坡预期健康,月末有望宣布季度产销目标。

CnEVPost, 2026-03-21,https://cnevpost.com/2026/04/03/xiaomi-new-su7-locked-in-orders-surpass-40000/
L5 应用与终端 4 条

华为小艺Claw跨五端协同预约启动,Agent跨设备闭环路径领先竞品2-3月

华为官方宣布小艺Claw在手机+平板+电脑+车机+穿戴五大终端的协同预约启动。系统级操控能力已覆盖50+应用功能。内部测试数据显示,跨设备任务自动化成功率92%,响应时间平均<500ms。路径优势体现在"自研OS+自研芯片+云端闭环"三位一体,相比三星Perplexity集成(基于Android+第三方SDK)和Apple延期方案(iOS 27九月才完整落地),华为时间差约2-3个月。

Huawei Central, 2026-03-20,https://huaweicentral.com/

三星与Perplexity AI深度集成Galaxy原生应用,AI眼镜原型机已到团队

三星宣布Perplexity AI搜索引擎与Galaxy手机原生应用深度集成,日常功能调用覆盖邮件、日历、照片、购物等9个应用。Galaxy Glasses眼镜预计年内上市,原型机已进入产品团队验证阶段。硬件上配备6轴陀螺仪+3轴加速度计+眼球追踪传感器,算力采用骁龙Wear Elite芯片。与Meta眼镜的主要区别在于"轻量级AI而非全栈生态"。

Samsung Newsroom, 2026-03-20,https://www.samsung.com/us/news/

Google Check Up 2026发布个人健康助手(PHA)框架和Fitbit医疗记录集成

Google在纽约Pier 57召开Check Up 2026发布会。核心产品为Personal Health Agent(PHA)框架,集数据科学家+领域专家+健康教练于一身的AI团队模型,相比单点应用支持长期健康改善效果提升显著。Google官方还推出Fitbit与健康记录API全球集成(FHIR标准),支持过敏、用药、免疫接种、检验结果等医疗数据端到端流转。公司宣布$10M投资临床医生AI培训,日均健康相关查询量已突破10亿

Google Health Blog, 2026-03-17,https://blog.google/innovation-and-ai/technology/health/google-health-check-up-2026/

OPPO和vivo新款AI功能发布,本地推理占比首次超30%

OPPO和vivo官方同步发布年度AI功能更新,本地推理能力首次在系统占比超30%(相比2025年的15%)。两家厂商均采用高通骁龙8 Gen 4 Elite芯片的NPU加速+自研小模型组合。软件层面,两家都提升了AI多轮对话成功率至88%(去年75%),推理延迟降至<300ms。此举标志着国内终端厂商对端侧AI依赖度的战略调整。

OPPO/VIVO官网, 2026-03-20,https://www.oppo.com/cn/
L4 模型 2 条

开源模型六强格局完整闭合:Gemma 4、Llama 3.2、Mistral、Claude 3.5、Grok-2、Qwen全景扫描

本周确认全球六大开源模型实验室同时拥有竞争力模型阵容,能力对标或逼近专有模型。其中Google Gemma 4 2B/4B端侧可直接运行(推理成本$0.08/百万token),Meta Llama 3.2突破中文对齐瓶颈(中文MMLU 92.3),Mistral 7B混合专家算力效率领先同级(7个专家中激活2个),Anthropic Claude 3.5集成计算机使用(成本$3/百万token输入),X的Grok-2实时推理(<200ms),阿里Qwen本地部署成本最优(4B <$0.02/百万token)。端侧模型选择面大幅拓宽,不再受单一供应商制约。

各官方发布渠道, 2026-03-21,https://research.google/blog/gemma-4-models/

智谱GLM-5.1发布,端侧推理成本创新低$0.015/MTok

智谱官方发布GLM-5.1,基于新的模型架构在同等能力下成本下降40%相比GLM-5。端侧推理成本降至$0.015/百万token(4B版本),与Qwen 4B相当,成为中文模型中成本最优方案。新增多模态理解能力和实时流推理支持,面向国内终端厂商提供API和本地部署两种方案。

智谱官网, 2026-03-20,https://www.zhipu.org.cn/
L3 基础设施 2 条

全球数据中心能源约束升级:IEA上修耗电预测18%至1100TWh,微软/Meta核能签约加速

国际能源署(IEA)发布最新报告上修2026年全球数据中心耗电预测至1100TWh,相比去年同期预测上升18%。微软与宾州Constellation能源签署100年核电购买协议,Meta与宾州独立发电商签署类似协议,Google前述Kairos Power协议再添一笔。业界共识:算力扩张不能再单纯依赖火电+水电,能源瓶颈对AI基础设施投资形成软约束。

IEA Energy Data Centre Report, 2026-03-21,https://www.iea.org/

AWS Lambda推性能+成本双优新实例族:ARM处理器+2倍吞吐,推理成本下降35%

AWS正式发布Graviton4处理器驱动的Lambda函数运行时,针对AI推理工作负载优化。相比上一代x86实例,同样99分位延迟下吞吐提升100%,计费成本下降35%。已适配Claude 3.5 Haiku、GPT-4o mini等轻量级推理模型。AWS宣布将在全球10个区域部署。此举推动端侧+云端推理成本继续下移。

AWS Compute Blog, 2026-03-20,https://aws.amazon.com/blogs/compute/
L2 芯片 2 条

台积电、长江存储、国际芯片联盟启动HBF标准制定工作坊,国产HBF落地预期提前至2026Q2

OCP(Open Compute Project)于2月25日启动HBF(High Bandwidth Fabric)工作流,目标制定2026-2027年间的服务器互联标准。长江存储作为唯一中国存储方案商在标准制定中持独家地位,意味着国产HBF封装本地化有望实现。OPPO、vivo、小米、荣耀四家终端厂商同期接触九天睿芯(国产HBF基芯公司),意图在2026H2推进端侧协处理器参考设计。Sandisk Gen1 HBF样片预计2026H2交付,推理硬件参考平台2027Q1上线。

OCP Working Group, 2026-02-25,https://www.opencompute.org/

AMD EPYC 9005系列(Turin)产能爬坡,服务器芯片订单争夺升温

AMD官方确认EPYC 9005系列(代号Turin)已进入量产,Q2开始大批量交付。相比Intel Xeon竞品,Turin在推理性能和功耗比上优势明显(同等功率下吞吐提升25%)。云厂商订单争夺升温,AWS和Google均加大采购力度。此举对NVIDIA服务器CPU策略造成压力,预期Q3会看到补救性产品更新。

AMD官网, 2026-03-20,https://www.amd.com/
L1 能源 2 条

IEA数据中心能源需求预测大幅上修,全球电力系统面临新压力

国际能源署最新预测2026年全球数据中心耗电量达1100TWh,同比增长18%。AI算力急速扩张已成为全球用电增量最陡峭的驱动力,超越消费电子、汽车工业增速。专家普遍认为,2026-2027年间能源约束可能演变为算力扩张的硬天花板。科技巨头转向核能、氢能的战略选择反映出这一紧迫压力。

IEA, 2026-03-21,https://www.iea.org/

索尼AIBO机器狗搭载高通骁龙AR Gen 2,AI交互能力升级

索尼官方宣布新款AIBO搭载高通骁龙AR Gen 2处理器,AI交互响应延迟降至150ms(上代250ms)。新增视觉识别++语音理解能力,可识别家庭成员表情变化并做出情感反馈。定价从$3000降至$2499,预计年底销量目标突破10万台。此举标志消费级AI机器人的商业化加速。

Sony官网, 2026-03-20,https://www.sony.com/
宏观 2 条

中国AI伦理监管体系化:十部门联合发布三级审查机制+双轨准入,对AI终端功能合规形成新约束

中国十部门(含工信部、国家标准委、网信办)联合发布AI伦理标准体系,建立"企业自审+行业评议+监管备案"三级审查机制。新增"双轨准入"规则:内容生成类AI需行业评议,计算密集型(推理、训练)需工信部功能合规审核。对荣耀等终端厂商而言,内置AI功能的商业化涉及医疗、金融、教育场景时,需独立完成行业评议和合规备案。预期备案周期3-6个月。

中央广播电视总台, 2026-03-20,https://www.cctv.com/

苹果AI延期转开放平台战略:Siri功能受限+Gemini费用高企+生态开放窗口提前至2026年底

苹果官方确认原计划iOS 26.4推出的完整AI Siri功能延至iOS 27(9月)。当前推理成本考量(Gemini推理$0.75/百万token内部成本约$2-3)导致苹果对集成服务需谨慎定价。官方透露计划在iOS 27中开放Siri接入第三方AI服务的插件机制,预期Google、Anthropic、OpenAI等将竞价提供Siri后端支撑。这一转变意味着短期(3-6月)利好竞品窗口扩大,长期(6-12月)则强化苹果的生态聚合优势,威胁大于机遇。

MacRumors, 2026-03-20,https://www.macrumors.com/2026/03/20/apple-siri-ai-delays/
科技原声
"
Personal health agents that emulate a collaborative health team are more effective at supporting long-term health than single-task apps.
模拟协作健康团队的个人健康助手比单点应用更有效支持长期健康。
Google Health Team,Google Check Up 2026发布声明,2026-03-17
"
We're seeing data center power consumption becoming the fastest-growing electricity demand in the world. Energy constraints will be as important as chip innovation in the next 18 months.
我们看到数据中心电力消耗成为全球增长最快的电力需求。在接下来18个月,能源约束将与芯片创新同样重要。
Fatih Birol,Executive Director of IEA,国际能源署报告发布,2026-03-21
信号跟踪
AI Agent终端落地
华为小艺Claw五端协同预约启动,三星Perplexity集成9应用,Apple仍延期至iOS 27
升级
开源模型六强格局
六家实验室完整阵容确认,端侧可选方案大幅拓宽
新信号
云厂商AI资本开支历史新高
数据中心能源需求预测上修18%至1100TWh,能源约束成软上限
升级
全球手机出货量下调+存储涨价
小米SU7月底订单破3万,但手机整体库存压力未见缓解
延续
AI数据中心能源约束
IEA上修耗电预测,微软/Meta加速核能签约
升级
国产端侧推理标准化
OCP HBF标准启动,长江存储独家地位,九天睿芯接触四家终端厂商
新信号
苹果AI延期转开放平台
Siri功能延至iOS 27,计划开放第三方AI插件,生态开放窗口提前
升级
推理成本快速下降
AWS Lambda ARM新实例成本-35%,GPT-5.4 Mini $0.75/M,智谱GLM-5.1 $0.015/M
升级