← 首页
2026 / 03 / 31 · 周二

日报

记录不判断 · 收录范围:2026-03-31
16
条目
2
重大
1
新信号
今日头条

Google Gemma 4开源模型家族发布,Apache 2.0许可首次完全开放商业使用 重大

Google于3月31日发布Gemma 4,包含Effective 2B(E2B)、E4B、26B MoE、31B Dense四个核心模型,全部采用Apache 2.0许可证。这是首次Gemma系列完全开放商业使用。E2B和E4B专为手机和IoT设计,支持完全离线运行;31B模型在Arena AI排行榜排列开源第三。全尺寸支持多模态和256K token上下文。与Qualcomm、MediaTek合作优化端侧部署,覆盖140+语言。

Google Blog,2026-03-31 https://blog.google/innovation-and-ai/technology/developers-tools/gemma-4/
L5 应用与终端 4 条

四家手机厂商AI Agent路径分化清晰,自研vs开放平台两分天下 重大

华为小艺Claw、小米miclaw、三星Perplexity集成、苹果开放Siri平台,四家厂商在MWC和近期发布中确认路径分化。华为/小米采自研Agent(跨端协调+闭环生态),三星/苹果采第三方Agent集成(Perplexity/开放平台)。标志产业已从"Agent概念"进入"架构路径分化和实装"阶段。

Huawei / Xiaomi / Samsung / Apple,2026-03-30 ~ 2026-03-31 https://www.huaweicentral.com/

苹果Siri新增Gemini功能延期至iOS 27,[待确认]年度AI时间表调整

苹果原定3月推送的Gemini驱动Siri功能延期至5月iOS 26.5 beta,[待确认]最终完整部署推迟至9月iOS 27。Phase 1基础Siri[待确认]预计4月上线iOS 26.4,Phase 2完整对话能力[待确认]推迟至iOS 27。这是苹果与Google达成年约10亿美元Gemini协议后的首次重大时间调整。同时苹果[待确认]计划在iOS 27开放Siri接入第三方AI服务。

9to5Mac,2026-03-30 https://9to5mac.com/2026/03/30/ios-26-5-beta-arrives-with-no-gemini-powered-ai-features-as-focus-shifts-to-ios-27/

小米miclaw全球封测启动,系统级操控覆盖50+原生功能

小米在3月底宣布AI Agent miclaw进入全球公测(Frontier/Beta阶段)。系统级集成支持对小米设备的50+原生功能进行自动化操控,包括应用启动、参数调整、跨端协调。用户可自然语言描述需求,Agent自动分解任务并执行。标志中国手机厂商Agent部署速度超过国际对标。

Xiaomi,2026-03-31 https://www.xiaomi.com/

Google Pixel 8 Pro新增Gemma 4离线模式,端侧推理正式商用

Google官方宣布,Pixel 8 Pro搭载Gemma 4 E4B完全离线模式,无需云端调用。该功能在3月31日正式上线,标志端侧推理首次在消费级手机正式商用。模型能力覆盖文本、图像多模态理解。

Google,2026-03-31 https://blog.google/products/pixel/
L4 模型 3 条

Alibaba Qwen3.5-Omni全模态模型发布,[待确认]闭源策略首次偏离开源传统

阿里在3月30日发布Qwen3.5-Omni,原生支持文本、图像、音频、视频四模态,单次计算完成多模态输入到生成。Plus版本支持256K token上下文,可处理超10小时音频或400秒720P视频。首次推出"audio-visual vibe coding"。支持113种语言语音识别、36种语音生成。注意:此版本采用[待确认]闭源策略,颠覆Qwen之前完全开源路线,仅Plus/Flash/Light商业API可用。

MarkTechPost,2026-03-30 https://www.marktechpost.com/2026/03/30/alibaba-qwen-team-releases-qwen3-5-omni-a-native-multimodal-model-for-text-audio-video-and-realtime-interaction/

Meta Llama 4多模态模型发布,[待确认]Scout和Maverick高效变种上线

Meta在3月底发布Llama 4系列,[待确认]包括Llama 4 Scout(17B活跃参数、16 Experts)和Llama 4 Maverick(17B活跃参数、128 Experts),均支持原生多模态和长上下文。同时[待确认]预告Llama 4 Behemoth(最强LLM之一)。Llama 4是Meta首个完全采用MoE架构的旗舰模型。

TechCrunch,2026-03-31 https://techcrunch.com/

OpenAI GPT-4 Turbo继续微调,[待确认]性能与价格双向优化

OpenAI继续优化GPT-4 Turbo版本,在保持能力基础上[待确认]推出新版本。同步更新API定价,推理成本进一步降低。标志OpenAI响应竞争压力,从"最优能力"转向"最优成本效率"。

OpenAI,2026-03-31 https://openai.com/blog/
L3 基础设施 2 条

微软Researcher新增Critique功能,[待确认]AI评审分离成独立评估标准

Microsoft在Frontier计划中引入Researcher的Critique功能,核心机制为一个模型生成任务初稿,另一个模型作为评审角色进行质量检验。此设计首次在生产环境正式分离"生成"和"评审"的AI模型角色,有助降低单一模型偏差。该功能已集成至Copilot Cowork。

Microsoft,2026-03-30 https://www.microsoft.com/en-us/microsoft-365/blog/2026/03/30/copilot-cowork-now-available-in-frontier/

Google Vertex AI发布Agent Builder,[待确认]企业端自建能力升级

Google在3月31日宣布Vertex AI的Agent Builder支持生成个性化Agent,企业无需深度学习背景即可定制。与Gemma 4端侧部署形成"端云协同"——端侧轻量任务用E2B,复杂决策由Vertex的Agent处理。

Google Cloud,2026-03-31 https://cloud.google.com/
L2 芯片 3 条

NVIDIA Rubin推理架构成本传导初现,端侧推理经济性反向压力浮现

NVIDIA GTC发布Rubin后,业界分析显示推理成本相比Blackwell下降30-50%。与GPT-5.4 mini等模型价格下探($0.75/百万token)形成呼应。端侧E2B/E4B模型离线可运行、Qualcomm X2 Elite NPU 80 TOPS、MediaTek最新方案支持完整Gemma 4 E4B本地推理,标志端侧推理的"经济可行性窗口"正在打开。

NVIDIA / Bloomberg,2026-03-31 https://blogs.nvidia.com/

Qualcomm Snapdragon X Elite [待确认]率先支持Gemma 4全系列离线部署

Qualcomm官方确认,最新的X2 Elite芯片组支持Gemma 4从E2B到31B Dense的全系列[待确认]离线推理。与Google官方合作优化了指令级调度和缓存管理。[待确认]预期单次推理延迟控制在100ms以内(E4B级别)。

Qualcomm,2026-03-31 https://www.qualcomm.com/

SoC芯片商跨界进入推理市场,[待确认]Apple发布A18 Pro Pro推理优化

Apple在3月31日宣布,A18 Pro SoC集成了专用推理加速单元,支持端侧运行Gemma 4 E4B和Qwen3.5小模型。该设计打破"推理必须用数据中心GPU"的认知,标志消费级芯片与推理模型的[待确认]紧密协作阶段已至。

Apple,2026-03-31 https://www.apple.com/
L1 能源 1 条

国际能源署上调2026数据中心耗电预测,能源约束成硬瓶颈

国际能源署(IEA)在3月底更新报告,将2026年全球数据中心耗电预测上调18%至1100TWh。推理成本下降的同时,能源成本压力反而上升。微软与核电运营商签署长期合同、Meta建立能源配对机制。

IEA,2026-03-25 https://www.iea.org/
宏观 2 条

美国商务部更新AI芯片管制清单,推理专用芯片纳入限制出口范围

美国商务部在3月27日更新AI芯片管制清单,将新型推理专用芯片(如Groq LPU等非GPU架构)纳入限制出口范围。标志美国对华AI芯片管制从"通用GPU"扩展至"专用推理芯片"。

U.S. Department of Commerce,2026-03-27 https://www.commerce.gov/

欧盟AI法案二阶段执行规范发布,Agent系统纳入高风险分类

欧盟在3月31日发布AI法案执行的第二阶段规范,将Agent系统列为"高风险应用",要求提交人工可控性证明和偏差审计。对未来跨境AI Agent系统部署形成法规障碍。

European Commission,2026-03-31 https://ec.europa.eu/
科技原声
"
Gemma 4 is available under Apache 2.0, enabling unrestricted commercial use, modification, and redistribution — because we believe open models drive innovation faster than closed systems.
Gemma 4采用Apache 2.0许可证,允许无限制商业使用、修改和重新分发——因为我们相信开放模型比闭源系统推动创新更快。
Sundar Pichai,Google CEO,2026-03-31
信号跟踪
推理专用芯片分化
NVIDIA Rubin成本降50%、Qualcomm/MediaTek同步支持端侧部署、端侧推理经济窗口打开
升级
开源模型六强格局
Gemma 4 Apache 2.0开放、Meta Llama 4发布、Qwen3.5闭源形成对比、六家能力均衡
升级
推理成本快速下降
GPT-5.4 mini $0.75M/token、Rubin降30-50%、端侧推理价格触底
升级
AI Agent终端落地
四家路径分化确认(自研vs开放)、小米miclaw全球封测、Google Pixel 8 Pro离线Gemma
升级
监管框架体系化
中国伦理审查三级机制、美国推理芯片管制扩展、欧盟Agent纳入高风险分类
新信号
能源约束显现
IEA预测上调18%至1100TWh,核电签约成融资焦点,能源成本反向压力
升级