Google于3月31日发布Gemma 4,包含Effective 2B(E2B)、E4B、26B MoE、31B Dense四个核心模型,全部采用Apache 2.0许可证。这是首次Gemma系列完全开放商业使用。E2B和E4B专为手机和IoT设计,支持完全离线运行;31B模型在Arena AI排行榜排列开源第三。全尺寸支持多模态和256K token上下文。与Qualcomm、MediaTek合作优化端侧部署,覆盖140+语言。
华为小艺Claw、小米miclaw、三星Perplexity集成、苹果开放Siri平台,四家厂商在MWC和近期发布中确认路径分化。华为/小米采自研Agent(跨端协调+闭环生态),三星/苹果采第三方Agent集成(Perplexity/开放平台)。标志产业已从"Agent概念"进入"架构路径分化和实装"阶段。
苹果原定3月推送的Gemini驱动Siri功能延期至5月iOS 26.5 beta,[待确认]最终完整部署推迟至9月iOS 27。Phase 1基础Siri[待确认]预计4月上线iOS 26.4,Phase 2完整对话能力[待确认]推迟至iOS 27。这是苹果与Google达成年约10亿美元Gemini协议后的首次重大时间调整。同时苹果[待确认]计划在iOS 27开放Siri接入第三方AI服务。
小米在3月底宣布AI Agent miclaw进入全球公测(Frontier/Beta阶段)。系统级集成支持对小米设备的50+原生功能进行自动化操控,包括应用启动、参数调整、跨端协调。用户可自然语言描述需求,Agent自动分解任务并执行。标志中国手机厂商Agent部署速度超过国际对标。
Google官方宣布,Pixel 8 Pro搭载Gemma 4 E4B完全离线模式,无需云端调用。该功能在3月31日正式上线,标志端侧推理首次在消费级手机正式商用。模型能力覆盖文本、图像多模态理解。
阿里在3月30日发布Qwen3.5-Omni,原生支持文本、图像、音频、视频四模态,单次计算完成多模态输入到生成。Plus版本支持256K token上下文,可处理超10小时音频或400秒720P视频。首次推出"audio-visual vibe coding"。支持113种语言语音识别、36种语音生成。注意:此版本采用[待确认]闭源策略,颠覆Qwen之前完全开源路线,仅Plus/Flash/Light商业API可用。
Meta在3月底发布Llama 4系列,[待确认]包括Llama 4 Scout(17B活跃参数、16 Experts)和Llama 4 Maverick(17B活跃参数、128 Experts),均支持原生多模态和长上下文。同时[待确认]预告Llama 4 Behemoth(最强LLM之一)。Llama 4是Meta首个完全采用MoE架构的旗舰模型。
OpenAI继续优化GPT-4 Turbo版本,在保持能力基础上[待确认]推出新版本。同步更新API定价,推理成本进一步降低。标志OpenAI响应竞争压力,从"最优能力"转向"最优成本效率"。
Microsoft在Frontier计划中引入Researcher的Critique功能,核心机制为一个模型生成任务初稿,另一个模型作为评审角色进行质量检验。此设计首次在生产环境正式分离"生成"和"评审"的AI模型角色,有助降低单一模型偏差。该功能已集成至Copilot Cowork。
Google在3月31日宣布Vertex AI的Agent Builder支持生成个性化Agent,企业无需深度学习背景即可定制。与Gemma 4端侧部署形成"端云协同"——端侧轻量任务用E2B,复杂决策由Vertex的Agent处理。
NVIDIA GTC发布Rubin后,业界分析显示推理成本相比Blackwell下降30-50%。与GPT-5.4 mini等模型价格下探($0.75/百万token)形成呼应。端侧E2B/E4B模型离线可运行、Qualcomm X2 Elite NPU 80 TOPS、MediaTek最新方案支持完整Gemma 4 E4B本地推理,标志端侧推理的"经济可行性窗口"正在打开。
Qualcomm官方确认,最新的X2 Elite芯片组支持Gemma 4从E2B到31B Dense的全系列[待确认]离线推理。与Google官方合作优化了指令级调度和缓存管理。[待确认]预期单次推理延迟控制在100ms以内(E4B级别)。
Apple在3月31日宣布,A18 Pro SoC集成了专用推理加速单元,支持端侧运行Gemma 4 E4B和Qwen3.5小模型。该设计打破"推理必须用数据中心GPU"的认知,标志消费级芯片与推理模型的[待确认]紧密协作阶段已至。
国际能源署(IEA)在3月底更新报告,将2026年全球数据中心耗电预测上调18%至1100TWh。推理成本下降的同时,能源成本压力反而上升。微软与核电运营商签署长期合同、Meta建立能源配对机制。
美国商务部在3月27日更新AI芯片管制清单,将新型推理专用芯片(如Groq LPU等非GPU架构)纳入限制出口范围。标志美国对华AI芯片管制从"通用GPU"扩展至"专用推理芯片"。
欧盟在3月31日发布AI法案执行的第二阶段规范,将Agent系统列为"高风险应用",要求提交人工可控性证明和偏差审计。对未来跨境AI Agent系统部署形成法规障碍。