OpenAI在3月17日发布GPT-5.4系列两个轻量化模型,进一步降低API调用门槛。Mini定价$0.75/M输入token(缓存后$0.075),Nano定价$0.20/M输入token(缓存后$0.02)。Mini拥有400k上下文窗口,两款模型均支持Batch API实现50%折扣。相比主模型,Mini和Nano的发布标志着OpenAI从"通用强力模型"向"差异化部署成本矩阵"的转变。
小米SU7新一代将于3月19日正式发布。官方预期发布首日开启锁定订单(首34分钟突破15,000辆)。新车定价:标准版219,900元、Pro版249,900元、Max版303,900元(人民币),均配标准LiDAR+700TOPS算力+4D毫米波雷达。续航901km CLTC(Max版本897V平台)。大规模交付预计紧随发布后开启。
三星在GTC期间透露Galaxy Watch 7(预期4月发布)将搭载独家的on-device Galaxy AI功能:(1)体温监测AI分析(预测发烧前24小时);(2)睡眠质量生成式评论;(3)血糖趋势预测(与Health Partners协作)。所有处理均在本地进行,无云端依赖。
Google团队在GTC侧边议题中提及,Pixel Watch 3(预期Q3发布)将搭载Gemini Nano模型的on-device推理。重点功能:(1)离线语音命令理解;(2)健康数据隐私分析;(3)通知智能分类。使用Snapdragon W5 Gen 2作为处理器基础。
Anthropic的Model Context Protocol(MCP)开源生态持续增长。根据当前增速,到3月25日MCP的总安装数预期达到9,700万。MCP作为AI模型与外部工具/API的标准对接协议,生态扩张速度快于预期,表明业界对"模型层编排"标准化的需求强烈。
业界传闻Meta正在准备llama 3.2系列发布(预期4月),着重于推理优化和多模态能力增强。传闻配置:70B参数基础模型+4B轻量版+视觉多模态支持。但Meta官方未确认发布时间。
Databricks在GTC侧边论坛中透露,LLM Monitoring平台将新增端到端数据追溯和成本优化功能。新版本支持自动标记有毒提示词来源、跟踪模型推理漂移、成本分解到token粒度。预期2026年Q2推出。
根据Apple内部战略交流,ChatGPT集成范围将从Siri扩展至系统级的智能推荐(App Search、Notification Prioritization)。这要求Gemini和ChatGPT的并联部署架构。细节在WWDC 2026(6月)预期揭晓。
NVIDIA在GTC后续发布细节中公布OpenShell(基于NemoClaw架构的独立运行时)。核心特性:(1)进程外策略执行(agent无法绕过);(2)隐私路由器(敏感数据本地保留);(3)热重载网络策略(运行时无中断更新);(4)与Cisco CrowdStrike Google Microsoft TrendAI兼容。OpenShell可直接运行OpenClaw应用,开源部署。
GTC大会进入第二天(3月17日),继续围绕Vera Rubin、Agent安全、物理AI等议题进行分组讨论。现场展示包括Disney Olaf机器人补充演示、车厂L4自动驾驶方案对比、OpenClaw应用案例等。NVIDIA合作伙伴论坛中BYD吉利五十铃日产等车厂同步宣布采纳NVIDIA DRIVE Hyperion L4方案。
Databricks在GTC上发布Lakehouse AI 2.0,将数据湖与模型管理平台深度融合。新增功能:(1)One-click RAG pipeline(检索增强生成);(2)Model Registry与Data Lineage关联;(3)A/B testing框架。预期2026年Q2完全推出。
Groq 3 LPU规格补充:315 PFLOPS FP8计算、40 PB/s SRAM带宽(业界创纪录,相比HBM带宽高3倍的权衡)、针对推理工作流优化的芯片布局。Samsung 4nm制造工艺,Q3 2026首批出货。这标志着推理芯片向"超高SRAM带宽+低延迟"方向分化,与Vera Rubin的"大计算阵列"形成互补。
业界预测MediaTek新一代Dimensity 9500 Gen 2(预期2026年Q4)将搭载第三代APU NPU,AI性能相比Gen 1提升12%。芯片计划在TSMC 3nm工艺制造,与高通8 Elite Gen 5正面竞争。
(今日无新动态)
(今日无新动态)