神秘的千亿参数模型Hunter Alpha在OpenRouter上已处理超160亿tokens(3月11日上线),因自述为"中国AI模型,中文训练"导致多方猜测为DeepSeek V4。3月18日,小米AI负责人罗福莉X发文确认其为内部测试版MiMo-V2-Pro。模型支持百万token上下文窗口,已超越Claude 4.6 Sonnet(编码)且接近Opus 4.6(通用Agent性能),价格$1/M输入、$3/M输出(主流竞品1/6-1/7)。小米同步发布MiMo-V2 Family,包括多模态Omni与表达式TTS模块。
小米3月19日发布新一代SU7,分为标准版(21.99万元)、Pro版(24.99万元)、Max版(30.39万元)。全系搭载NVIDIA Thor芯片(700 TOPS)、LiDAR、4D毫米波雷达。标准版和Pro版升级至752V高压平台,Max版采用897V架构。CLTC续航720km/902km/835km。发布会34分钟内锁单15000台。小米同步强调智驾融合:XLA认知大语言模型驱动,融合辅助驾驶+具身智能双AI任务。 来源:CnEVPost/Electrek/CarsNews China,2026-03-19
Apple将在iOS 27(预计下半年发布)中通过Extensions系统允许Claude、Gemini、ChatGPT等第三方AI直接集成Siri。用户可在Settings中配置偏好提供商,按任务路由(研究用Gemini、编码用Claude、创意写作用ChatGPT)。Apple与Google签年约10亿美元,为Siri核心大脑定制1.2T参数Gemini模型。Anthropic报价过高遭放弃。WWDC 2026(6月8日)预期公布Extensions系统。 来源:Bloomberg/MacRumors/FX Leaders,2026-03-25~27
三星S26原生应用Notes、Calendar、Gallery、Reminder、Clock可直接调用Perplexity。首发语音唤醒词"Hey Plex"后被改为"Hey Perplexity"。3月26日Samsung Internet Browser for Windows亦上线Perplexity集成,体现三星从单一Bixby向多Agent协调层策略转变。 来源:eMarketer/Engadget/Samsung Global Newsroom,2026-03-25~26
Meta 3月31日推出Ray-Ban Meta Blayzer Optics Gen 2和Scriber Optics Gen 2,针对近视用户设计可互换鼻托、过度延伸铰链、验光师可调节太阳穴。$499起预售,4月14日光学零售商开售。新增功能:手势营养追踪、WhatsApp摘要、Meta AI recall、Neural Handwriting。 来源:Meta Official Blog,2026-03-31
Honor 3月1日在MWC发布Magic V6,折叠厚度8.75mm、展开4mm、重219g,成为业界最薄可商用折叠屏。搭载骁龙8 Elite Gen 5、16GB RAM、512GB存储,主屏7.95英寸2352x2172、副屏6.52英寸2420x1080(均LTPO 2.0)。双IP68/IP69认证,Super Steel铰链通过50万折叠(日均200次可用7年)。80W有线+66W无线充电。中国市场3月上市,海外下半年发售。 来源:TechCrunch/HONOR Global/MWC,2026-03-01
OpenAI 3月5日发布GPT-5.4,支持百万token上下文、75%算力用于Computer Use。标准API:$2.50/M输入、$15/M输出;Batch API $1.25/$7.50(五折输入、五折输出);Pro版本$30/$180。GPT-5.4 Mini约$0.40/$1.60(成本低6倍),SWE-bench Pro 54.38%。相比GPT-5.3推理成本进一步下降。 来源:OpenAI API Pricing/NxCode,2026-03-05
小米MiMo-V2 Family(Hunter Alpha真身)由罗福莉团队(含前DeepSeek研究员)打造。Pro版1T参数、混合注意力机制(hybrid ratio 7:1)、百万token上下文。Omni多模态、TTS表达式模块支持情感语调。基准排名(Artificial Analysis Intelligence Index):全球第8、中文LLM第2,编码超Claude 4.6 Sonnet、通用Agent接近Opus 4.6。价格$1/$3(input/output per M tokens),是主流竞品1/6-1/7。 来源:Xiaomi MiMo Blog/Artificial Analysis/VentureBeat,2026-03-18
五大云厂商(Microsoft/Google/Amazon/Meta/Oracle)2026年资本开支合计$660-690亿(较2025年翻番)。其中AWS $200亿(业界最高)、Google $175-185亿(翻倍指引)、Meta $115-135亿、Microsoft $120亿(含$146B分析师预估)、Oracle $50亿(+136% YoY)。约75%($450B)流向AI基础设施。GTC期间Jensen Huang上调AI基础设施总市场需求至$1T(通过2027年)。 来源:IEEE ComSoc/Futurum/MUFG Americas,2025-12~2026-03
GTC 2026第一天(3月16日)Jensen Huang宣布Vera Rubin平台:核心Rubin GPU(3360亿晶体管、288GB HBM4、50 PFLOPS推理)+ Vera CPU(1.2TB/s带宽管理KV缓存)+ NVLink 6(3.6TB/s per GPU)+ DPU/NIC/以太网交换机。72颗GPU无缝共享内存(NVL72机柜)。推理性能较Blackwell提升2.5-5倍、训练提升3.5倍。AWS/Google Cloud/Microsoft/OCI 2026 H2率先上线。 来源:NVIDIA Investor/GTC Blog/CNBC,2026-03-16
GTC 2026期间NVIDIA宣布Groq 3 LPX推理加速器,相比Blackwell NVL72万瓦吞吐提升35倍(万亿参数模型)。NVIDIA于2025年末斥$20B现金并购Groq推理部门,不到三个月即推出代际产品。行业推理成本已从2022年底$20/M tokens降至$0.40/M(成本缩小50倍)。Groq定价线性透明、无闲置基础设施费。 来源:Motley Fool/Creati.ai/GTC,2026-03-18
TSMC台湾3nm月产能已超150K片(2025年底),规划2026年底超200K片(潜在220K片),由P7/P8 Fab 18B扩产驱动。3nm+5nm产线2026年全年100%满载,驱动因素为NVIDIA急迫需求和Apple/Qualcomm/MediaTek/Intel订单。产能紧张导致TSMC计划芯片涨价5-10%、CoWoS封装涨价15-20%。 来源:Taipei Times/TrendForce/TweakTown,2026-03-01~04
中国十部门(含网信办/工信部/科技部)4月发布AI伦理审查试点指南,建立三级审查制(风险评估→伦理审查→持续监测)。重点关注人类福祉、公平正义、可控可信。特别要求培训数据选择、算法合理性、模型系统设计、防偏见/歧视/算法剥削措施。国家最高人民法院同步加快AI法律立法,明确AI生成内容原创性、训练数据合法性等边界。3月1日,跨境个人信息处理国家安全标准正式生效(数据分类/同意获取/风险文档/转移监测)。 来源:China News/IAPP/Manila Times,2026-03-01~04
Anthropic 2月底公开指控三家中国AI厂商用24000虚假账户、1600万交互次数蒸馏Claude模型。DeepSeek特别针对"绕过审查的表述"(censorship-safe alternatives)进行针对式提取,涉及150000+条有针对性的prompt。这是闭源模型保护与开源利用边界战争的标志性事件。 来源:CNBC/CNN Business/Bloomberg,2026-02-23~24