← 首页
2026 / 03 / 18 · 周三

日报

记录不判断 · 收录范围:2026-03-18
14
条目
2
重大
1
新信号
今日头条

Hunter Alpha揭露为小米MiMo-V2-Pro,千亿参数免费推理 重大

神秘的千亿参数模型Hunter Alpha在OpenRouter上已处理超160亿tokens(3月11日上线),因自述为"中国AI模型,中文训练"导致多方猜测为DeepSeek V4。3月18日,小米AI负责人罗福莉X发文确认其为内部测试版MiMo-V2-Pro。模型支持百万token上下文窗口,已超越Claude 4.6 Sonnet(编码)且接近Opus 4.6(通用Agent性能),价格$1/M输入、$3/M输出(主流竞品1/6-1/7)。小米同步发布MiMo-V2 Family,包括多模态Omni与表达式TTS模块。

来源:Reuters/Technology.org/BusinessToday,2026-03-18
L5 应用与终端 5 条

小米SU7新一代发布上市 重大

小米3月19日发布新一代SU7,分为标准版(21.99万元)、Pro版(24.99万元)、Max版(30.39万元)。全系搭载NVIDIA Thor芯片(700 TOPS)、LiDAR、4D毫米波雷达。标准版和Pro版升级至752V高压平台,Max版采用897V架构。CLTC续航720km/902km/835km。发布会34分钟内锁单15000台。小米同步强调智驾融合:XLA认知大语言模型驱动,融合辅助驾驶+具身智能双AI任务。 来源:CnEVPost/Electrek/CarsNews China,2026-03-19

https://cnevpost.com/2026/03/19/xiaomi-launches-next-gen-su7-further-challenge-tesla/

苹果Siri开放多Agent

Apple将在iOS 27(预计下半年发布)中通过Extensions系统允许Claude、Gemini、ChatGPT等第三方AI直接集成Siri。用户可在Settings中配置偏好提供商,按任务路由(研究用Gemini、编码用Claude、创意写作用ChatGPT)。Apple与Google签年约10亿美元,为Siri核心大脑定制1.2T参数Gemini模型。Anthropic报价过高遭放弃。WWDC 2026(6月8日)预期公布Extensions系统。 来源:Bloomberg/MacRumors/FX Leaders,2026-03-25~27

https://www.bloomberg.com/news/articles/2026-03-26/apple-plans-to-open-up-siri-to-rival-ai-assistants-beyond-chatgpt-in-ios-27

三星Galaxy集成Perplexity

三星S26原生应用Notes、Calendar、Gallery、Reminder、Clock可直接调用Perplexity。首发语音唤醒词"Hey Plex"后被改为"Hey Perplexity"。3月26日Samsung Internet Browser for Windows亦上线Perplexity集成,体现三星从单一Bixby向多Agent协调层策略转变。 来源:eMarketer/Engadget/Samsung Global Newsroom,2026-03-25~26

https://news.samsung.com/global/galaxy-ai-expands-multi-agent-ecosystem-to-give-users-more-choice-and-flexibility

Meta Ray-Ban处方镜版本

Meta 3月31日推出Ray-Ban Meta Blayzer Optics Gen 2和Scriber Optics Gen 2,针对近视用户设计可互换鼻托、过度延伸铰链、验光师可调节太阳穴。$499起预售,4月14日光学零售商开售。新增功能:手势营养追踪、WhatsApp摘要、Meta AI recall、Neural Handwriting。 来源:Meta Official Blog,2026-03-31

https://about.fb.com/news/2026/03/meta-ai-glasses-built-for-prescriptions/

Honor Magic V6MWC亮相

Honor 3月1日在MWC发布Magic V6,折叠厚度8.75mm、展开4mm、重219g,成为业界最薄可商用折叠屏。搭载骁龙8 Elite Gen 5、16GB RAM、512GB存储,主屏7.95英寸2352x2172、副屏6.52英寸2420x1080(均LTPO 2.0)。双IP68/IP69认证,Super Steel铰链通过50万折叠(日均200次可用7年)。80W有线+66W无线充电。中国市场3月上市,海外下半年发售。 来源:TechCrunch/HONOR Global/MWC,2026-03-01

https://techcrunch.com/2026/03/01/honor-launches-its-new-slim-foldable-magic-v6-with-a-6600-mah-battery
L4 模型 2 条

OpenAI GPT-5.4正式发布

OpenAI 3月5日发布GPT-5.4,支持百万token上下文、75%算力用于Computer Use。标准API:$2.50/M输入、$15/M输出;Batch API $1.25/$7.50(五折输入、五折输出);Pro版本$30/$180。GPT-5.4 Mini约$0.40/$1.60(成本低6倍),SWE-bench Pro 54.38%。相比GPT-5.3推理成本进一步下降。 来源:OpenAI API Pricing/NxCode,2026-03-05

https://www.nxcode.io/resources/news/gpt-5-4-release-date-features-pricing-2026

小米MiMo-V2Family发布

小米MiMo-V2 Family(Hunter Alpha真身)由罗福莉团队(含前DeepSeek研究员)打造。Pro版1T参数、混合注意力机制(hybrid ratio 7:1)、百万token上下文。Omni多模态、TTS表达式模块支持情感语调。基准排名(Artificial Analysis Intelligence Index):全球第8、中文LLM第2,编码超Claude 4.6 Sonnet、通用Agent接近Opus 4.6。价格$1/$3(input/output per M tokens),是主流竞品1/6-1/7。 来源:Xiaomi MiMo Blog/Artificial Analysis/VentureBeat,2026-03-18

https://venturebeat.com/technology/xiaomi-stuns-with-new-mimo-v2-pro-llm-nearing-gpt-5-2-opus-4-6-performance-at-a-fraction-of-the-cost
L3 基础设施 2 条

云厂商2026年AI资本开支创新高

五大云厂商(Microsoft/Google/Amazon/Meta/Oracle)2026年资本开支合计$660-690亿(较2025年翻番)。其中AWS $200亿(业界最高)、Google $175-185亿(翻倍指引)、Meta $115-135亿、Microsoft $120亿(含$146B分析师预估)、Oracle $50亿+136% YoY)。约75%$450B)流向AI基础设施。GTC期间Jensen Huang上调AI基础设施总市场需求至$1T(通过2027年)。 来源:IEEE ComSoc/Futurum/MUFG Americas,2025-12~2026-03

https://futurumgroup.com/insights/ai-capex-2026-the-690b-infrastructure-sprint/

NVIDIA Vera Rubin架构发布

GTC 2026第一天(3月16日)Jensen Huang宣布Vera Rubin平台:核心Rubin GPU(3360亿晶体管、288GB HBM4、50 PFLOPS推理)+ Vera CPU(1.2TB/s带宽管理KV缓存)+ NVLink 6(3.6TB/s per GPU)+ DPU/NIC/以太网交换机。72颗GPU无缝共享内存(NVL72机柜)。推理性能较Blackwell提升2.5-5倍、训练提升3.5倍。AWS/Google Cloud/Microsoft/OCI 2026 H2率先上线。 来源:NVIDIA Investor/GTC Blog/CNBC,2026-03-16

https://investor.nvidia.com/news/press-release-details/2026/NVIDIA-Kicks-Off-the-Next-Generation-of-AI-With-Rubin--Six-New-Chips-One-Incredible-AI-Supercomputer/default.aspx
L2 芯片 2 条

NVIDIA Groq3推理芯片

GTC 2026期间NVIDIA宣布Groq 3 LPX推理加速器,相比Blackwell NVL72万瓦吞吐提升35倍(万亿参数模型)。NVIDIA于2025年末斥$20B现金并购Groq推理部门,不到三个月即推出代际产品。行业推理成本已从2022年底$20/M tokens降至$0.40/M(成本缩小50倍)。Groq定价线性透明、无闲置基础设施费。 来源:Motley Fool/Creati.ai/GTC,2026-03-18

https://www.fool.com/investing/2026/03/24/nvidias-20-billion-groq-acquisition-just-paid-off-this-new-chip-could-change-the-ai-inference-game-in-2026/

TSMC 3nm产能规划

TSMC台湾3nm月产能已超150K片(2025年底),规划2026年底超200K片(潜在220K片),由P7/P8 Fab 18B扩产驱动。3nm+5nm产线2026年全年100%满载,驱动因素为NVIDIA急迫需求和Apple/Qualcomm/MediaTek/Intel订单。产能紧张导致TSMC计划芯片涨价5-10%、CoWoS封装涨价15-20%。 来源:Taipei Times/TrendForce/TweakTown,2026-03-01~04

https://www.taipeitimes.com/News/biz/archives/2026/04/01/2003854797
宏观 2 条

中国AI伦理审查制度

中国十部门(含网信办/工信部/科技部)4月发布AI伦理审查试点指南,建立三级审查制(风险评估→伦理审查→持续监测)。重点关注人类福祉、公平正义、可控可信。特别要求培训数据选择、算法合理性、模型系统设计、防偏见/歧视/算法剥削措施。国家最高人民法院同步加快AI法律立法,明确AI生成内容原创性、训练数据合法性等边界。3月1日,跨境个人信息处理国家安全标准正式生效(数据分类/同意获取/风险文档/转移监测)。 来源:China News/IAPP/Manila Times,2026-03-01~04

https://www.manilatimes.net/2026/04/10/supplements/china-issues-guidelines-for-ai-ethics-governance/2317527

Anthropic指控蒸馏事件

Anthropic 2月底公开指控三家中国AI厂商用24000虚假账户、1600万交互次数蒸馏Claude模型。DeepSeek特别针对"绕过审查的表述"(censorship-safe alternatives)进行针对式提取,涉及150000+条有针对性的prompt。这是闭源模型保护与开源利用边界战争的标志性事件。 来源:CNBC/CNN Business/Bloomberg,2026-02-23~24

https://www.cnbc.com/2026/02/24/anthropic-openai-china-firms-distillation-deepseek.html
科技原声
"
The age of AI is here. This is not theoretical anymore.
这已经不是理论,AI时代已经到来了。
Jensen Huang,NVIDIA CEO,GTC 2026 Keynote,2026-03-16
"
MiMo-V2-Pro 是为 Agent 系统设计的大脑,能协调复杂工作流、驱动生产工程任务。
MiMo-V2-Pro is designed to serve as the brain of agent systems, orchestrating complex workflows and driving production engineering tasks.
罗福莉,小米AI部门负责人,X发文,2026-03-18
信号跟踪
推理成本快速下降
NVIDIA Groq 3推理芯片10倍性能提升、OpenAI GPT-5.4定价$2.50/M
升级
云端AI基础设施投资
五大厂商2026年$660-690B(+36% YoY),推理端投资占比上升
延续
云厂商多Agent平台
苹果Siri Extensions、三星Galaxy AI多Agent协调层
新信号
小米AI工程化能力
千亿参数推理免费+汽车智驾Agent同周发布
升级
中国AI伦理监管
十部门三级伦理审查制、双轨准入、跨境数据安全标准生效
延续