科技

小米推 MiMo-V2-Flash 開源混合專家模型,效能媲美 DeepSeek V3.2

編輯部
2天前
10 瀏覽
小米推 MiMo-V2-Flash 開源混合專家模型,效能媲美 DeepSeek V3.2
小米今日推出了自己最新版的混合專家(MoE)開源模型 MiMo-V2-Flash,主打效率設計和極致 CP 值。它擁有 3,090 億總參數和 150 億活躍參數,效能比肩 DeepSeek V3.2、Kimi-K2 等開源領先產品。其推理速度達到每秒 150 tokens,能實現毫秒級響應延遲。

與此同時,該模型還原生支援 32k tokens 上下文,可擴充至 256k,採用滑動注意力與全域注意力混合架構,能兼顧效率與部署兼容性。另外它也具備深度思考和連網搜尋功能,整體定位非單純聊天工具,未來將整合小愛同學、小米智能家居與小米汽車座艙,服務於整個「人車家」生態。

⚡ Faster than Fast. Designed for Agentic AI.Introducing Xiaomi MiMo-V2-Flash — our new open-source MoE model: 309B total params, 15B active.Blazing speed meets frontier performance.🔥 Highlights:🏗️ Hybrid Attention: 5:1 interleaved 128-window SWA + Global | 256K context📈… pic.twitter.com/yCqP4L8bU4

— XiaomiMiMo (@XiaomiMiMo) December 16, 2025

MiMo-V2-Flash 在各項基準測試中也都有不俗表現,它的 AIME 2025 數學競賽和 GPQA-Diamond 科學知識得分都排在開源模型的前二。SWE-bench Verified 修復代碼成功率 73.4%,領跑所有開源模型,成績逼近 GPT-5(High)。而這樣的表現,僅需要極低的成本便可實現。MiMo-V2-Flash 每百萬 token 輸入和輸出的價格僅為 0.1 和 0.3 美元,CP 值真的是刻入小米 DNA 的東西。

「MiMo-V2-Flash 已經正式上線,但這只是我們 AGI 路線圖上的第二步。」一個月前剛剛加盟小米領導 MiMo 團隊的 DeepSeek 「AI 天才少女」羅福莉在 X 上這麼寫道。如果一切順利的話,小米在 2026 年可能還會加推 700 億參數的 Pro 版本。這家每進入一個行業都會掀起巨變的公司接下來會如何影響 AI 的發展,各位不妨拭目以待。

緊貼最新科技資訊、網購優惠,追隨 Yahoo Tech 各大社交平台!

🎉📱 Tech Facebook:https://www.facebook.com/yahootechhk

🎉📱 Tech Instagram:https://www.instagram.com/yahootechhk/

🎉📱 Tech WhatsApp 社群:https://chat.whatsapp.com/Dg3fiiyYf3yG2mgts4Mii8

🎉📱 Tech WhatsApp 頻道:https://whatsapp.com/channel/0029Va91dmR545urVCpQwq2D

🎉📱 Tech Telegram 頻道:https://t.me/yahootechhk

新聞來源: 原始來源

約 2 分鐘可讀完
分享

讀者評論 (0)

尚無評論

成為第一個發表評論的人吧!

首頁 新聞 商家 活動 聊天底