小米推出首個推理開源大模型Mimo！以7B參數打敗OpenAI o1

砍柴網 ? 9天前掃碼分享

我是創始人李巖：很抱歉！給自己產品做個廣告，點擊進來看看。

AI競賽激烈，小米也加入戰局！

4月30日，小米推出專注推理能力的開源大模型MiMo，僅用7B參數規模在數學推理和代碼競賽測評中超越OpenAI的閉源模型o1-mini以及阿里32B規模的QwQ。

據小米介紹，Xiaomi MiMo誕生之初探索的核心問題就是激發模型推理潛能，這款模型聯動預訓練到后訓練，全面提升推理能力。

國內外AI競爭日趨白熱化，本周阿里前腳發布Qwen 3，馬斯克后腳就官宣Grok 3.5。而據此前媒體報道，小米正在建設萬卡GPU集群，并引入頂尖AI人才，顯示出對大模型領域的全面投入。

性能突破：小參數量實現大能力

Xiaomi MiMo這款模型最引人注目之處在于，在數學推理（AIME 24-25）和代碼競賽（LiveCodeBench v5）公開測評集上，MiMo 僅用 7B 的參數規模，超越了 OpenAI 的閉源推理模型 o1-mini 和阿里 Qwen 更大規模的開源推理模型 QwQ-32B-Preview。

小米推出首個推理開源大模型Mimo！以7B參數打敗OpenAI o1

更值得注意的是，在相同強化學習(RL)訓練數據條件下，MiMo-7B在數學和代碼領域展現出的強化學習潛力明顯領先于業界廣泛使用的其他模型，包括DeepSeek-R1-Distill-7B和Qwen2.5-32B等知名強化學習起步模型。

小米推出首個推理開源大模型Mimo！以7B參數打敗OpenAI o1

技術關鍵：預訓練與后訓練雙輪驅動

據小米介紹，MiMo模型的成功并非偶然，而是來自于預訓練和后訓練兩個階段的多層面創新。

在預訓練階段，小米團隊著重挖掘富含推理模式的語料，并合成了約200B tokens的推理數據。訓練過程采用三階段策略，逐步提升訓練難度，累計訓練了25T tokens，這一訓練量在同等規模模型中處于領先水平。

后訓練階段的創新更為關鍵，小米團隊提出了"Test Difficulty Driven Reward"機制，有效解決了困難算法問題中獎勵稀疏的問題。同時引入"Easy Data Re-Sampling"策略，顯著提升了強化學習訓練的穩定性。在框架層面，他們設計了"Seamless Rollout"系統，使得強化學習訓練速度提升2.29倍，驗證速度提升1.96倍。

技術之外：小米的AI全面投入戰略

據界面新聞報道，小米正在搭建自己的GPU萬卡級集群，將對AI大模型進行大力投入。一名知情人士透露，該計劃已經實施數月之久，小米創始人雷軍親自參與領導。該人士強調："在AI硬件這件事情上，最核心的是手機而不是眼鏡，小米在這個領域不'all in'是不可能的。"

小米的AI人才布局也在加速。12月20日，第一財經報道稱DeepSeek開源大模型DeepSeek-V2的關鍵開發者之一羅福莉將加入小米，或供職于小米AI實驗室，領導小米大模型團隊。羅福莉是MLA（Multi-head Latent Attention）技術的核心開發者之一，該技術在降低大模型使用成本上發揮了關鍵作用。

【來源：華爾街見聞官方】

隨意打賞

紐北專為小米設置「小米彎道」；馬斯克 xAI 估值超 1200 億美元；智元辦機器人比賽獎金 50 萬美元

極客公園 ? 3分鐘前

xAI 據稱洽談新一輪融資估值有望超過 1200 億美元據媒體援引消息人士報道，世界首富伊隆·馬斯克旗下的 xAI 公司正在與投資者洽談，計劃籌集約 200 億美元的資金。數據提供商 PitchBook 的數據顯示，如果達成，這將成為歷史上第二大規模的初創公司融資，僅次于人工智能（AI）研究公司 OpenAI 今年早
訊飛聽見APP獲得小米應用商店"金米獎" ，彰顯AI語音轉寫領軍者實力

砍柴網 ? 10小時前

近日，科大訊飛旗下智能語音領域代表產品訊飛聽見 APP 憑借卓越的技術實力與用戶口碑，榮獲小米頒發的「金米獎」。該獎項作為小米應用商店對優質應用的重磅表彰，旨在挖掘創新性強、體驗卓越的標桿產品。此次獲獎標志著訊飛聽見 APP 在智能語音賽道的技術領先性與市場影響力再獲行業權威認證。多生態應用市場成績斐然領先地位獲行業
第一個“退群”的小米友商出現了

虎嗅網 ? 11小時前

在小米汽車的強力沖擊下，第一個“受害者”出現了。5月7日，吉利汽車宣布將對新能源汽車品牌極氪私有化，價格為每股ADS 25.66美元，總報價65億美元。相較過去30個交易日的均價，吉利這份報價溢價20%。極氪成立于2021年，從吉利拆分后，2024年5月登陸紐交所。上市僅一年后，極氪就進入了私有化退市流程，在造車新勢力
北京人形機器人開源社區已上線

i黑馬 ? 2分鐘前

5月8日，據“北京亦莊”公眾號消息，2025年4月，北京人形機器人開源社區（opensource.x-humanoid-cloud.com）已正式上線，包含博客、論壇交流、技術文檔展示、開源項目展示、活動發布、專家學者認證、開源課程發布等豐富功能，通過開放共享核心技術與研發資源，促進全球開發者協作創新、加速行業技術突破
小米空調系長虹生產惹爭議

i黑馬 ? 16小時前

近日，“小米空調實為其他品牌生產”相關話題引發廣泛關注。據媒體報道，一男子在查看小米空調的產品信息時發現，制造商顯示為"北京小米電子產品有限公司"，地址位于北京市。然而，空調內部的標牌顯示，其實際生產商為"四川長虹空調有限公司"，生產地址位于四川省綿陽市。對此，有網友調侃道：直接
小米汽車就SU7 Ultra限制馬力致歉：沒有充分征詢意見，暫停推送

i黑馬 ? 16小時前

5月1日，多名小米SU7 Ultra車主發帖稱，更新車機版本后，1548匹馬力被禁用，官方賽道刷圈速達標才能解鎖。5月7日深夜，小米汽車針對此事予以致歉，稱已暫停了這次推送，已升級的少量用戶，將會在下個版本更新中解決。目前已開始推進新版本的開發和測試，預計用時4—8周，具體時間以小米官方通知為準。小米汽車稱，設計的初衷
【黑馬早報】比爾·蓋茨將捐出幾乎全部財富；李佳琦回應媽媽直播帶貨；小米就SU7 Ultra限制馬力致歉；泡泡瑪特股份被創始股東高位清倉...

i黑馬 ? 23小時前

今日頭條北上廣深均宣布下調個人住房公積金貸款利率5月7日，中國人民銀行發布關于下調個人住房公積金貸款利率的通知：自2025年5月8日起，下調個人住房公積金貸款利率0.25個百分點；5年以下（含5年）和5年以上首套個人住房公積金貸款利率分別調整為2.1%和2.6%；5年以下（含5年）和5年以上第二套個人住房公積金貸款利率
雷軍：SU7 Ultra 正式挑戰紐北；華為「鴻蒙電腦」亮相；蓋茨將捐出所有財富，2045 關閉基金會

極客公園 ? 1天前

華為首款鴻蒙電腦亮相，19 日正式發布北京時間 5 月 8 日消息，華為官宣了首款鴻蒙電腦，電腦將于 5 月 19 日 14:30 正式發布。據介紹，鴻蒙電腦歷經五年布局，包括：2021 至 2022 年原型機時期（基礎功能 | OS 底座 | 軟硬端協同）、2022 至 2023 年工程機時期（生態開發框架 | 核心
雷軍：小米SU7 Ultra量產版正在挑戰紐北賽道

砍柴網 ? 1天前

5月8日，雷軍在微博發文稱，“小米SU7 Ultra量產版正在挑戰紐北賽道，我們一起期待一下好消息！”去年10月，小米SU7 Ultra原型車在紐北賽道跑出了6分46秒874的成績，成為紐北全球最速四門車。【來源：鳳凰網科技】
小米汽車回應智駕更名輔助駕駛

i黑馬 ? 2天前

近日，小米 SU7 在宣傳口徑上將“ 智駕 ”改為“ 輔助駕駛 ”，消息引發熱議。記者檢索小米汽車官網發現，SU7 車型“ 小米智駕 Pro ”更名為“ 小米輔助駕駛 Pro ”，SU7 Pro 和 Max 車型的“ 小米智駕 Max ”更名為“ 小米端到端輔助駕駛 ”。此外，“ 代客泊車 ”功能的介紹被修改為“ 代客
小米煥新極簡相機確認將保留所有既有功能

砍柴網 ? 2天前

5 月 7 日消息，有用戶擔心小米煥新極簡相機會刪減功能，小米相機部的產品經理 @Bao_小李今日發文澄清：“ 會保留所有既有功能，也會對歷史功能進行重新設計與適配。” @Bao_小李表示，由于需要針對不同機型進行功能點適配（部分功能會下放至舊機型），因此老機型的版本發布時間會相對
阿里通義 Qwen3 上線，開源大軍再添一名猛將

雷鋒網 ? 2天前

4月29日，通義App與通義網頁版全面上線阿里新一代通義千問開源模型 Qwen3。用戶可以第一時間在通義App和網頁版中的專屬智能體“千問大模型”，以及主對話頁面，體驗到最強開源模型的智能能力。Qwen3一經發布便登頂全球最強開源模型，包含8款不同尺寸，均為全新的“混合推理模型”，智能水平大幅提升的同時也更省算力。其中
心言集團高級算法工程師在Qwen 3發布之際再談開源模型的生態價值

砍柴網 ? 3天前

4月29日，阿里新一代的大模型 Qwen 3發布。以 DeepSeek+Qwen 的中國開源組合，正在以中國開源生態“雙子星”之勢，取代過去 Llama 為主，Mistral 為輔的開源生態。 Qwen 3 發布后，Founder Park采訪了不同行業的 AI 創業公司代表，就開源閉源如何
DeepSeek 發布 Prover-V2 模型；小米首個推理大模型開源；餓了么宣布超百億補貼加入外賣戰局

極客公園 ? 8天前

DeepSeek 發布 Prover-V2 模型，參數量達 6710 億4 月 30 日消息，DeepSeek 于 AI 開源社區 Hugging Face 上發布了一個名為 DeepSeek-Prover-V2-671B 的新模型。據悉，DeepSeek-Prover-V2-671B 使用了更高效的 safetens
智象未來開源圖像生成模型HiDream

i黑馬 ? 8天前

國內人工智能企業智象未來研發的開源圖像生成模型HiDream-I1繼登頂人工智能基準測試平臺Artificial Analysis、獲Hugging Face收錄后，該模型正式被谷歌技術生態體系收錄，國產自研生成式大模型持續全面獲得國際認可。據介紹，該模型憑借17B參數規模，在圖像真實感、細節處理及指令響應能力上有大的
小米首個推理大模型開源數學與代碼測評超越OpenAI

砍柴網 ? 9天前

4月30日，小米公司于“Xiaomi MiMo”公眾號正式宣布開源其首個專注于推理能力的大模型「Xiaomi MiMo」。小米官方表示，該模型以7B（70億）參數規模，在數學推理（AIME 24-25）和代碼競賽（LiveCodeBench v5）等公開測評中表現優異，超越OpenAI的閉源模型o1-mini及阿里Qw
給大樓裝上“智慧大腦” ，首個開源鴻蒙智慧樓宇樣板點發布

砍柴網 ? 9天前

今日，在第八屆數字中國建設峰會期間，福州城投集團所屬市城鄉建總集團有限公司（以下簡稱“城鄉建總”）與深圳開鴻數字產業發展有限公司（以下簡稱“深開鴻”）聯合打造的全國首個基于開源鴻蒙的智慧樓宇樣板點在福州建總大廈正式發布。福州市城鄉建總集團有限公司副總經理趙天翼、總經理助理林聰，以及深開鴻戰略Marketing總經理孫宏
青云科技入選信通院“開源大模型+”創新應用典型案例

砍柴網 ? 9天前

為深入挖掘人工智能技術在不同場景下的實踐應用，推動行業發展與交流，中國信息通信研究院開展了“開源大模型+”軟件創新應用典型案例征集活動。經前期初步材料收集、基礎信息核對、材料初篩、內部預審、專家評審，以及專家委員會審批等多個環節，青云科技攜客戶吉富創投雙雙入選。青云智算產品與服務深
基于開源鴻蒙打造，華龍工業操作系統亮相2025成都工博會

砍柴網 ? 10天前

4月23日—25日，以“創鏈新工業，共碳新未來”為主題的2025成都國際工業博覽會在成都舉辦，吸引了全球600余家工業科技巨頭參展。由華龍訊達基于OpenHarmony打造的“工控鴻蒙”——華龍工業操作系統（HualongOS）在展會上重磅亮相，展示了國產工業操作系統在智能化、安全性和生態

評論

提交建議