IT之家 3 月 19 日消息,代號為“Hunter Alpha”的神秘模型本月(3 月)在全球最大 API 聚合平臺 OpenRouter 引發(fā)熱議,一度登上大模型調(diào)用榜第一,不少網(wǎng)友猜測是“DeepSeek V4”早期版本。

今天(19 日)凌晨,小米正式認(rèn)領(lǐng)“Hunter Alpha”,宣布推出三款大模型 —— MiMo-V2-Pro & Omni & TTS,可限時免費(fèi)體驗一周。
隨后,小米 MiMo 大模型負(fù)責(zé)人羅福莉發(fā)布長文,表示這是小米首款真正為智能體時代打造的全棧產(chǎn)品系列。
我稱之為一次悄無聲息的伏擊 —— 并非因為我們事先策劃,而是因為從聊天模式到智能代理模式的轉(zhuǎn)變發(fā)生得太快,連我們自己都難以置信。在這兩者之間,經(jīng)歷了一個既激動人心又痛苦不堪,同時又引人入勝的過程。
1T 基礎(chǔ)模型幾個月前就開始訓(xùn)練了。最初的目標(biāo)是提高長上下文推理的效率?;旌献⒁饬C(jī)制帶來了真正的創(chuàng)新,卻又不至于過度擴(kuò)張 —— 事實證明,它正是智能體時代最合適的基石。1M 上下文窗口。MTP 推理實現(xiàn)超低延遲和成本。這些架構(gòu)決策并非一時興起,而是我們在需要之前就構(gòu)建的結(jié)構(gòu)性優(yōu)勢。
真正改變一切的是我第一次體驗到復(fù)雜的智能體框架 —— 我稱之為“精心編排的語境”。第一天我就震驚了。我試圖說服團(tuán)隊使用它,但沒有成功。于是我下達(dá)了一條強(qiáng)硬指令:MiMo 團(tuán)隊中,明天對話次數(shù)少于 100 次的成員可以辭職 / 退出。這招奏效了。一旦團(tuán)隊的想象力被智能體系統(tǒng)的功能所激發(fā),這種想象力便直接轉(zhuǎn)化為研究速度。
人們問我們?yōu)槭裁窗l(fā)展如此迅速。我在構(gòu)建 DeepSeek R1 時親身經(jīng)歷了這一點。我的真實總結(jié)是:
—— 骨干網(wǎng)和基礎(chǔ)設(shè)施研究周期很長。你需要一年的戰(zhàn)略決心才能看到回報。
—— 訓(xùn)練后敏捷性是一種不同的能力:產(chǎn)品直覺驅(qū)動評估,迭代周期縮短,范式轉(zhuǎn)變及早發(fā)生。
—— 以及不變的:好奇心、敏銳的技術(shù)直覺、果斷的執(zhí)行力、全身心的投入。
—— 還有一點很容易被低估:對你所創(chuàng)造的世界的真摯熱愛。
羅福莉還承諾,新的 MiMo-V2 系列模型會開源 —— 當(dāng)模型足夠穩(wěn)定,值得開源的時候。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。