中國(guó)第一：阿里通義千問 3.5-Max-Preview 首發(fā)亮相 LM Arena 國(guó)際大模型競(jìng)技場(chǎng)

2026/3/20 8:17:13 來源：IT之家作者：問舟責(zé)編：問舟

評(píng)論：

感謝IT之家網(wǎng)友 Domado、軟媒用戶1369491、Alita的迷弟、roloyty 的線索投遞！

IT之家 3 月 20 日消息，阿里千問大模型家族再迎新成員。今日，Qwen3.5-Max-Preview 作為千問 3.5 系列的旗艦?zāi)Ｐ皖A(yù)覽版，在全球大模型競(jìng)技平臺(tái) LM Arena 正式亮相，并獲得 1464 分的綜合得分。

憑借這一成績(jī)，阿里千問在 LM Arena 全球大模型公司排行榜中的排名上升至全球第五位，位列中國(guó)公司首位。

中國(guó)第一：阿里通義千問 3.5-Max-Preview 首發(fā)亮相 LM Arena 國(guó)際大模型競(jìng)技場(chǎng)

據(jù)阿里云介紹，LM Arena 是由國(guó)際開源研究機(jī)構(gòu) LMSYS 組織的第三方大模型評(píng)測(cè)平臺(tái)，其評(píng)測(cè)機(jī)制采用模型兩兩匿名對(duì)戰(zhàn)，由全球開發(fā)者進(jìn)行盲測(cè)投票，最終根據(jù)勝負(fù)結(jié)果形成模型分?jǐn)?shù)與排名。由于采用開放式對(duì)戰(zhàn)與人工評(píng)估相結(jié)合的方式，該榜單被業(yè)界視為當(dāng)前最具參考價(jià)值的大模型性能評(píng)測(cè)之一。

在本次評(píng)測(cè)中，Qwen3.5-Max-Preview 在沒有風(fēng)格控制（without style control）的絕對(duì)勝率比拼中，整體性能排名全球第六。在細(xì)分任務(wù)層面，該模型的數(shù)學(xué)能力排名全球第五，專家級(jí)文本處理能力排名全球第十。此次亮相也是千問 3.5 系列首次以旗艦級(jí)模型身份參與國(guó)際第三方評(píng)測(cè)。

中國(guó)第一：阿里通義千問 3.5-Max-Preview 首發(fā)亮相 LM Arena 國(guó)際大模型競(jìng)技場(chǎng)

IT之家注意到，自除夕以來，阿里千問今年已陸續(xù)開源 Qwen3.5 系列的多款模型，覆蓋從 0.8B 到 397B 共 8 種不同參數(shù)規(guī)模，各尺寸模型均在同參數(shù)量級(jí)上取得領(lǐng)先性能。

其中，Qwen3.5-Plus 采用總參數(shù) 3970 億、激活參數(shù) 170 億的架構(gòu)設(shè)計(jì)，以較小的激活參數(shù)實(shí)現(xiàn)了優(yōu)于部分參數(shù)量更大模型的性能表現(xiàn)。此次亮相的 Qwen3.5-Max-Preview 是該系列旗艦?zāi)Ｐ偷念A(yù)覽版本，后續(xù)將根據(jù)社區(qū)反饋持續(xù)優(yōu)化迭代。

相關(guān)閱讀：

《阿里 Qwen3.5 開源家族擴(kuò)容，多尺寸 AI 模型上新》

廣告聲明：文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接（包括不限于超鏈接、二維碼、口令等形式），用于傳遞更多信息，節(jié)省甄選時(shí)間，結(jié)果僅供參考，IT之家所有文章均包含本聲明。

下載IT之家APP，簽到賺金幣兌豪禮

中國(guó)第一：阿里通義千問 3.5-Max-Preview 首發(fā)亮相 LM Arena 國(guó)際大模型競(jìng)技場(chǎng)

相關(guān)文章