IT之家 3 月 20 日消息,阿里千問大模型家族再迎新成員。今日,Qwen3.5-Max-Preview 作為千問 3.5 系列的旗艦?zāi)P皖A(yù)覽版,在全球大模型競(jìng)技平臺(tái) LM Arena 正式亮相,并獲得 1464 分的綜合得分。
憑借這一成績(jī),阿里千問在 LM Arena 全球大模型公司排行榜中的排名上升至全球第五位,位列中國(guó)公司首位。

據(jù)阿里云介紹,LM Arena 是由國(guó)際開源研究機(jī)構(gòu) LMSYS 組織的第三方大模型評(píng)測(cè)平臺(tái),其評(píng)測(cè)機(jī)制采用模型兩兩匿名對(duì)戰(zhàn),由全球開發(fā)者進(jìn)行盲測(cè)投票,最終根據(jù)勝負(fù)結(jié)果形成模型分?jǐn)?shù)與排名。由于采用開放式對(duì)戰(zhàn)與人工評(píng)估相結(jié)合的方式,該榜單被業(yè)界視為當(dāng)前最具參考價(jià)值的大模型性能評(píng)測(cè)之一。
在本次評(píng)測(cè)中,Qwen3.5-Max-Preview 在沒有風(fēng)格控制(without style control)的絕對(duì)勝率比拼中,整體性能排名全球第六。在細(xì)分任務(wù)層面,該模型的數(shù)學(xué)能力排名全球第五,專家級(jí)文本處理能力排名全球第十。此次亮相也是千問 3.5 系列首次以旗艦級(jí)模型身份參與國(guó)際第三方評(píng)測(cè)。

IT之家注意到,自除夕以來,阿里千問今年已陸續(xù)開源 Qwen3.5 系列的多款模型,覆蓋從 0.8B 到 397B 共 8 種不同參數(shù)規(guī)模,各尺寸模型均在同參數(shù)量級(jí)上取得領(lǐng)先性能。
其中,Qwen3.5-Plus 采用總參數(shù) 3970 億、激活參數(shù) 170 億的架構(gòu)設(shè)計(jì),以較小的激活參數(shù)實(shí)現(xiàn)了優(yōu)于部分參數(shù)量更大模型的性能表現(xiàn)。此次亮相的 Qwen3.5-Max-Preview 是該系列旗艦?zāi)P偷念A(yù)覽版本,后續(xù)將根據(jù)社區(qū)反饋持續(xù)優(yōu)化迭代。
相關(guān)閱讀:
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。