IT之家 4 月 24 日消息,據(jù)《科創(chuàng)板日報》今日報道,美團新一代基礎大模型 LongCat-2.0-Preview 已經(jīng)開放邀請測試,該模型總參數(shù)規(guī)模突破萬億,量級躋身全球頂尖大模型行列。
這款尚未公布正式命名的大模型參數(shù)量級達到萬億級別,采用了混合專家(MoE)的先進架構,整體能力被業(yè)內(nèi)人士認為對標 GPT-4。此外,有知情人士稱該模型完全基于國產(chǎn)化算力集群訓練,這表明美團可能已經(jīng)率先在使用國產(chǎn)算力訓練萬億模型上取得突破。
早在 2024 年財報業(yè)績會上,美團創(chuàng)始人王興就曾首次公開披露美團的 GPU 儲備戰(zhàn)略,不僅在當年持續(xù)投入數(shù)十億美元保障充足的算力供應,還明確表示未來將進一步加大投資力度,為大模型的研發(fā)筑牢基礎。
去年 9 月,美團已發(fā)布并開源了首款自研大語言模型 LongCat-Flash,該模型同樣基于 MoE 架構,擁有 5600 億總參數(shù),憑借打破常規(guī)的“零計算專家機制”等創(chuàng)新優(yōu)化設計,在保持了極高推理效率的同時顯著降低了運營成本,詳情可見IT之家此前報道。
相關閱讀:
《美團發(fā)布 LongCat-AudioDiT 音頻生成模型:說話人相似度指標提升至 0.818,現(xiàn)已開源》
《美團 LongCat 大模型官方 App 發(fā)布:支持聯(lián)網(wǎng)搜索,還可以發(fā)起語音通話》
《美團發(fā)布并開源 LongCat-Flash-Chat 大模型:總參數(shù) 560B,AI 智能體任務表現(xiàn)突出》
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。