IT之家 9 月 8 日消息,在 2023 外灘大會(huì)上,螞蟻集團(tuán)宣布發(fā)布金融大模型,并開(kāi)源生成式 AI 編程平臺(tái) CodeFuse。
螞蟻集團(tuán)首席技術(shù)官、平臺(tái)技術(shù)事業(yè)群總裁何征宇在接受采訪時(shí)介紹,螞蟻大模型走純自研的技術(shù)路線,以全棧布局、長(zhǎng)線發(fā)展為原則,以創(chuàng)造產(chǎn)業(yè)價(jià)值為目標(biāo)。為此,螞蟻堅(jiān)決投入大模型底層基礎(chǔ)設(shè)施,目前已建成萬(wàn)卡 AI 集群,訓(xùn)練效率領(lǐng)先行業(yè),為大模型產(chǎn)業(yè)化應(yīng)用提供有力支撐。

何征宇介紹,螞蟻一直以來(lái)堅(jiān)持核心技術(shù)自主創(chuàng)新,2022 年底正式立項(xiàng)大模型研發(fā),目前已形成從基礎(chǔ)大模型到行業(yè)大模型以及產(chǎn)業(yè)應(yīng)用的全棧布局。
今天發(fā)布的螞蟻金融大模型基于螞蟻基礎(chǔ)大模型,針對(duì)金融產(chǎn)業(yè)深度定制。何征宇介紹,螞蟻基礎(chǔ)大模型平臺(tái)具備萬(wàn)卡異構(gòu)集群,其中千卡規(guī)模訓(xùn)練 MFU 可達(dá)到 40%,集群有效訓(xùn)練時(shí)長(zhǎng)占比 90% 以上,RLHF 訓(xùn)練在同等模型效果下訓(xùn)練吞吐性能相較于業(yè)界方案提升 3.59 倍,推理性能相較于業(yè)界方案提升約 2 倍,處于業(yè)界先進(jìn)水平。
何征宇表示,未來(lái)螞蟻將持續(xù)探索和精進(jìn)大模型的五大能力方向,IT之家總結(jié)如下:
一是,建設(shè)高質(zhì)量的數(shù)據(jù)標(biāo)注團(tuán)隊(duì),沉淀高質(zhì)量數(shù)據(jù)體系;
二是,攻堅(jiān)基礎(chǔ)大模型算法,以及高效綠色工程能力,提升模型邏輯推理等能力;
三是,從通用語(yǔ)言大模型到通用多模態(tài)大模型,從一般通識(shí)走向全面專(zhuān)業(yè);
四是,建設(shè)高效的大模型評(píng)測(cè)標(biāo)準(zhǔn)和評(píng)測(cè)體系,加快大模型迭代速度;
五是,建設(shè)大模型安全能力,保障大模型健康可持續(xù)發(fā)展。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。