IT之家 1 月 13 日消息,南京農(nóng)業(yè)大學(xué)今日官宣,在上周的中國高等教育學(xué)會高等農(nóng)林教育分會 2025 年年會的分論壇“數(shù)智技術(shù)重塑農(nóng)林教育全維度變革”上,南京農(nóng)業(yè)大學(xué)正式發(fā)布司農(nóng)大語言模型(Sinong)。

該模型是國內(nèi)首個面向通用農(nóng)業(yè)領(lǐng)域的開源垂直大語言模型,同時也是南京農(nóng)業(yè)大學(xué)主導(dǎo)研發(fā)的首個農(nóng)業(yè)領(lǐng)域大語言模型。司農(nóng)大語言模型的發(fā)布,標(biāo)志著南京農(nóng)業(yè)大學(xué)在農(nóng)業(yè)領(lǐng)域的人工智能基礎(chǔ)模型研究與應(yīng)用新突破。

“司農(nóng)”模型重點(diǎn)立足服務(wù)農(nóng)業(yè)領(lǐng)域,命名取自中國古代財政與農(nóng)業(yè)管理官職體系。研究團(tuán)隊(duì)依托學(xué)校農(nóng)業(yè)領(lǐng)域?qū)W科優(yōu)勢,收集了包括動物科學(xué)、農(nóng)業(yè)經(jīng)濟(jì)管理、農(nóng)業(yè)資源與環(huán)境、園藝學(xué)、智慧農(nóng)業(yè)、動物醫(yī)學(xué)、植物保護(hù)、作物育種等細(xì)分學(xué)科數(shù)據(jù),總量超過 40 億 token 的農(nóng)業(yè)領(lǐng)域?qū)I(yè)數(shù)據(jù),涵蓋了近 9,000 冊書籍、24 萬余篇學(xué)術(shù)論文和近 2 萬份政策、標(biāo)準(zhǔn)以及海量網(wǎng)絡(luò)知識,構(gòu)建了農(nóng)業(yè)基礎(chǔ)數(shù)據(jù)集。
在模型訓(xùn)練階段,除傳統(tǒng)指令微調(diào)外,團(tuán)隊(duì)引入了思維鏈和上下文參考等多維訓(xùn)練數(shù)據(jù),提升了模型對于農(nóng)業(yè)專業(yè)知識的理解與生成能力。
此外,針對領(lǐng)域文獻(xiàn)知識利用效率問題,團(tuán)隊(duì)推出多智能體檢索增強(qiáng)框架。該框架通過優(yōu)化知識庫構(gòu)建、智能查詢改寫、混合檢索等策略,使模型能夠精準(zhǔn)調(diào)用專業(yè)知識,保障了生成內(nèi)容的準(zhǔn)確性與時效性。
目前,司農(nóng)大語言模型已在魔搭社區(qū)和 GitHub 社區(qū)全面開源,發(fā)布了 8B 和 32B 兩種參數(shù)規(guī)模的版本。IT之家附開源地址如下:
魔搭社區(qū)開源地址:https://modelscope.cn/organization/NAULLM
GitHub 社區(qū)開源地址:https://github.com/njauzzx/Sinong
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。