在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

英偉達開源 OCR 代碼推理 AI 模型:LiveCodeBench 基準超 OpenAI o3-Mini 和 o1(low)

2025/5/9 14:28:51 來源:IT之家 作者:故淵 責(zé)編:故淵

IT之家 5 月 9 日消息,科技媒體 marktechpost 昨日(5 月 8 日)發(fā)布博文,報道稱英偉達開源其 Open Code Reasoning(OCR)模型套裝,含 32B、14B 和 7B 三種參數(shù)規(guī)模,均采用 Apache 2.0 許可證發(fā)布,模型權(quán)重和配置已在 Hugging Face 平臺開放下載。

OCR 模型套裝提供三種參數(shù)規(guī)模,分別為 OpenCodeReasoning-Nemotron-32B、14B 和 7B,均使用 Nemotron 架構(gòu)(一種為多語言、多任務(wù)學(xué)習(xí)優(yōu)化的 transformer 框架)訓(xùn)練。

32B 模型面向高性能推理和研究場景,提供頂尖效果;14B 模型在降低計算需求的同時保持強大推理能力;7B 模型則適合資源受限的環(huán)境,仍能在基準測試中展現(xiàn)競爭力。

此外,32B 模型還推出了指令微調(diào)版本,支持與開放推理生態(tài)系統(tǒng)無縫兼容,適配 llama.cpp、vLLM、Hugging Face Transformers 和 TGI 等主流框架,方便開發(fā)者快速集成。

Open Code Reasoning(OCR)模型套裝在代碼推理領(lǐng)域展現(xiàn)出驚人實力。在 LiveCodeBench 基準測試中,這套模型全面超越 OpenAI 的 o3-Mini 和 o1 (low) 模型。

ModelLiveCodeBench Avg.CodeContest All
DeepSeek-R165.626.2
QwQ-32B61.320.2



Distilled 7B+ Models




Bespoke-Stratos-7B14.72.0
OpenThinker-7B25.55.0
R1-Distill-Qwen-7B38.011.1
OlympicCoder-7B40.910.6
OCR-Qwen-7B48.516.3
OCR-Qwen-7B-Instruct51.318.1



Distilled 14B+ Models




R1-Distill-Qwen-14B51.317.6
OCR-Qwen-14B57.722.6
OCR-Qwen-14B-Instruct59.423.6



Distilled 32B+ Models




Bespoke-Stratos-32B30.16.3
OpenThinker-32B54.116.4
R1-Distill-Qwen-32B58.118.3
OlympicCoder-32B57.418.0
OCR-Qwen-32B61.824.6
OCR-Qwen-32B-Instruct61.724.4

IT之家注:LiveCodeBench 是一個綜合評估平臺,專注于調(diào)試、代碼生成和邏輯補全等真實開發(fā)者環(huán)境中的任務(wù)。

這一成就不僅得益于模型架構(gòu)的優(yōu)化,還歸功于英偉達打造的定制“OCR 數(shù)據(jù)集”。該數(shù)據(jù)集聚焦高質(zhì)量代碼訓(xùn)練,強調(diào)指令遵循、推理能力和多步驟問題解決能力。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:開源,英偉達,AI

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知