IT之家 2 月 25 日消息,今日人工智能公司 Anthropic 宣布推出其首款“混合推理模型”——Claude 3.7 Sonnet。該模型可以解決更復(fù)雜的問(wèn)題,并在數(shù)學(xué)和編碼等領(lǐng)域中性能超過(guò)了以前的模型。

Anthropic 公司表示,這是其有史以來(lái)“最智能”的 AI 模型,稱這種“混合型”模型同時(shí)具備“推理模式”(停下來(lái)思考復(fù)雜答案)與傳統(tǒng)模式(實(shí)時(shí)生成答案)的能力,并表示該模型是市面上唯一的此類“混合”模型。


IT之家注意到,除了新模型外,Anthropic 還發(fā)布了其“自主性”編程工具 Claude Code 的“有限研究預(yù)覽版”。盡管 Anthropic 已經(jīng)為如 Cursor 等人工智能編程工具提供支持,但此次推出的 Claude Code 被定位為一個(gè)“積極的合作伙伴”,它能夠搜索和閱讀代碼、編輯文件、編寫(xiě)和運(yùn)行測(cè)試、將代碼提交到 GitHub,并使用命令行工具。

從本周一開(kāi)始,用戶可以在 Claude 應(yīng)用程序中使用 Claude 3.7 Sonnet,開(kāi)發(fā)者也可以通過(guò) Anthropic 的 API、亞馬遜 Bedrock 和谷歌云的 Vertix AI 獲取該模型。其運(yùn)行成本與前代產(chǎn)品 3.5 Sonnet 相同,輸入每百萬(wàn) token 收費(fèi) 3 美元,輸出每百萬(wàn) token 收費(fèi) 15 美元。
目前,OpenAI 等公司提供獨(dú)立的推理模型,但 Anthropic 產(chǎn)品研究主管 Dianne Penn 表示,公司希望簡(jiǎn)化使用模型的體驗(yàn)。她指出:“我們從根本上認(rèn)為,推理是人工智能的一個(gè)特征,而不是一個(gè)完全獨(dú)立的事物?!彼€提到,Claude 在回答簡(jiǎn)單問(wèn)題如“現(xiàn)在幾點(diǎn)了?”和應(yīng)對(duì)更復(fù)雜的提示,例如“規(guī)劃一個(gè)為期兩周的意大利之旅,并考慮 3 月下旬的天氣”時(shí),回應(yīng)速度差異不大。
Dianne Penn 稱,Claude 3.7 Sonnet 在“自主性編程”、金融和法律任務(wù)上的表現(xiàn)明顯優(yōu)于前代產(chǎn)品。盡管該模型仍不具備實(shí)時(shí)網(wǎng)絡(luò)搜索功能,但其知識(shí)截止日期為 2024 年 10 月,比其他模型更新。此外,Anthropic 還允許開(kāi)發(fā)者通過(guò)其“草稿紙”功能指導(dǎo)模型的“思考”方式,甚至可以精確控制模型的響應(yīng)時(shí)間。Anthropic 產(chǎn)品副總裁 Michael Gerstenhaber 表示:“有時(shí)開(kāi)發(fā)者只需要明確指出,回答這個(gè)問(wèn)題不應(yīng)超過(guò) 200 毫秒?!彼J(rèn)為這是產(chǎn)品決策的一部分。
在 Anthropic 內(nèi)部,員工已利用 Claude 3.7 Sonnet 完成前端網(wǎng)站設(shè)計(jì)、交互式游戲開(kāi)發(fā)等任務(wù)。Penn 透露,該模型甚至能通過(guò)反復(fù)構(gòu)建和編輯測(cè)試用例,支持長(zhǎng)達(dá) 45 分鐘的編碼工作。她還提到,公司通過(guò)將模型的 API 映射到游戲控制器方案,測(cè)試模型在一款經(jīng)典《寶可夢(mèng)》電子游戲中的表現(xiàn)。結(jié)果顯示,前代 Claude 3.5 Sonnet 無(wú)法走出游戲初期的帕雷特鎮(zhèn),而 3.7 版本成功擊敗了多個(gè)道館館主。
目前,Anthropic 憑借 Claude 3.7 Sonnet 的性能提升再次處于領(lǐng)先地位。該模型的發(fā)布也表明,行業(yè)正朝著一個(gè)模型能夠完成所有任務(wù)的未來(lái)邁進(jìn),而非提供獨(dú)立的推理模型。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。