IT之家 6 月 6 日消息,據(jù) Business Insider 消息,Anthropic 正通過(guò)一個(gè)由約 1000 名人類軟件工程師參與的項(xiàng)目,提升 Claude Code 的性能。
該項(xiàng)目在數(shù)據(jù)標(biāo)注公司 Snorkel AI 內(nèi)部被稱為“Marlin”(馬林魚(yú)),其核心在于微調(diào) Claude Code 的回答,使其能夠更接近開(kāi)發(fā)人員的真實(shí)工作環(huán)境。
像 Anthropic 這樣的 AI 公司通常會(huì)將數(shù)據(jù)工作外包給諸如 Snorkel 之類的第三方公司,而這些第三方公司會(huì)雇傭外包人員來(lái)向 AI 教授各種專業(yè)領(lǐng)域的學(xué)科,并執(zhí)行其他任務(wù)以改進(jìn)模型。
兩位參與該 Anthropic 項(xiàng)目的外包人員透露,他們編寫(xiě)提示詞并審查代碼的報(bào)酬為每項(xiàng)任務(wù) 280 美元(IT之家注:現(xiàn)匯率約合 1902 元人民幣)。他們表示,每項(xiàng)任務(wù)大約需要一小時(shí),不過(guò)有些提交的內(nèi)容需要與 Snorkel 的審批層進(jìn)行多輪溝通。
在 Marlin 項(xiàng)目中,擁有軟件工程背景的外包人員被要求對(duì)兩種不同模型生產(chǎn)的代碼進(jìn)行 A/B 測(cè)試。他們會(huì)比較兩組輸出,選擇自己更偏好的結(jié)果,并判斷模型是否真正達(dá)到了提示詞要求的細(xì)節(jié)程度。
一名外包人員表示,該項(xiàng)目旨在確保模型能夠達(dá)到提示詞中所期望的詳細(xì)程度,從本質(zhì)上講,就是在訓(xùn)練 Claude Code 生產(chǎn)更簡(jiǎn)化、更易于維護(hù)的代碼。
據(jù)悉,該項(xiàng)目目前仍在進(jìn)行中。外包人員并不知道他們所評(píng)估的是哪個(gè)版本的模型。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。