感謝IT之家網(wǎng)友 最美的煙火、HH_KK、咩咩洋、八叛逆、軟媒用戶1238620、Aqrathn、Domado、補藥吖、花雨龘魔王、千帆起、lxylizi、枯、Coje_He 的線索投遞!
IT之家 6 月 18 日消息,DeepSeek 多模態(tài)研究員 Xiaokang Chen 今日表示,DeepSeek 的識圖模式已在網(wǎng)頁和 App 端正式上線。

IT之家測試,目前 DeepSeek 的 App 端識圖模式依然提示“圖片理解功能內(nèi)測中”,網(wǎng)頁端沒有這項提示。

“識圖模式”與“快速模式”和“專家模式”并列,開啟該模式后,用戶可以直接上傳圖片讓 DeepSeek“看”世界,其能力邊界遠超簡單的文字提取。

伴隨著識圖模式的上線,DeepSeek 今年 4 月還公開了其背后的多模態(tài)模型技術(shù)細節(jié),公布了一種名為“Thinking with Visual Primitives(以視覺原語思考)”的核心框架。
廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。