IT之家 5 月 21 日消息,在今年的 I/O 開發(fā)者大會上,谷歌發(fā)布新一代視頻生成模型 Veo3,這也是其首個可生成視頻背景音效的模型。它不僅能合成畫面,還能為鳥鳴或街頭交通等場景配上相應的音效,甚至還可生成人物對話。

谷歌稱,Veo 3 在物理模擬與口型同步方面也表現(xiàn)優(yōu)異。目前,該模型僅面向美國地區(qū)的 Gemini Ultra 用戶,以及 Vertex AI 的企業(yè)用戶開放,也已集成進谷歌的 AI 影視制作工具 Flow 中。

用戶仍可為 Veo 2 提供人物、風格、場景或物體的圖像參考,并通過 Flow 使用鏡頭控制功能進行旋轉、縮放,甚至將畫面從豎屏調整為橫屏,或在視頻中添加、刪除元素。
當前用戶越來越難以辨別 AI 生成內容,谷歌為此推出了 SynthID Detector。用戶可上傳媒體文件以檢測其是否包含 SynthID 水印,這是谷歌用于識別 AI 作品的標記工具。不過,目前并非所有圖像生成模型都支持這一水印。
谷歌 I/O 開發(fā)者大會仍在進行,IT之家將保持關注。
廣告聲明:文內含有的對外跳轉鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結果僅供參考,IT之家所有文章均包含本聲明。