IT之家 10 月 23 日消息,據(jù)字節(jié)跳動 Seed 官方公眾號,字節(jié)跳動 Seed 團隊今天推出 3D 生成大模型 ——Seed3D 1.0,實現(xiàn)從單張圖像到高質(zhì)量仿真級 3D 模型的端到端生成。Seed3D 1.0 基于創(chuàng)新的 Diffusion Transformer 架構(gòu),通過大規(guī)模數(shù)據(jù)訓(xùn)練完成,可生成包括精細幾何、真實紋理和基于物理渲染(PBR)材質(zhì)的完整 3D 模型。

IT之家從官方介紹中獲悉,通過 Seed3D 1.0 生成的 3D 模型能夠無縫導(dǎo)入 Isaac Sim 等仿真引擎,僅需少量適配工作即可支持具身智能大模型訓(xùn)練。此外,通過分步的場景生成,Seed3D 1.0 可從單個物體生成,拓展至構(gòu)建完整的 3D 場景。
Seed 團隊還稱,此次發(fā)布的 Seed3D 1.0 紋理與材質(zhì)生成性能超過此前的開源及閉源模型,幾何生成性能超過業(yè)界更大參數(shù)規(guī)模的模型,綜合能力達到行業(yè)領(lǐng)先水平。

Seed3D 1.0 采用生成式 AI 廣泛應(yīng)用的模型架構(gòu) Diffusion Transformer,來設(shè)計 3D 幾何生成和紋理貼圖模型。其能夠?qū)崿F(xiàn)對 3D 幾何的高精度構(gòu)建,既能生成精確的結(jié)構(gòu)細節(jié),又能保證封閉曲面、流形幾何等形態(tài)的物理完整性,以滿足仿真計算要求。
官方還表示,Seed3D 1.0 基于多模態(tài) Diffusion Transformer 架構(gòu),構(gòu)建了多視角圖片生成模型。模型輸入?yún)⒖紙D片和 3D 幾何渲染圖,輸出多視角一致的紋理圖像。
官方提供的測試結(jié)果稱,Seed3D 1.0 在細節(jié)保持和結(jié)構(gòu)完整性方面優(yōu)于其他方法,1.5B 參數(shù)的 Seed3D 1.0 在性能上超過了業(yè)界 3B 參數(shù)的模型(Hunyuan3D-2.1),能夠更準確地還原復(fù)雜物體的精細特征。


采用分步生成策略,Seed3D 1.0 還可從生成單一物體拓展至生成完整、連貫的 3D 場景。系統(tǒng)能夠首先利用視覺語言模型從輸入圖像中提取對象和空間關(guān)系的信息,構(gòu)建場景布局圖;然后為每個對象生成相應(yīng)的 3D 模型;最后根據(jù)空間布局將各個物體組裝成完整場景。這一框架使 Seed3D 1.0 能夠生成豐富的 3D 環(huán)境,從辦公室空間到城市街景,為世界模擬器提供了場景內(nèi)容支撐。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。