在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

Nari Labs 開(kāi)源 16 億參數(shù)文字轉(zhuǎn)語(yǔ)音 AI 模型 Dia,支持精細(xì)化調(diào)節(jié)音頻的音色 / 情緒 / 語(yǔ)調(diào)

2025/4/24 22:33:27 來(lái)源:IT之家 作者:漾仔 責(zé)編:漾仔

IT之家 4 月 24 日消息,由兩名韓國(guó)研究者組建的 Nari Labs 工作室于前天在 GitHub 和 Hugging Face 開(kāi)源了擁有 16 億參數(shù)的文字轉(zhuǎn)語(yǔ)音 AI 模型 Dia,目前相應(yīng)模型已在 GitHub 上收獲了超過(guò) 9300 顆星標(biāo),IT之家附項(xiàng)目 GitHub 頁(yè)如下:https://github.com/nari-labs/dia

相應(yīng)研究者聲稱 Dia 的音質(zhì)相對(duì)于業(yè)界的文字轉(zhuǎn)語(yǔ)音模型擁有更靈活的自由度,同時(shí)在生成的語(yǔ)音自然度方面超越了 ElevenLabs Studio、Sesame 等競(jìng)品。其支持對(duì)輸出音頻的音色、情緒和語(yǔ)調(diào)進(jìn)行精細(xì)調(diào)節(jié),還能模擬各種非語(yǔ)言交流(如大笑、咳嗽或清嗓子等)。

官方對(duì)比測(cè)試顯示,Dia 在聲調(diào)自然度、表情豐富度和語(yǔ)音節(jié)奏感方面,均優(yōu)于專注自然語(yǔ)音合成的 ElevenLabs Studio 以及 Sesame 推出的對(duì)話語(yǔ)音模型 CSM-1B。

目前,Dia 僅支持英文,需要英偉達(dá) RTX 3080 及以上顯卡才能本地部署運(yùn)行,不過(guò)用戶也可以在 Hugging Face Spaces 線上平臺(tái)中在線使用。Nari Labs 表示,后續(xù)將推出面向普通消費(fèi)者的一鍵部署服務(wù),進(jìn)一步降低使用門(mén)檻,讓更多人無(wú)縫體驗(yàn)高質(zhì)量文本轉(zhuǎn)語(yǔ)音技術(shù)。

廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:AI,文字轉(zhuǎn)語(yǔ)音,AI 模型

軟媒旗下網(wǎng)站: IT之家 最會(huì)買(mǎi) - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機(jī)APP應(yīng)用 魔方 最會(huì)買(mǎi) 要知