在线观看日韩三级视频,国产久久精品在线播放,精品人妻伦一二三区久久简爱,久久亚洲精品一区二区,日韩人妻一区二区av,欧美黑人又粗又大高潮喷水,国产91精品在线播放,国产欧美日韩一区二区三视频,亚洲一区二区伦理在线

設(shè)置
  • 日夜間
    隨系統(tǒng)
    淺色
    深色
  • 主題色

博士意外發(fā)現(xiàn)秘密:DALL-E 2 自創(chuàng)語言,人看不懂但能生成特定圖像,可能會被用來搞事!

量子位 2022/6/1 14:10:04 責(zé)編:瀟公子

DALL?E 2,這個 AI 竟然自己搞了一套秘密語言。

例如這兩個非常奇怪的詞組:

  • Apoploe vesrreaitais(下文簡稱 A)

  • Contarra ccetnxniams luryca tanniounons(下文簡稱 C)

(翻譯軟件都會崩潰,可以去試試)

但到了 DALL?E 2 這里,畫風(fēng)卻截然不同。在它看來,A 就是“鳥類”的意思,而 C 則是“害蟲”之意。于是乎,如果給 DALL?E 2 喂上一句:A eat C,那么它的打開方式就會這樣:

清一色產(chǎn)出的圖片,都是鳥吃害蟲相關(guān)。

而且你要是跟 DALL?E 2 說,生成“兩只鯨魚討論食物,帶字幕”,結(jié)果會是這樣:

圖里的“Wa ch zod rea”,在 DALL?E 2 的詞庫里竟然是“食物”的意思!此事一經(jīng)曝光,瞬間引發(fā)了眾多網(wǎng)友的熱議。

甚至還有人提出,有了這些秘密語言,可以繞開 DALL?E 2 的“違禁詞過濾器”,從而生成一些有爭議的圖像了。(搞事情?。?/p>

所以,關(guān)于 DALL?E 2 的秘密咒語,到底是怎么一回事?

一次意外的發(fā)現(xiàn)

發(fā)現(xiàn)這個問題的是國外一名計算機專業(yè)的博士生。

他注意到 DALL-E 2 模型在遇到需要給出帶文字的圖像時,總是會出現(xiàn)一些奇怪的單詞。比如輸入這句:“兩個農(nóng)民談?wù)撌卟耍瑤ё帜唬═wo farmers talking about vegetables, with subtitles)”,就出來這樣一張圖像:

像是挺像的,不過這字幕寫的啥啊,不是英語又不是法語的,太奇怪了?!澳憬o我翻譯翻譯什么這是?”靈機一動的小哥把其中一個“單詞”“Vicootes”當(dāng)作描述丟給模型,沒想到,出來這樣一堆圖像:

有蘿卜、有南瓜、有小柿子…… 難道“Vicootes”就代表蔬菜?有意思。接著他又把氣泡中的那一串“Apoploe vesrreaitais”扔給 DALL-E 2,一堆鳥圖出現(xiàn)了:

“哦我明白了,這個單詞代表‘鳥’,所以農(nóng)民們似乎在談?wù)撚绊懰麄兪卟说镍B類?”看來 DALL-E 2 沒有糊弄人……

“我發(fā)現(xiàn)了 DALL-E 2 的秘密語言!”小哥驚呼,繼而打算再驗證一下這是不是偶然。還是剛才提到的鯨魚討論食物的例子中,小哥把那串“Wa ch zod rea”再輸回去。結(jié)果還真出來一堆吃的,而且還全是海鮮,符合鯨魚們的“食性”

。

DALL-E 2,真?誠不我欺。更進一步,他用這些“咒語”搭配形容圖像風(fēng)格的詞,看看 DALL-E 2 是否能正常解析。結(jié)果也都沒問題??纯催@些“手繪鳥“、“卡通鳥”、“3D 鳥”以及“線稿鳥”:

emmmm,最后一張怎么混進來個蚊子?先不管它了(一會再說)。所以這個模型為什么要用這種秘密語言來表示呢?

為什么會這樣?

“DALL-E 2 秘密咒語”話題之熱,也引來了眾多“解析俠”們的關(guān)注。例如一位叫 k1uge 的網(wǎng)友便提出,問題出在了 BPE(Byte Pair Encoding)身上。

BPE 是自然語言語言處理中較為重要的編碼方式之一,也是一種常見的 token 壓縮方法,在很多大語言模型中都會涉及。

它的核心思路就是:

每一步都將最常見的一對相鄰數(shù)據(jù)單位,替換為該數(shù)據(jù)中沒有出現(xiàn)過的一個新單位,反復(fù)迭代直到滿足停止條件。

舉個例子,如果要壓縮“aaabdaaabac”這個單詞,BPE 就會先找出最常見的相鄰字節(jié)對,即“aa”。找到它之后,就可以用新的字節(jié) Z 去代替,那么這個單詞就變成了“ZabdZabac”。同理,下一個最常見相鄰字節(jié)對是“ab”,用 Y 來代替,單詞會進一步被壓縮成“ZYdZYac”。再下一個最常見相鄰字節(jié)對是“ZY”,用 X 來替代,最后單詞就變成了“XdXac”。

……

于是,基于這樣的原理,這位網(wǎng)友查了下 DALL-E 2 針對“鳥類”所用的 BPE。

它是這樣的:apo, plo, e, ,ve, sr, re, ait, ais

而現(xiàn)實中很多鳥類的拉丁文學(xué)名,就有“apo”和“plo”的前綴。例如 Apodidae(雨燕)和 Ploceidae(織布鳥),這兩個單詞屬于鳥類的 2 種鳥科,每個科都有 100 余種。像 Apodiformes(雨燕目)是鳥類中最大的目,共有 400 余種。于是這位網(wǎng)友便認為,DALL-E 2 是從標(biāo)有這些“學(xué)術(shù)用語”標(biāo)簽的圖片中,獲取到了關(guān)于鳥類的大部分信息。

或許這就是造成 DALL-E 2 秘密咒語的原因了。

但,事情還有反轉(zhuǎn)

激動的博士小哥還專門寫了一篇小論文講述這個事情,還把這些發(fā)現(xiàn)都發(fā)在了推特上,引來數(shù)千網(wǎng)友圍觀,令大家直呼“Incredible”。

不過很快就有人親自去試了一下,發(fā)現(xiàn)好像事情并沒有那么簡單。比如代表“蟲子”的那一串“Contarra ccetnxniams luryca tanniounons”,除了蟲子,也會生成一些青蛙、牛或者鴿子的圖像。

如果給這個描述再加上“cartoon”一詞作為限定,生成的是一些“奶奶”,跟蟲子完全不搭邊??

“Apoploe vesrreaitais”倒是沒問題,出來的還是一些鳥。

不過同樣,一旦給它加上“cartoon”“3D render”這類詞,又不對了,出來的是一些蟲子。(這和小哥最后那個例子里出現(xiàn)的蚊子也對應(yīng)上了。)

代表蔬菜的“Vicootes”也是這樣,單輸沒問題,一加上風(fēng)格限定,出現(xiàn)的物種就變了;且基本可以說只符合“油畫”“卡通”這些風(fēng)格設(shè)定,跟前面的名詞限定毫無關(guān)聯(lián),比如“Vicootes”+“painting”就是一堆純風(fēng)景繪畫。

接著他還用同樣的“兩只鯨魚談?wù)撌澄?,帶字幕”生成了一些圖片,結(jié)果大部分文字都看不清,也沒法轉(zhuǎn)錄。最后找到一張這樣的:

他用上面的”Evve waeles”再輸入后,雖然得到了一張?zhí)瘘c照片,但出現(xiàn)了很多運動員、動物甚至水壺的照片。

還真的有點摸不著頭腦了。于是這位實驗者就表示:在我看來,這更像是一些隨機的噪音,而不是 DALL-E 2 的秘密語言。

他艾特了博士小哥,希望他可以再給出相反的證據(jù)。目前小哥還沒有答復(fù)。

不過這確實是一個值得關(guān)注和討論的話題,鑒于一些“咒語”和圖像可以對上,如果真的是 BPE 碼的話,那么真可能博士小哥所說:

有人用“白盒”方法解開這種規(guī)則,拿到一些違禁詞的“咒語”,就可以繞過模型的過濾器了。

廣告聲明:文內(nèi)含有的對外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。

相關(guān)文章

關(guān)鍵詞:圖像,模型,語言

軟媒旗下網(wǎng)站: IT之家 最會買 - 返利返現(xiàn)優(yōu)惠券 iPhone之家 Win7之家 Win10之家 Win11之家

軟媒旗下軟件: 軟媒手機APP應(yīng)用 魔方 最會買 要知