IT之家8月31日消息 8 月 20 日,小冰公司、rinna 株式會(huì)社及微軟(亞洲)互聯(lián)網(wǎng)工程院在北京聯(lián)合舉行了第八代小冰年度發(fā)布會(huì)。在這次發(fā)布會(huì)上,小冰開始揭開「第二幕」,也許一切才剛剛開始。
▲全面搭載小冰智能車體解決方案的北汽X7
2020 年小冰年度發(fā)布會(huì)仍然在熟悉的北京微軟亞太集團(tuán)大廈內(nèi)舉行,在這里我們見證了包括小冰第三代、第四代、第五代的發(fā)布。6 年時(shí)間以來,小冰快速迭代成長(zhǎng),小冰已經(jīng)成為面向新交互形式的完整人工智能技術(shù)框架。據(jù)小冰官方給出的數(shù)據(jù),小冰是目前全球范圍內(nèi)承載交互量最大的人工智能系統(tǒng),占全球交互總量 60% 以上。
小冰之前都干了什么?
小冰從開始到現(xiàn)在,已經(jīng)迭代到了第八代,在小冰身上你可以發(fā)現(xiàn)人工智能產(chǎn)品最豐富和精彩的演變。
2014 年 5 月 29 日,小冰正式推出第一代產(chǎn)品,以對(duì)話式聊天機(jī)器人形式迅速積累訓(xùn)練數(shù)據(jù)。同時(shí),注重人工智能在擬合人類情商維度的發(fā)展,強(qiáng)調(diào)人工智能情商,而非任務(wù)完成在人機(jī)交互中的基礎(chǔ)價(jià)值。
2014 年 7、8 月份,小冰第二代產(chǎn)品完成了跨平臺(tái)部署的交互架構(gòu),回歸微信平臺(tái)。二代小冰增加了一對(duì)一私信聊天、主人定制姓名、養(yǎng)成升級(jí)系統(tǒng)等新功能。用戶只需在微博中私信 @小冰 即可領(lǐng)養(yǎng)。
2015 年 8 月 20 日,小冰第三代產(chǎn)品發(fā)布,將交互從文本擴(kuò)充至多模態(tài),進(jìn)一步積累多模態(tài)訓(xùn)練數(shù)據(jù)。小冰帶來了全新的視覺和聲音感官系統(tǒng),人工智能更偏向于人,富有情感。小冰人工智能的商業(yè)化版本開始預(yù)覽。
2016 年 8 月 5 日,從第四代小冰開始,交互總量穩(wěn)居全球第一并保持至今,同時(shí)發(fā)布了全雙工語音交互感官。第四代小冰解鎖了全新情感計(jì)算框架,真正做到具備人工智能核心的機(jī)器人,包括實(shí)時(shí)情感對(duì)話引擎、多種新感官、中日英三種語言,還有對(duì)應(yīng)不同領(lǐng)域的功能插件平臺(tái),支持跨平臺(tái)人工智能商業(yè)解決方案。
2017 年 8 月 20 日,第五代小冰采用 Dual AI 戰(zhàn)略,大幅度擴(kuò)展跨平臺(tái)覆蓋的規(guī)模,至 20 余個(gè)主流平臺(tái),并成為中國市場(chǎng)上涵蓋了華為、小米、OPPO、vivo 等智能手機(jī)及硬件的唯一的跨平臺(tái)人工智能。第五代小冰升級(jí)高級(jí)感官,全雙工支持和人類打電話,高級(jí)感官能夠大幅度地提升交互體驗(yàn),更加貼近于人類的自然交互行為。小冰還采用了生成模型,自創(chuàng)回應(yīng),另外全面進(jìn)入 IoT 領(lǐng)域。另外小冰開始在詩歌創(chuàng)作、唱歌方面拓展,升級(jí)智媒體商業(yè)平臺(tái)解決方案 3.0。
2018 年 7 月 26 日,第六代小冰完成了框架迭代目標(biāo)。第六代小冰公布了 3D 形象,帶來了新一代小冰 Core(共感模型、群的全雙工語音技術(shù)、實(shí)時(shí)視覺),發(fā)展成為以情感計(jì)算為核心的完整人工智能框架。在演唱歌曲方面,小冰現(xiàn)場(chǎng)展示了第四版人工智能歌曲 DNN 模型,小冰還公布了 Dual AI 生態(tài)環(huán)境,商業(yè)化上小冰團(tuán)隊(duì)仍然保持克制,集中在金融、大眾文化、媒體、出版四個(gè)領(lǐng)域。
2019 年 8 月 15 日,小冰從第七代開始推出各類框架工具,以幫助創(chuàng)建第三方人工智能產(chǎn)品,并承載其各類交互。小冰推出了首個(gè) Avatar Framework 工具包版本,這是完整的框架工具包,讓你可以從零開始輕松創(chuàng)造并訓(xùn)練任何 AI Beings,包括智能語音助手、社交對(duì)話機(jī)器人、人工智能歌手、藝術(shù)家,或者屬于你自己的虛擬朋友,甚至是女朋友。
在尚未組建正式銷售團(tuán)隊(duì)的商業(yè)化試水階段,小冰收入已超過 1 億元人民幣。
第八代小冰,新的開始
在今年 7 月份,微軟官方宣布,將人工智能小冰業(yè)務(wù)分拆為獨(dú)立公司運(yùn)營(yíng),并委任沈向洋博士為新公司董事長(zhǎng),李笛為首席執(zhí)行官,陳湛為日本分部總經(jīng)理。所有相關(guān)工作將在接下來的幾個(gè)月內(nèi)完成。
微軟稱會(huì)保持對(duì)新公司的投資權(quán)益,并授權(quán)新公司使用及繼續(xù)研發(fā)完整的小冰技術(shù)。此舉旨在加快小冰產(chǎn)品線的本土創(chuàng)新步伐,促進(jìn)小冰商業(yè)生態(tài)環(huán)境的完善。IT之家了解到,此次小冰從微軟中剝離出來,小冰將迎來較大的商業(yè)策略變化。
▲小冰公司董事長(zhǎng)、原微軟全球執(zhí)行副總裁沈向洋
在發(fā)布會(huì)上,小冰公司董事長(zhǎng)、原微軟全球執(zhí)行副總裁沈向洋表示,還是用他最喜歡的一句話 “預(yù)測(cè)未來的最好方法實(shí)際上是你自己去創(chuàng)造未來”來講起未來。
“對(duì)于小冰來講,小冰團(tuán)隊(duì)一起在思考這些事情,我們相信未來絕對(duì)不會(huì)只有幾個(gè)人工智能助理,甚至不僅僅是每一個(gè)人有自己的人工智能助理,未來我們身邊會(huì)圍繞著非常非常多的人工智能,甚至可以叫這些人工智能的主體是 AI beings,我們可以大膽預(yù)測(cè)一下,未來這些人工智能主體的數(shù)量會(huì)遠(yuǎn)遠(yuǎn)超過人類的數(shù)量,因?yàn)槊總€(gè)人身邊都會(huì)圍繞著很多人工智能?!?/p>
沈向洋認(rèn)為,實(shí)際上交互到現(xiàn)在為止只有兩種:人和人之間的交互(人人交互);人和計(jì)算機(jī),比如說跟手機(jī)這樣的一個(gè)交互叫做人機(jī)交互。
其中,人人交互有很多優(yōu)點(diǎn)的地方,很有人性,但它是一個(gè)低并發(fā),畢竟人的生理極限在這里,人和人交互之間的問題還是要等;而人和機(jī)器之間的交互,雖然機(jī)器非常強(qiáng)大,可以高并發(fā),但因?yàn)樗娴牟焕斫猓瑢?shí)際上是在用戶不了解的情況下,拼命大規(guī)模地給用戶推送,所以人機(jī)交互的問題是出在這里。
沈向洋表示,未來交互正確的做法是把人人交互的有人性和人機(jī)交互的高并發(fā)結(jié)合起來,這是未來人和 AI 之間最好的交互形態(tài),會(huì)給我們帶來非常有意義的機(jī)會(huì)。
小冰團(tuán)隊(duì)的新思考
8 月 22 日上午,小冰公司 CEO 李笛接受了IT之家的專訪,講述了小冰過去這幾年的發(fā)展,以及現(xiàn)在小冰在思考的東西和未來展望。
▲小冰公司 CEO 李笛
小冰一路走來有哪些成功和失???
小冰人工智能的發(fā)展并非是一蹴而就的,很多都是在摸索中前進(jìn)。在這 6 年時(shí)間里,小冰有過成功也有過經(jīng)驗(yàn)總結(jié)。
李笛表示,在小冰一代時(shí)候,小冰的定位是語音助手,并且是不同于微軟小娜的框架。從一開始,選擇了最基本的文本交互入手來進(jìn)行數(shù)據(jù)方面的積累,而當(dāng)時(shí)語音交互在數(shù)據(jù)積累方面不太友好。此后逐步完善該框架,不斷迭代對(duì)話引擎,包括語音、視覺、文本在內(nèi)的交互感官,才有了這種跨平臺(tái)的落地。
“我們?cè)诘@個(gè)框架的時(shí)候,最大的失誤其實(shí)是我們花了 6 年的時(shí)間一點(diǎn)一點(diǎn)去迭代這個(gè)框架,而不是一上來就把這個(gè)完整框架各個(gè)部分都搭好?!崩畹颜J(rèn)為,如果一開始采用全方位投入,用系統(tǒng)化工程實(shí)現(xiàn)的話,到現(xiàn)在小冰吸納的數(shù)據(jù)和框架形成周期時(shí)間,應(yīng)該會(huì)比 6 年時(shí)間短。此前小冰一直在通過自然增長(zhǎng)的方式迭代,包括用戶也是一步步自然增長(zhǎng)起來的。
在小冰商業(yè)框架逐步完善后,優(yōu)勢(shì)慢慢發(fā)揮出來了。李笛稱,去年在做商業(yè)化試水的時(shí)候,當(dāng)小冰的框架服務(wù)和國內(nèi)其他競(jìng)爭(zhēng)對(duì)手解決方案對(duì)比后,幾乎沒有太大的懸念,客戶因此也對(duì)價(jià)格不敏感。小冰框架整合了自然語音、引導(dǎo)對(duì)話等各種能力,使其能夠脫穎而出。
小冰對(duì)新技術(shù)的利用
在技術(shù)利用方面,李笛承認(rèn)小冰對(duì)最新技術(shù)的運(yùn)用的確很快,能夠自由地根據(jù)自有的對(duì)未來的判斷思想來搭建技術(shù),重要的是可以提出合理的指標(biāo),進(jìn)而迭代技術(shù)成果。
小冰在技術(shù)方面不傾向于大模型的使用,而是關(guān)注產(chǎn)品化、工業(yè)化的過程,其特點(diǎn)需滿足能夠復(fù)制,可以同時(shí)支持大量的用戶。
“我們不是特別地把時(shí)間和精力投在這種很大的模型上,主要是因?yàn)榇竽P蜁?huì)產(chǎn)生很驚艷的效果,但是產(chǎn)品化會(huì)有問題,因?yàn)槟菢拥脑?,無論是成本還是延時(shí),它都不是全球化能夠接受的。”
小冰框架為何要推出虛擬人類產(chǎn)品線?和此前的訓(xùn)練模式有何不同?
小冰第八代推出了虛擬人類產(chǎn)品線,李笛表示,沒有任何一個(gè)虛擬人類是可以滿足所有人類的共同需求,特別是目標(biāo)不僅是完成任務(wù),還包括更底層,能夠和人類建立良好的關(guān)系時(shí)。對(duì)于 “小冰”單獨(dú)個(gè)體來說是框架中的一個(gè)具體形態(tài),但框架可以產(chǎn)生很多不同的形態(tài)。
通過小冰團(tuán)隊(duì)的工作,提供的一系列工具,讓 C 端普通的用戶也可以觸摸到框架,用戶可以參與虛擬人類產(chǎn)品的培養(yǎng)和訓(xùn)練。最新的小冰框架虛擬人類訓(xùn)練,可以給它發(fā)送一篇文章,該技術(shù)已經(jīng)迭代了 3 年,AI 在學(xué)習(xí)了這篇文章之后,就可以基于對(duì)文章的學(xué)習(xí),和人類進(jìn)行交流。一開始是從文章里面摘一些內(nèi)容觀點(diǎn),后來加入了重構(gòu),包括重寫組織語言,符合它的思維。
另外,通過搜索引擎技術(shù),小冰在看到相關(guān)文章后也可以從互聯(lián)網(wǎng)上查找參考資料,主動(dòng)去擴(kuò)充閱讀面,主動(dòng)學(xué)習(xí),這種方式和之前的單一的命令式對(duì)話有很大不同。
“我們認(rèn)為像現(xiàn)在比如這種篇章內(nèi)容主動(dòng)學(xué)習(xí),以及它肯定的這個(gè)部分,其實(shí)從未來來看,應(yīng)該是最適合人在各種場(chǎng)合、各種時(shí)刻,隨時(shí)隨地去訓(xùn)練人工智能的一種方法。”
相關(guān)閱讀:《小冰框架·虛擬人類產(chǎn)品線正式發(fā)布,118 萬虛擬男友一起復(fù)活》
小冰微信還會(huì)回來嗎?
李笛給了明確的答復(fù),肯定會(huì)回來的。但微信小冰的流量其實(shí)只占到了小冰流量的個(gè)位數(shù),包括在微信平臺(tái),還有框架的流量都沒有受到很大的影響。真正的未來其實(shí)是千千萬萬個(gè)不同的 AI 人工智能的主體,但不是單一的產(chǎn)品去支持。真正的未來其實(shí)是分散在各地,以各種豐富多彩的形式出現(xiàn)的,它們的總和。
X生產(chǎn)力套件與微軟 Office 有什么相同和不同地方?
對(duì)于推出的 X 生產(chǎn)力套件,李笛認(rèn)為,作為一項(xiàng)行業(yè)內(nèi)的通用工具,X 套件和微軟 Office 有著相似的屬性,不同地方在于,Office 是特別針對(duì)電子化、數(shù)字化的辦公,而 X 套件可以定義新時(shí)代的需求,比如創(chuàng)作和閱讀文字的需求,還有大量的聲音內(nèi)容,包括用聲音去做短視頻內(nèi)容。小冰關(guān)注的是,你有沒有辦法利用人工智能虛擬人類的能力,來協(xié)同你,協(xié)助人類用戶做事情,而更快、更輕松地去完成工作。這是 X 套件追求的一個(gè)方向。
再比如虛擬歌手的問題,現(xiàn)在問題是市場(chǎng)上的虛擬歌手太少了,目前活躍的幾個(gè)虛擬歌手還是 2016 年之前的,如果一個(gè)娛樂市場(chǎng)沒有新人加入,沒有優(yōu)勝劣汰,整個(gè)市場(chǎng)就會(huì)很狹窄。通過 X Studio 歌手工具,可以更快的創(chuàng)建很多人工智能歌手,而且并非是替代專業(yè)人士,而是輔助創(chuàng)作旋律、混音、編曲等的工作。
李笛還表示,X 套件會(huì)根據(jù)不同的功能去進(jìn)行產(chǎn)品的平臺(tái)落地,比如 X Writer 目前是 Windows 10 PC 端的一個(gè)程序,后面會(huì)推出移動(dòng)端。X Studio 歌手工具是面向 PC 端,需要一些工具的調(diào)節(jié),將來可能會(huì)推出像 iPad 版的移動(dòng)端軟件,但是不會(huì)和 PC 端一樣,更加強(qiáng)調(diào)人工智能和用戶一體的即興演奏、表演,而不是創(chuàng)作。而對(duì)于 X Studio 主播功能,根據(jù)場(chǎng)景需求,不僅有小程序,還有網(wǎng)頁端,也會(huì)有其他 App 端等。目前 X Studio 套件還處于非常早期的階段,先從自身的特點(diǎn)出發(fā),先選擇最合適的平臺(tái),然后再考慮一致性。
相關(guān)閱讀:《AI 界的 Office ,小冰發(fā)布人工智能“ X 套件”應(yīng)用:X Writer、X Studio、X Presenter》
小冰們做得不是 “虛擬歌姬”
李笛表示,小冰的虛擬框架歌手并不是針對(duì)所謂的 “虛擬歌姬”市場(chǎng),其市場(chǎng)獲益不是很強(qiáng)勁,虛擬歌手的 IP 價(jià)值受限制比較多,比如背后的配音演員,所需要依存的關(guān)系太多。而小冰團(tuán)隊(duì)推出的何暢、陳水若等可能只依存我們的語音,不受其他關(guān)系限制。
小冰框架內(nèi)的歌手們其實(shí)還是再跟主流的音樂,包括大的唱片公司、歌手等合作,還是符合給人類歌手做歌曲的模式,但是會(huì)給出一些參數(shù)調(diào)整。
相關(guān)閱讀:《小冰 X Studio 歌手 1.0 軟件正式發(fā)布:與虛擬歌手一起創(chuàng)作,完全免費(fèi)》
小冰在微軟時(shí)和離開微軟后,會(huì)有什么不同?未來會(huì)如何發(fā)展?
針對(duì)這一個(gè)問題,李笛給出了答案。在微軟里,對(duì)于小冰是有一個(gè)比較明確的階段性的內(nèi)容,比如做框架,微軟是比其他地方都要合適的,因?yàn)槲④浻腥≈槐M、用之不竭的源源不斷的技術(shù)創(chuàng)新儲(chǔ)備,你并不知道哪些技術(shù)創(chuàng)新儲(chǔ)備你是需要的。那么當(dāng)微軟都具備的時(shí)候,你就可以從中去提取你所需要的部分。
下一個(gè)階段就是運(yùn)營(yíng)了。包括小冰要更好地完成商業(yè)化,在微軟時(shí)期,小冰已經(jīng)做了一年多的商業(yè)化試水,接下來小冰將會(huì)更符合本地的高效化商業(yè)運(yùn)行,比如有著本地化風(fēng)格和特色的銷售團(tuán)隊(duì),或者是運(yùn)營(yíng)團(tuán)隊(duì)。這點(diǎn)會(huì)和在微軟公司風(fēng)格不同。
小冰在技術(shù)和產(chǎn)品創(chuàng)新方面雖然比較好,但國內(nèi)的商業(yè)模式和運(yùn)營(yíng)模式此前并不適合微軟,在小冰公司獨(dú)立后,會(huì)加速商業(yè)化方面的發(fā)展。
李笛表示,下一階段,希望看到市場(chǎng)上有更多豐富多彩、各種各樣的人工智能主體會(huì)像雨后春筍一樣冒出來,而不是幾個(gè)。它是整片森林,這是通過我們的框架和進(jìn)行的大量普及工作,培育市場(chǎng)工作要實(shí)現(xiàn)的,希望用框架去展現(xiàn)一個(gè)豐富多彩的世界。另外大家將會(huì)看到,小冰團(tuán)隊(duì)可能比以前更接地氣了。
其實(shí)小冰團(tuán)隊(duì)一直很像一個(gè)創(chuàng)業(yè)團(tuán)隊(duì),在微軟內(nèi)部就是比較獨(dú)立模式。所以未來,從創(chuàng)業(yè)者的心態(tài)上講沒什么變化,但從創(chuàng)業(yè)者行動(dòng)來看,可能會(huì)比以前多。
廣告聲明:文內(nèi)含有的對(duì)外跳轉(zhuǎn)鏈接(包括不限于超鏈接、二維碼、口令等形式),用于傳遞更多信息,節(jié)省甄選時(shí)間,結(jié)果僅供參考,IT之家所有文章均包含本聲明。