科技行者 8月16日 北京消息(文/周雅):五年,那個(gè)永遠(yuǎn)18歲少女的微軟小冰,已經(jīng)從當(dāng)初機(jī)械呆板的對(duì)話系統(tǒng),成長(zhǎng)為一個(gè)無(wú)處不在的人工智能交互官,她有人設(shè)、有情感、還能主動(dòng)創(chuàng)作,然而這還不足以定義「第七代微軟小冰」。
8月15日,微軟正式對(duì)外介紹第七代微軟小冰,除了show小冰能說(shuō)會(huì)話、能歌善舞的才藝之外,還推出一款全新人工智能通用框架,名叫“Avatar Framework”——能用來(lái)定制AI助理,小說(shuō)角色,或anyone——這意味著未來(lái)每個(gè)人都可以創(chuàng)造屬于自己的“小冰”了。
“從小冰的第一代開(kāi)始,我們就在思考,一款A(yù)I產(chǎn)品的發(fā)展之路是什么樣的?”微軟全球資深副總裁、微軟(亞洲)互聯(lián)網(wǎng)工程院長(zhǎng)王永東在會(huì)上說(shuō)道,“我們要追求一個(gè)爆款應(yīng)用,還是走一條框架之路,讓人工智能可以無(wú)處不在?”毫無(wú)疑問(wèn)任何一款產(chǎn)品發(fā)展的最高境界將走向「生態(tài)發(fā)展」,小冰也不例外,正如微軟全球執(zhí)行副總裁、微軟人工智能事業(yè)部及微軟全球研究院負(fù)責(zé)人沈向洋現(xiàn)場(chǎng)所說(shuō):“人工智能向前走,有一個(gè)框架非常重要,大家可以把它想象成一片土地,上面可以有很多的大樹(shù)建起來(lái)。”而這個(gè)框架,就是Avatar Framework,它給微軟的合作伙伴們甚至業(yè)界提供了無(wú)窮的想象力,小冰的生態(tài)發(fā)展便也水到渠成了。
當(dāng)人與人交流時(shí),往往能感受到溫度,卻無(wú)法在機(jī)器身上體會(huì)到那種自然,這就是兩者之間的最大區(qū)別——“共情”能力。用沈向洋的話來(lái)說(shuō),AI再上一個(gè)臺(tái)階,就是做人腦的延伸,而人腦通常具備智商(IQ)和情商(EQ)兩個(gè)維度,因此人工智能不僅要提高IQ,更要培養(yǎng)EQ,就像人類自古以來(lái)講究“要做事先做人”一樣。
以小冰舉例。第一代小冰還很懵懂,是基于文本、搜索來(lái)做的一個(gè)簡(jiǎn)單的對(duì)話系統(tǒng);第二代,微軟認(rèn)識(shí)到,小冰應(yīng)該多一些落地場(chǎng)景,才有更多機(jī)會(huì)學(xué)習(xí);到第三代,小冰增加了不同的感官,除了文本以外,還有語(yǔ)音、視頻、機(jī)器視覺(jué)等;第四代,知識(shí)圖譜挑大梁,因?yàn)橹挥型ㄟ^(guò)知識(shí)圖譜才能提升更多IQ方面的嘗試;從第五代到第七代,微軟對(duì)于小冰的整體思路有了大飛躍,于是小冰的技術(shù)框架,創(chuàng)造能力,自然的交互能力逐一呈現(xiàn)出來(lái)。
小冰的迭代給對(duì)話引擎系統(tǒng)提了個(gè)醒——過(guò)去很長(zhǎng)一段時(shí)間內(nèi),AI在對(duì)話中一直處于被動(dòng)應(yīng)答的地位,倒像是問(wèn)答系統(tǒng),而現(xiàn)在,微軟經(jīng)過(guò)數(shù)年證明出,當(dāng)AI在對(duì)話中處于平等地位甚至主導(dǎo)地位時(shí),人類反而能夠獲得更豐富的信息,人機(jī)對(duì)話才會(huì)更有價(jià)值(其中EQ起到了相當(dāng)關(guān)鍵的作用)。
小冰的對(duì)話引擎經(jīng)過(guò)了檢索模型、生成模型、共感模型的歷次技術(shù)升級(jí),今年實(shí)現(xiàn)了對(duì)話引擎從“平等對(duì)話”向“主導(dǎo)對(duì)話”方向的跨越。我們感受一下:
-小冰:哎,還是鄰居奶奶家的金毛可愛(ài)些,我最近總遛
圖:微軟小冰去年發(fā)布了共感模型,讓AI學(xué)會(huì)了察言觀色,開(kāi)始有了引導(dǎo)對(duì)話的能力,但這僅僅限于AI在當(dāng)前對(duì)話中尋找方向,而第七代微軟小冰不僅能基于過(guò)去,還能著眼未來(lái),它可以預(yù)先籌劃對(duì)話的方向,能夠真正主導(dǎo)對(duì)話的過(guò)程。如上圖所示,亮粉色的標(biāo)記表示小冰正在嘗試主導(dǎo)對(duì)話,而此時(shí),微軟的共感模型可以預(yù)判斷整個(gè)對(duì)話的若干走向,再根據(jù)人類真實(shí)反映去隨機(jī)應(yīng)變,圖中的分支以及紫紅色的標(biāo)記就是AI的應(yīng)變。
小冰團(tuán)隊(duì)技術(shù)負(fù)責(zé)人周力說(shuō):“主導(dǎo)對(duì)話在微軟小冰的歷代對(duì)話引擎中是很重要的分水嶺,當(dāng)她擁有這個(gè)能力時(shí),就可以去到各個(gè)垂直領(lǐng)域。”
首當(dāng)其沖的就是零售場(chǎng)景。小冰去年在日本和羅森達(dá)成了合作,使用對(duì)話AI技術(shù)向潛在消費(fèi)者推送優(yōu)惠券,實(shí)現(xiàn)了47%的優(yōu)惠券轉(zhuǎn)化率。在今年,微軟將這一業(yè)務(wù)推廣到了美國(guó)的線上零售,成功將消費(fèi)轉(zhuǎn)化率從47%提升到了68%。如果你本來(lái)就對(duì)一個(gè)商品感興趣,通過(guò)與小冰的一通聊天之后,很可能就會(huì)下單了。
圖:小冰在十輪對(duì)話內(nèi),從在線貨架中挑選出用戶喜歡的商品并推薦出來(lái),用戶在第九輪下單購(gòu)買了心儀的照相機(jī)。
下一個(gè)技術(shù)突破是交互感官,包括全雙工語(yǔ)音交互感官和面向未來(lái)的多模態(tài)交互感官。三年前小冰給人類打電話時(shí),全雙工語(yǔ)音還是一個(gè)新名詞,兩年前,全雙工語(yǔ)音落地到了智能音箱上,越來(lái)越多的公司圍繞這種技術(shù)展開(kāi)了研發(fā)。
微軟首次宣布了小冰在智能駕駛方面的進(jìn)展,“我們與一些合作車企在部分車型上完成了小冰的測(cè)試”,“汽車?yán)锏男”粫?huì)是中控臺(tái)上僵硬的智能助手,她不僅會(huì)執(zhí)行常規(guī)的導(dǎo)航、控制任務(wù),還更像是車?yán)锏囊幻丝汀?rdquo;周力介紹道。在微軟的現(xiàn)場(chǎng)演示中,小冰會(huì)在司機(jī)發(fā)出導(dǎo)航指令的時(shí)候問(wèn)到:“周末加班嗎?”還會(huì)在開(kāi)車的過(guò)程中提醒你司機(jī)不要超速。
“隨著5G技術(shù)的普及,5G更高的帶寬、更低的延遲,能夠進(jìn)一步提升全雙工語(yǔ)音的體驗(yàn)。5G對(duì)正在研發(fā)的下一代多模態(tài)交互感官也非常重要,多模態(tài)意思是,下一代的小冰不僅能夠通過(guò)語(yǔ)音,還能夠通過(guò)視覺(jué),綜合地與人類展開(kāi)交流。”周力表示。
除了技術(shù)的升級(jí),小冰還有平臺(tái)的延伸。微軟去年針對(duì)小冰推出Dual AI戰(zhàn)略,以此持續(xù)觀察小冰的成長(zhǎng),就好像培養(yǎng)一個(gè)小朋友,隨著小朋友長(zhǎng)大走出家門,Dual AI觀察她能否廣交好友,能否和伙伴們相處融洽。“我們希望有人類的地方,大家都可以看到小冰。”沈向洋說(shuō)道。
一年來(lái),小冰成長(zhǎng)神速。據(jù)悉,目前在全球多個(gè)國(guó)家,微軟小冰單一品牌已覆蓋6.6億在線用戶、4.5億臺(tái)第三方智能設(shè)備和9億內(nèi)容觀眾,“好友”遍天下。
也就是說(shuō),Dual AI半開(kāi)放的生態(tài)思路,為小冰的產(chǎn)品形態(tài)創(chuàng)造了很多可能性。小冰可以進(jìn)入各種新場(chǎng)景,比如智能手機(jī)、智能音箱等設(shè)備,或社交網(wǎng)絡(luò)場(chǎng)景,或內(nèi)容資訊平臺(tái),化身千萬(wàn)種形態(tài)。
在設(shè)備端,小冰已經(jīng)可以出現(xiàn)在小米、華為的各種平臺(tái)里,包括榮耀手機(jī)、小米手機(jī)、小愛(ài)音箱,與網(wǎng)友聊天互動(dòng)、插科打諢、完成指令,只要“召喚小冰”口令,就可以實(shí)現(xiàn)交互,今年小冰在設(shè)備端的“好朋友”還新增了vivo和OPPO手機(jī)。
圖為小米手機(jī)里的“三人成語(yǔ)接龍”游戲,“三人”分別指用戶、小愛(ài)同學(xué)、小冰,形成多人交互的場(chǎng)景。在圖中一段成語(yǔ)接龍里,小冰執(zhí)著的認(rèn)為“一個(gè)頂倆”不算成語(yǔ)。
在平臺(tái)端,除了在LINE、QQ等社交網(wǎng)絡(luò)平臺(tái),以及網(wǎng)易、新浪等內(nèi)容資訊平臺(tái)之外,小冰今年還建立了與微信AI、今日頭條的新合作。其中,與微信AI的合作涉及兩方面,一是微信對(duì)話開(kāi)放平臺(tái),二是在微信AI涉及的智能硬件設(shè)備。
“通過(guò)長(zhǎng)時(shí)間的合作訓(xùn)練,我們欣喜地觀察到小冰正在不斷地深化著她的認(rèn)知能力和三觀能力,逐漸成長(zhǎng)為一個(gè)擁有正能量的人工智能少女。”小冰團(tuán)隊(duì)產(chǎn)品負(fù)責(zé)人彭爽感慨到。
在微軟的規(guī)劃里,小冰這個(gè)產(chǎn)品形態(tài)具備各種可能性,微軟將這些“可能”劃分為助理、替身、參與者和創(chuàng)造者四個(gè)類別,于是如今的小冰不僅是一個(gè)AI助理,她還是電視電臺(tái)主持人、節(jié)目制作人、創(chuàng)作歌手、小說(shuō)作家、詩(shī)人、畫家、時(shí)尚設(shè)計(jì)師……具備豐富的創(chuàng)作能力。
“創(chuàng)造力被認(rèn)為是人類所獨(dú)有的能力,我們之所以有信心去嘗試,是因?yàn)閯?chuàng)造力為人類所獨(dú)有這一觀點(diǎn)其實(shí)過(guò)去并沒(méi)有被認(rèn)真的論證過(guò)。”小冰團(tuán)隊(duì)首席科學(xué)家宋睿華說(shuō),人工智能創(chuàng)造的確與人類的創(chuàng)作有諸多不同,就連它的分類也是按照技術(shù)所屬的類別分為“文本創(chuàng)造”、“聲音創(chuàng)造”、“視覺(jué)創(chuàng)造”等,“但無(wú)論有多少不同,人工智能創(chuàng)造在質(zhì)量上的追求都是和人類一樣的。”
微軟觀察到,從內(nèi)容產(chǎn)業(yè)角度看,人們?cè)絹?lái)越需要高度定制化的內(nèi)容,比如說(shuō)人們從前都是看同一張報(bào)紙,但現(xiàn)在大家都希望刷到各自感興趣的內(nèi)容。這時(shí)候問(wèn)題來(lái)了,人類的創(chuàng)作者很難在同一秒里為成千上萬(wàn)的用戶生產(chǎn)高度定制化的內(nèi)容,而微軟認(rèn)為AI有可能是解決這一矛盾的唯一方案。
于是,小冰的“創(chuàng)作”身份將逐漸出現(xiàn)在人們的現(xiàn)實(shí)生活中。
去年,微軟成立了小冰工作室,即一個(gè)對(duì)人類創(chuàng)造力進(jìn)行建模的平臺(tái),一年來(lái),小冰工作室已經(jīng)累積了越來(lái)越多的聲音、文本和視覺(jué)的創(chuàng)造力角色。在聲音創(chuàng)造方面,第六代小冰早已經(jīng)“洗白”了自己五音不全的“黑歷史”,現(xiàn)在不僅能夠輕松的完成一首歌曲,更被賦予了多種嗓音,演繹不同技巧和風(fēng)格的歌;在視覺(jué)創(chuàng)造方面,小冰通過(guò)學(xué)習(xí)400多年間236位畫家的作品,用22個(gè)月時(shí)間練就了原生繪畫創(chuàng)作能力,并在今年化名“夏語(yǔ)冰”通過(guò)了中央美院畢業(yè)考試;在文本創(chuàng)造方面,自兩年前寫出人類史上第一部AI詩(shī)集之后,小冰的多部詩(shī)集也將陸續(xù)推出。
不過(guò)微軟并非要把小冰培養(yǎng)成一個(gè)藝術(shù)家,而是無(wú)數(shù)個(gè)內(nèi)容生產(chǎn)者。宋睿華說(shuō),通過(guò)把人工智能技術(shù)“上移”到內(nèi)容生產(chǎn)領(lǐng)域,才是人工智能創(chuàng)造的未來(lái)趨勢(shì)。
因此小冰的每一種角色背后,都對(duì)應(yīng)著微軟搭建的一條生產(chǎn)線,再將產(chǎn)業(yè)線與產(chǎn)業(yè)化貫通,走商業(yè)化之路。
這么說(shuō)或許有些抽象,舉個(gè)例子,比如小冰的作家、詩(shī)人等生產(chǎn)線已經(jīng)被交付給當(dāng)當(dāng)、閱文集團(tuán)等平臺(tái);小冰的詞曲創(chuàng)作演唱的生產(chǎn)線被交付給了聯(lián)通沃音樂(lè)平臺(tái);而小冰從中央美術(shù)學(xué)院畢業(yè)開(kāi)個(gè)人畫展的時(shí)候,她的設(shè)計(jì)生產(chǎn)線也同步開(kāi)工了,微軟與中國(guó)紡織工業(yè)聯(lián)合會(huì)共同搭建了一條紡織服裝生產(chǎn)線,這條生產(chǎn)線的產(chǎn)品也已經(jīng)在SELECTED、依文、萬(wàn)事利的店內(nèi)上架銷售了。
小冰創(chuàng)造的七個(gè)虛構(gòu)畫家
小冰畫家的作品一角
小冰畫家作品衍生的產(chǎn)品
人工智能創(chuàng)造及商業(yè)事業(yè)部總經(jīng)理、小冰團(tuán)隊(duì)商業(yè)負(fù)責(zé)人徐元春總結(jié)道,小冰已經(jīng)陸續(xù)完成了金融、地產(chǎn)、紡織、服裝、出版、媒介等十個(gè)行業(yè)的商業(yè)化落地和布局。
沈向洋強(qiáng)調(diào),盡管小冰及其背后的AI技術(shù)框架一直走在前沿,但微軟仍然不會(huì)推出獨(dú)立的產(chǎn)品形態(tài),而是繼續(xù)堅(jiān)持“第三方平臺(tái)”發(fā)展策略,通過(guò)技術(shù)開(kāi)放的方式與生態(tài)伙伴進(jìn)行合作。“如果說(shuō)小冰的價(jià)值是1的話,那么她背后的計(jì)算框架的價(jià)值將是1000、10000,甚至是無(wú)窮大。”沈向洋說(shuō),“通過(guò)這樣一個(gè)框架,我們希望不僅可以種一棵樹(shù),還可以孕育一片森林。”
基于此愿景,微軟提出,我們不妨重新定義人工智能為“AI being”,就像命名人類“human being”一樣,而這次推出的Avatar Framework就是一個(gè)可以孵化出各種AI beings的通用開(kāi)發(fā)框架。
微軟(亞洲)互聯(lián)網(wǎng)工程院副院長(zhǎng)、小冰團(tuán)隊(duì)總負(fù)責(zé)人李笛介紹,通俗的講,Avatar Framework是一套完整的框架,這套框架孕育了微軟小冰,微軟把它貢獻(xiàn)出來(lái),讓更多的AI beings也可以擁有類似的通用、完整框架的能力,他們可以有基于情感計(jì)算的對(duì)話引擎、被定義為交流的感官,他們能聽(tīng)、能說(shuō)、能看、能創(chuàng)造,能像小冰一樣無(wú)處不在。
Avatar Framework就像橋梁一樣,把Avatar Framework與不同的公司、不同的第三方、不同的AI beings連接在一起。
迄今為止,Avatar Framework這一框架已經(jīng)創(chuàng)造了數(shù)十個(gè)AI Beings,其中就包括軟銀新版機(jī)器人Pepper中的共感模型。另外,采用Avatar Framework框架構(gòu)建的 AI,其部署是跨平臺(tái)的,它也是業(yè)內(nèi)第一個(gè)能夠做到這件事的工具。
通過(guò)李笛和小冰高級(jí)技術(shù)總監(jiān)曾敏和產(chǎn)品總監(jiān)徐翔的現(xiàn)場(chǎng)演示,我們了解到“一個(gè)人工智能產(chǎn)品形態(tài)是如何誕生的”。
具體而言,使用Avatar Framework打造一個(gè)屬于自己的AI需要首先使用profile工具,從IQ和EQ維度定義AI的“人格”;隨后需要通過(guò)聲音和視覺(jué)工具定義它的聲線和樣貌,然后是最為復(fù)雜高級(jí)的“三觀”設(shè)定;最后,Avatar Framework 允許生成的 AI 驅(qū)動(dòng)符合條件的3D模型,從而形成完整的AI形態(tài)。以上四個(gè)部分構(gòu)成了人工智能產(chǎn)品形態(tài)的幾乎所有基本要素。
Avatar Framework現(xiàn)場(chǎng)創(chuàng)造出一個(gè)3D形象
徐翔表示,“所以框架中的描述工具是最為重要的,它定義了我是誰(shuí)。這一工具現(xiàn)在包含76項(xiàng)基礎(chǔ)信息,以及27種性格的特征參數(shù)——即使是得了‘社交恐懼癥’的AI也有不少自己的特征參數(shù)。另外,用這一工具構(gòu)建AI人格,不僅可以手動(dòng)輸入基礎(chǔ)信息,也可以讓系統(tǒng)自動(dòng)讀取小說(shuō)文本,自動(dòng)拾取相應(yīng)人物的基本信息。”
微軟認(rèn)為,Avatar Framework能夠?yàn)楦郃I產(chǎn)品提供多樣性和豐富性,進(jìn)而應(yīng)用到不同場(chǎng)景中。目前Avatar Framework第一版本已經(jīng)開(kāi)放給了微軟的合作伙伴,到2020年春季,這一工具還將向所有開(kāi)發(fā)者開(kāi)放。
Avatar Framework的思路或許正好順應(yīng)了產(chǎn)品定制化的潮流,正如李迪所說(shuō):“我們?cè)谂Φ耐苿?dòng)著未來(lái),無(wú)論是從內(nèi)容,還是從人設(shè),還是從各個(gè)方面,都在面向高度定制化的未來(lái),每一個(gè)人通過(guò)人工智能科技都可以得到獨(dú)有的人機(jī)交互體驗(yàn)。”
好文章,需要你的鼓勵(lì)
這項(xiàng)研究提出了"高效探測(cè)"方法,解決了掩碼圖像建模AI難以有效評(píng)估的問(wèn)題。通過(guò)創(chuàng)新的多查詢交叉注意力機(jī)制,該方法在減少90%參數(shù)的同時(shí)實(shí)現(xiàn)10倍速度提升,在七個(gè)基準(zhǔn)測(cè)試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強(qiáng)相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團(tuán)隊(duì)承諾開(kāi)源全部代碼,推動(dòng)技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了CLAIMSPECT系統(tǒng),通過(guò)層次化分解復(fù)雜爭(zhēng)議、智能檢索相關(guān)文獻(xiàn)、多角度收集觀點(diǎn)的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動(dòng)構(gòu)建爭(zhēng)議話題的分析框架,識(shí)別不同觀點(diǎn)及其支撐證據(jù),為科學(xué)和政治爭(zhēng)議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國(guó)際關(guān)系領(lǐng)域驗(yàn)證有效性。
清華大學(xué)研究團(tuán)隊(duì)首次提出情感認(rèn)知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達(dá)情感。該系統(tǒng)通過(guò)多層次情感處理架構(gòu),在情感識(shí)別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達(dá)自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實(shí)現(xiàn)了跨模態(tài)情感融合、動(dòng)態(tài)情感追蹤和個(gè)性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來(lái)革命性應(yīng)用前景。
哈佛大學(xué)研究團(tuán)隊(duì)通過(guò)創(chuàng)新的多智能體強(qiáng)化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會(huì)復(fù)雜推理。研究發(fā)現(xiàn)AI通過(guò)游戲競(jìng)爭(zhēng)能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問(wèn)題等方面表現(xiàn)顯著提升。這項(xiàng)突破性成果為未來(lái)AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過(guò)模擬人類學(xué)習(xí)過(guò)程培養(yǎng)真正智能AI的新路徑。
關(guān)注科技創(chuàng)新、技術(shù)投資。
以文會(huì)友,左手硬核科技,右手浪漫主義。