——它能夠指揮你家中的智能恒溫器,為你讀取航班信息,并朗讀頭條新聞報(bào)道......
談及智能助手,對(duì)于谷歌來(lái)說(shuō)似乎是堅(jiān)定不移的理念。自從三年前谷歌首席執(zhí)行官 Sundar Pichai 首次公布該軟件以來(lái),這家搜索巨頭就一直致力于追趕亞馬遜的智能助理Alexa。之所以如此耿耿于懷,是因?yàn)?Alexa 曾在 2014 年擊敗谷歌,并成為如今全美最家喻戶曉的智能助手名號(hào)。而更讓人不能忍受的是,很多人認(rèn)為憑借著先天的業(yè)務(wù)相似性與優(yōu)勢(shì),谷歌公司就應(yīng)該打造出最強(qiáng)大的智能助手產(chǎn)品——畢竟決定智能助手命運(yùn)的,實(shí)際是對(duì)互聯(lián)網(wǎng)資源的搜索與使用能力。
關(guān)于目前取得的進(jìn)展,據(jù)研究公司 eMarketer 數(shù)據(jù)顯示,亞馬遜旗下由 Alexa 支持的 Echo 設(shè)備占據(jù)智能語(yǔ)音助手市場(chǎng)份額將近70%。而運(yùn)作谷歌助手的 Google Home Devices 僅有不到四分之一的市場(chǎng)份額。另一家研究公司 Canalys 預(yù)測(cè),到 2023 年,谷歌有望從亞馬遜手上奪走皇冠。
Huffman告訴筆者,“沒(méi)人買的助手肯定幫不上什么忙。因此,我們?cè)谶^(guò)去幾年中投入了大量精力推動(dòng)谷歌智能助手的普及。”
圖:負(fù)責(zé) Google Assistant 工程團(tuán)隊(duì)的谷歌副總裁 Scott Huffman
進(jìn)擊的谷歌智能助手
在被問(wèn)及大多數(shù)人使用谷歌助手或者 Alexa 的原因時(shí),他們可能會(huì)表示語(yǔ)音助手非常適合“解放雙手”,比如播放歌曲,設(shè)置烹飪計(jì)時(shí)器,或者在接入智能家居后更輕松地指揮屋里的各種設(shè)備。這當(dāng)然沒(méi)錯(cuò),但谷歌公司希望達(dá)成更龐大的目標(biāo),從而一舉擊垮亞馬遜。過(guò)去一年中,谷歌智能助手的發(fā)展軌跡一直向著科幻小說(shuō)中的目標(biāo)看齊,而以此為起點(diǎn),其未來(lái)愿景無(wú)疑將更具遠(yuǎn)大抱負(fù)。
谷歌憑借其核心的機(jī)器學(xué)習(xí)、自然語(yǔ)言處理和人工智能,雄心勃勃地引入了新功能,即 Duplex 項(xiàng)目。谷歌希望做出一個(gè)模擬人聲的機(jī)器人,可以幫人安排約會(huì),同時(shí)希望 Assistant 能內(nèi)置27種語(yǔ)言,實(shí)時(shí)為用戶翻譯對(duì)話。
“如果,人工智能真的能夠成為不同企業(yè)之間的差異化因素,那什么樣的 AI 功能能夠真正改變?nèi)藗兊纳钏缴踔潦巧罘绞剑?/span>”我這樣問(wèn)Huffman。
和一位受過(guò)媒體培訓(xùn)的技術(shù)主管談話時(shí),事情從來(lái)沒(méi)有那么戲劇化過(guò),但這并不僅僅是我的一廂情愿。Huffman,一位擁有14年在職經(jīng)歷的谷歌老將,目光和善,留著濃密山羊胡子,他認(rèn)真思考了我對(duì)未來(lái)數(shù)字助理時(shí)代提出的隱私問(wèn)題。他說(shuō),首先,這可能需要立法。他也是在討論谷歌助手的發(fā)展方向,這對(duì)谷歌思考其最重要產(chǎn)品有啟發(fā)意義。
另外,他也談到了谷歌智能助手的發(fā)展方向,以及這將如何幫助谷歌獲取洞察見(jiàn)解,并最終指導(dǎo)這款也許將在搜索巨頭旗下最為重要的一款產(chǎn)品。
Huffman建議,在接下來(lái)的五年中,智能助手將能夠獲得與人類自然對(duì)話的基礎(chǔ)知識(shí)。當(dāng)然,這從計(jì)算機(jī)科學(xué)的角度來(lái)看,絕對(duì)不像聽(tīng)上去那么容易。在他看來(lái),“Hey(嘿)”或者“OK(好吧)”這樣的喚醒詞“真的有點(diǎn)別扭”。他希望助手能夠理解用戶的情緒與語(yǔ)氣,并覺(jué)察到用戶是否感到沮喪。他希望軟件能夠記得上一次與用戶對(duì)話的內(nèi)容,這樣隔一天也可以繼續(xù)同樣的話題。
筆者問(wèn)他10年后的愿景。他沉思了一會(huì)說(shuō),也許到那時(shí)候,物理機(jī)器人將成為常見(jiàn)的家用產(chǎn)品,數(shù)字助理也可與之整合。這里所說(shuō)的物理機(jī)器人,不僅僅是可以交談的機(jī)器人,還是可移動(dòng)和做事的機(jī)器人。
Duplex項(xiàng)目和背后的故事
2016年5月,Pichai 在 Google 年度 I/O 會(huì)議上向 7000 名開(kāi)發(fā)人員介紹Google Assistant的前幾天,筆者在他的辦公室就這款產(chǎn)品進(jìn)行了一番交流。當(dāng)時(shí),這家搜索巨頭正在籌備Google Home,一個(gè)智能家庭語(yǔ)音助手,將與 Amazon Echo 正面交鋒。很明顯,谷歌智能助手會(huì)和 Alexa 歸為一類。
但從立項(xiàng)之初,Pichai就堅(jiān)持認(rèn)為事情并不這么簡(jiǎn)單。Pichai當(dāng)時(shí)強(qiáng)調(diào)稱,“谷歌希望用戶感受到的是,「嗨,我能幫上什么忙嗎?」換言之,我們的智能助手相當(dāng)于為用戶提供一套個(gè)性化的谷歌服務(wù)。”
在受到市場(chǎng)份額打擊之后,Pichai不得不將市場(chǎng)領(lǐng)導(dǎo)者的頭銜拱手讓予亞馬遜。他無(wú)奈地承認(rèn),“有些地方我們會(huì)領(lǐng)跑,有些地方會(huì)有人指路,然后我們來(lái)實(shí)現(xiàn)。”
過(guò)去一年里,這種壓力下的野心愈發(fā)明顯。去年5月,Pichai正式公布了Duplex項(xiàng)目,這是一款能夠以逼真方式模仿人類語(yǔ)言的AI。該軟件會(huì)使用諸如“呃”和“嗯”這種語(yǔ)氣詞,說(shuō)話有時(shí)還會(huì)停頓,好像在思考接下來(lái)該說(shuō)什么,即使它的反應(yīng)其實(shí)是預(yù)先編程好的。目前 Duplex 項(xiàng)目尚處于有限的公開(kāi)測(cè)試階段。
Duplex旨在幫助智能助手擁有為用戶預(yù)訂餐廳以及預(yù)約其它服務(wù)的能力。但幾乎是同一時(shí)刻,行業(yè)觀察家、AI倫理學(xué)家以及消費(fèi)者們開(kāi)始擔(dān)心,如此真實(shí)的交談效果是否會(huì)導(dǎo)致該軟件被用于實(shí)施欺詐活動(dòng)。谷歌公司后來(lái)表示,該項(xiàng)目將納入披露機(jī)制,以確保人們知道自己正在與機(jī)器人交談。
Huffman表示,當(dāng)時(shí)可謂谷歌公司的關(guān)鍵時(shí)刻。他回憶道,“強(qiáng)烈的反響出乎我的意料。這讓我們清楚地意識(shí)到這些社會(huì)問(wèn)題的重要性。”
立法問(wèn)題——縈繞在背后的陰霾
再來(lái)看另一個(gè)重要問(wèn)題:在數(shù)字助手(或“智能助理”)越來(lái)越智能的時(shí)代,隱私如何保護(hù)?
這一點(diǎn)非常重要,因?yàn)楣韫?/span>當(dāng)下正面臨比以往更嚴(yán)格的隱私審查。過(guò)去兩年,F(xiàn)acebook公司一直面臨一輪又一輪的安全隱私危機(jī),從大量虛假宣傳廣告到大規(guī)模數(shù)據(jù)泄露。另外,谷歌公司在Android手機(jī)上進(jìn)行的位置數(shù)據(jù)收集以及重返中國(guó)市場(chǎng)等隱私立場(chǎng)也讓不少人擔(dān)心不已。去年12月,Pichai被拖到國(guó)會(huì)面前,負(fù)責(zé)回答與中國(guó)專供版搜索引擎 Dragonfly 項(xiàng)目的相關(guān)問(wèn)題,并回應(yīng)了谷歌公司對(duì)于用戶個(gè)人信息的總體獲取情況。
面對(duì)這樣的時(shí)代背景,把一臺(tái)設(shè)備放在人們的客廳里頭,而這臺(tái)設(shè)備上還裝有麥克風(fēng)用于采集喚醒詞——也就是“嗨,谷歌”——這又怎么能不讓人心生戒備?
圖:谷歌公司CEO Sundar Pichai去年12月在國(guó)會(huì)聽(tīng)證會(huì)上作證
擁有計(jì)算機(jī)科學(xué)博士學(xué)位的 Huffman 表示,“如果大家考慮使用Google Home或者Alexa,那么首先得強(qiáng)調(diào)一點(diǎn)——這些是第一款走進(jìn)用戶生活的非個(gè)人智能設(shè)備。它們實(shí)際上屬于部署在共享環(huán)境中的計(jì)算設(shè)備……這些產(chǎn)品會(huì)與住在同一空間里的所有家庭成員進(jìn)行交互。面對(duì)這么多用戶,隱私機(jī)制到底該如何起效?”
Huffman指出,谷歌公司一直在圍繞人工智能技術(shù)制定相關(guān)議程。去年6月,Pichai發(fā)布了一份AI道德指南,用于指導(dǎo)谷歌員工如何使用此項(xiàng)技術(shù)。在該項(xiàng)指導(dǎo)方針發(fā)布之前,谷歌員工曾抗議該公司與美國(guó)五角大樓簽署合約,以協(xié)助開(kāi)發(fā)用于分析無(wú)人機(jī)拍攝畫面的 AI 工具。此次公布的指導(dǎo)方針包括宣誓永遠(yuǎn)不為武器裝備開(kāi)發(fā) AI 方案,以及只創(chuàng)造“能夠造福于社會(huì)”的技術(shù)。
然而,公司的自我監(jiān)管可能不會(huì)是唯一的辦法。
Huffman指出,“坦率講,我認(rèn)為最終政府可能出臺(tái)新的立法,畢竟社會(huì)需要弄清楚這些東西是如何發(fā)揮作用的。大家可以看看自己手中的電話。電話設(shè)備已經(jīng)存在了很長(zhǎng)時(shí)間,關(guān)于我們?cè)撊绾问褂秒娫捯约捌淠軌驅(qū)崿F(xiàn)哪些功能,已經(jīng)出臺(tái)了大量指導(dǎo)及約束性的法律規(guī)定。”
比如,政府不允許任何機(jī)構(gòu)在沒(méi)有授權(quán)的情況下竊聽(tīng)手機(jī)。Huffman指出,“因此,一些規(guī)則只適用于一些技術(shù),而有了人工智能,我們的社會(huì)將思考一些新的法律法規(guī)。”
至于最終立法將會(huì)呈現(xiàn)怎樣的面貌,Huffman并沒(méi)有詳加評(píng)論。他表示,“實(shí)際上,我并不清楚到底需不需要立法。我不適合討論這個(gè)問(wèn)題。”他同時(shí)指出,這個(gè)問(wèn)題最終需要由整個(gè)社會(huì)來(lái)評(píng)判與決定。
Huffman雖然拒絕推測(cè)未來(lái)的監(jiān)管方式,但斯坦福大學(xué)互聯(lián)網(wǎng)與社會(huì)中心隱私主管 Jen King 對(duì)此有一定的認(rèn)知。她目前正在研究智能揚(yáng)聲器所能收集到的數(shù)據(jù)類型,這些產(chǎn)品會(huì)與住在同一空間里的所有家庭成員進(jìn)行交互,面對(duì)這么多用戶,隱私機(jī)制到底該如何起效?
King表示,監(jiān)管機(jī)制很可能提出類似于《通用數(shù)據(jù)保護(hù)條例( the General Data Protection Regulation, 簡(jiǎn)稱GDPR)》中所發(fā)布的限制要求。GDPR是歐盟于2018年5月全面生效的一項(xiàng)法律,它允許消費(fèi)者更好地控制科技企業(yè)能夠從其身上獲取的個(gè)人信息。關(guān)于數(shù)字助手,立法可能意味著,如果消費(fèi)者要求刪除相關(guān)數(shù)據(jù),政府可以強(qiáng)制執(zhí)行數(shù)據(jù)刪除政策?;蛘?,法律可能需要就如何使用這些數(shù)據(jù)達(dá)成更為具體的協(xié)議,并確保科技企業(yè)不會(huì)在獲得許可后“永久性”使用用戶信息。
“我們都應(yīng)該關(guān)注谷歌以及其它科技企業(yè)未來(lái)在設(shè)備上的默認(rèn)設(shè)置,以免人們無(wú)意中放棄對(duì)個(gè)人信息的管控權(quán)。”King說(shuō),“對(duì)于大多數(shù)人而言,谷歌公司代表著通往互聯(lián)網(wǎng)的入口,而智能助手將進(jìn)一步鞏固其市場(chǎng)地位。谷歌公司將塑造用戶的使用體驗(yàn),而塑造過(guò)程顯然不可能與其利益取向相沖突。”
競(jìng)爭(zhēng)態(tài)勢(shì)加劇
當(dāng)然,如果人們認(rèn)定自己并不需要數(shù)字助手,那么以上一切都是空談。
就在 Huffman 和他的團(tuán)隊(duì)在努力為谷歌智能助手開(kāi)發(fā)更多新功能時(shí),Pichai也在做相應(yīng)的工作。Huffman表示,這位谷歌掌門人經(jīng)常提醒他們軟件中存在的漏洞或糟糕的體驗(yàn)。例如,當(dāng)他說(shuō)“Hey Google”時(shí),設(shè)備并沒(méi)有做出正確反應(yīng)時(shí),他會(huì)馬上把情況告知Huffman。而當(dāng) Pichai 試圖設(shè)置軟件以確保助手能夠認(rèn)出其他家庭成員的聲音時(shí),他又向 Huffman 抱怨稱,整個(gè)設(shè)置過(guò)程太復(fù)雜了。Huffman笑著說(shuō),“他有時(shí)候甚至?xí)_我大聲嚷嚷,這也很正常,Pichai真的有在推動(dòng)我們前進(jìn)。”
為了證明消費(fèi)者確實(shí)在使用他們的智能助手,上個(gè)月亞馬遜與谷歌都進(jìn)行了一次機(jī)密大公開(kāi)——披露用戶相關(guān)數(shù)據(jù)。
圖:上個(gè)月,谷歌公司上線了一項(xiàng)解說(shuō)員模式,該模式目前正在凱撒酒店的禮賓服務(wù)臺(tái)進(jìn)行試點(diǎn)
亞馬遜公司指出,Alexa設(shè)備銷量已經(jīng)超過(guò)1億臺(tái)。不甘示弱的谷歌幾天后公布,Google assistant的覆蓋量即將逼近10億。然而,雙方都沒(méi)有真正開(kāi)誠(chéng)布公地闡述整個(gè)背景。例如,由于 Google assistant 采取預(yù)安裝策略,因此所謂十億臺(tái)安裝量中的大多數(shù)(當(dāng)然,谷歌不會(huì)公布具體數(shù)字)是自動(dòng)安裝到安卓手機(jī)上的。另外,谷歌自然也會(huì)在自家 Pixel 手機(jī)上默認(rèn)安裝 Google assistant。
筆者問(wèn)Huffman,以上數(shù)據(jù)何時(shí)才能真正突破手機(jī),在其它智能設(shè)備上占據(jù)主導(dǎo)份額。他回答說(shuō)不知道,但谷歌正在探索 Google assistant 的兩大用武之地:汽車與家居環(huán)境。
谷歌公司長(zhǎng)久以來(lái)一直針對(duì)智能家居進(jìn)行系統(tǒng)設(shè)計(jì)與規(guī)劃,其希望在智能家居助手市場(chǎng)與亞馬遜及其Echo一較高下。另外,谷歌還希望 Google assistant 盡量與三星、索尼以及海信等制造商合作,讓自己的智能助手入駐智能電視平臺(tái)。在另一方面,關(guān)于谷歌將助手引入汽車領(lǐng)域卻曝光度不高。實(shí)際上,CES19期間,谷歌公司也公布了一系列汽車輔助設(shè)備,包括由Anker Roav制造的汽車-手機(jī)適配器,可接入點(diǎn)煙器。
谷歌背后的思路,無(wú)疑是盡可能提高智能助手的普及度。這條道路絕不輕松,Huffman表示加大賭注是必須的。
他說(shuō),“無(wú)論是來(lái)自谷歌還是其他廠商,目前的智能助理對(duì)大多數(shù)用戶而言,還不夠完美,至少還遠(yuǎn)遠(yuǎn)達(dá)不到「沒(méi)有它我就活不下去」的程度。”因此谷歌公司還有很多工作要做。“毫無(wú)疑問(wèn),這是一個(gè)賭注。”
好文章,需要你的鼓勵(lì)
這項(xiàng)研究提出了"高效探測(cè)"方法,解決了掩碼圖像建模AI難以有效評(píng)估的問(wèn)題。通過(guò)創(chuàng)新的多查詢交叉注意力機(jī)制,該方法在減少90%參數(shù)的同時(shí)實(shí)現(xiàn)10倍速度提升,在七個(gè)基準(zhǔn)測(cè)試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質(zhì)量與分類性能的強(qiáng)相關(guān)性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應(yīng)性。團(tuán)隊(duì)承諾開(kāi)源全部代碼,推動(dòng)技術(shù)普及應(yīng)用。
伊利諾伊大學(xué)研究團(tuán)隊(duì)開(kāi)發(fā)了CLAIMSPECT系統(tǒng),通過(guò)層次化分解復(fù)雜爭(zhēng)議、智能檢索相關(guān)文獻(xiàn)、多角度收集觀點(diǎn)的方法,將傳統(tǒng)的"真假"判斷轉(zhuǎn)變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動(dòng)構(gòu)建爭(zhēng)議話題的分析框架,識(shí)別不同觀點(diǎn)及其支撐證據(jù),為科學(xué)和政治爭(zhēng)議提供更全面客觀的分析,已在生物醫(yī)學(xué)和國(guó)際關(guān)系領(lǐng)域驗(yàn)證有效性。
清華大學(xué)研究團(tuán)隊(duì)首次提出情感認(rèn)知融合網(wǎng)絡(luò)(ECFN),讓AI能像人類一樣理解和表達(dá)情感。該系統(tǒng)通過(guò)多層次情感處理架構(gòu),在情感識(shí)別準(zhǔn)確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達(dá)自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實(shí)現(xiàn)了跨模態(tài)情感融合、動(dòng)態(tài)情感追蹤和個(gè)性化情感建模,為醫(yī)療、教育、客服等領(lǐng)域帶來(lái)革命性應(yīng)用前景。
哈佛大學(xué)研究團(tuán)隊(duì)通過(guò)創(chuàng)新的多智能體強(qiáng)化學(xué)習(xí)方法,讓AI在戰(zhàn)略游戲中學(xué)會(huì)復(fù)雜推理。研究發(fā)現(xiàn)AI通過(guò)游戲競(jìng)爭(zhēng)能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問(wèn)題等方面表現(xiàn)顯著提升。這項(xiàng)突破性成果為未來(lái)AI在醫(yī)療、教育、城市管理等領(lǐng)域的應(yīng)用奠定基礎(chǔ),展現(xiàn)了通過(guò)模擬人類學(xué)習(xí)過(guò)程培養(yǎng)真正智能AI的新路徑。