“你好,Bixby。三星打算用你做什么?”
事實證明,可以做許多有價值的事情。
Bixby是三星人工智能的多模交互平臺,數(shù)字語音助手是眾功能之一。今年初在已推出的GalaxyS8中亮相。手機側面有Bixby的專屬按鈕,用戶可以像使用對講機那樣與人工智能對話。
上周,三星剛宣布Bixby中文版將在11月30日正式上線,搭載在Galaxy S8、Note 8、W2018 三款手機產品上。
三星移動軟件與服務運營研發(fā)部負責人 李仁宗
按照三星移動軟件與服務運營研發(fā)部負責人李仁宗(Injong Rhee)的設想,你可以將Bixby視作一個“明智伙伴”管理手機,但Bixby仍有更多功能等待開發(fā)。
李仁宗(Injong Rhee),現(xiàn)主要掌管三星移動軟件與服務業(yè)務研發(fā)部,負責研發(fā)Bixby。他穿著休閑,并且不拘小節(jié),他說:“我們創(chuàng)業(yè)是從手機開始的,將迅速擴展到其他業(yè)務。”
數(shù)字助手,是一個充滿“火藥味”的戰(zhàn)場。
各大科技巨頭們正投身這些助手軟件的開發(fā)中,并希望能與用戶建立一種良好關系,讓有問必答的交互方式說服用戶買更多自家產品。
當然,在這個戰(zhàn)場靜默觀察許久的三星,終于也按捺不住。
與其他公司一樣, 三星認為,AI將成為未來計算市場的“領頭羊”,Bixby將驗證這一觀點。 Gartner認為:到2019年,數(shù)字助手將會成為用戶與智能家居產品交流的最主要渠道。
但三星的AI軟件應用與其競爭對手不一樣。Bixby有助于操作手機,而不是簡單回答,例如“今天天氣怎么樣”這樣簡單問題。你可以利用Bixby做其他事情,更“聰明”的事。
舉個例子,在喚醒Bixby后說出“發(fā)郵件給小李標題是通知正文是發(fā)布會后聚餐”。在接收到指令后,Bixby很快執(zhí)行了任務:開啟郵件App,擬好標題、正文、收件人姓名。
Bixby接收指令后,可直接發(fā)郵件
李仁宗說:“我們競爭對手的很多產品,實際上是搜索引擎美化版或延伸版。”但三星的目標是將Bixby打造成將“觸摸”功能與“語言”功能相結合的新界面。
他還預測,現(xiàn)在可以在手機上觸摸操作的事情,未來都能夠通過聲音實現(xiàn)。
他說:“智能手機推出的時候,觸摸界面已成為常態(tài);而智能手機問世十年后,正在醞釀一場新的革命,這場革命來自于機器學習與深度學習。”
人們有足夠理由Bixby,因為這不是三星首次涉足語音助手領域。2012年,三星公司推出的GalaxyS3中就裝有S Voice軟件,但由于該項技術的可靠性差,S Voice很快淪為“雞肋”。
“S Voice的功能確實太基礎了,它從未努力嘗試過趕超其他語音助手產品。”Jackdaw Research的分析師簡·道森說,“因此發(fā)布Galaxy S8時,三星必須要證明Bixby有足夠的競爭力。”
但Bixby的功能最初很有限,只支持英文和韓文兩種語言,之后不久會添加中文(已發(fā)布)和西班牙語。
你可以向左滑動進入“Bixby Home”界面,這曾經是Flipboard的位置。Bixby Home界面有些建議卡片,這些卡片讓你的生活更簡單。比如,如果你經常下午四點鐘給媽媽打電話,你還沒打開手機的功能,這張卡片會自動提醒你給媽媽打電話。
最初,Bixby只能與10個三星預裝的應用程序(APP)一起使用,包括照片庫、電話、聯(lián)系人、信息和設置等,不包括郵件和日歷。但三星計劃未來允許第三方應用程序開發(fā)者使用Bixby。事實上,在上周Bixby中文版發(fā)布會上,已經得以見證。
Bixby還有一個圖像識別組件“Bixby Vision”,可識別地標、葡萄酒類型、產品以及翻譯文本。Bixby將告訴你這個物品是什么。在美國的話,它會跳轉到亞馬遜界面以便用戶購買。
同事們多喜歡穿深色西裝和襯衫,而李仁宗穿著亮色的紫色毛衣和牛仔褲。他向大家分享了對Bixby的想法:將Bixby廣泛應用到三星所有產品中。想象一下,未來將在三星電視、家用電器以其他任何三星銷售的產品上都可以看到Bixby按鈕。
他說:“Bixby可以用于任何有互聯(lián)網和麥克風的設備。”
約25個月前,三星開始開發(fā)Bixby。之所以最后取名為Bixby并無特殊含義,僅僅是因為這一名字受千禧一代年輕人的青睞。
李仁宗說,“為了讓人們更容易接受Bixby,我們在開發(fā)時改變了很多三星的固有理念。”
然而,在開發(fā)階段,三星發(fā)現(xiàn)Bixby缺少一些關鍵功能。很快,三星去年又收購了一家AI初創(chuàng)公司Viv Labs和Joyent(一家云計算公司) 。
最初版的Bixby只使用了三星自家技術,而未來的更新版將包含Viv公司的技術,李仁宗說這將幫助Bixby與第三方應用程序一起運行。
他說,“我們正在通過Vivi Labs不斷推動這一生態(tài)系統(tǒng)以更具可擴展性的方式發(fā)展。”
Viv可以幫助客戶處理一些日常工作,如訂購鮮花、預訂酒店房間和查看天氣狀況等。你只需要用日常用語發(fā)出命令,所有這些都可實現(xiàn)。Viv的開發(fā)者,也是Siri開發(fā)者,Dag Kittlaus認為,這些軟件能明白用戶要求,交流過程中可實現(xiàn)客戶要求,而不像其他人工智能助手那樣只能使命令格式化。
李仁宗說,三星公司還在尋找更多有收購價值的公司。
與蘋果將Siri的喚醒鍵整合進Home鍵不同,三星給Bixby設計了專屬按鈕。李仁宗解釋稱,這是由于Home鍵分配的任務實在太多,將Bixby整合進去,用戶用起來很容易出錯。
他說,設計獨立的按鍵,用戶就能像使用對講機一樣控制Bixby了,這樣的操作方式更加自然。當然,如果沒有按下按鈕,Bixby也會使用喚醒命令呼叫AI助手。
科技研究公司Creative Strategies的數(shù)據能支持三星的選擇,因為它們發(fā)現(xiàn)在公共場合使用語音助手的人只有6%。
Creative Strategies的分析師卡洛琳娜·米拉奈西(Carolina Milanes)說,“消費者還不習慣用語言與設備交流,但隨著Echo和Google Home的出現(xiàn),這種情況正在發(fā)生變化,尤其在家庭中更明顯。”
Galaxy S8不是唯一擁有這一按鈕設計的設備,李仁宗還預想未來在所有支持Bixby的設備上,都設計上這樣的按鈕。
“從某種意義是說,這個按鈕非常重要。”將來,家里會有很多能夠與我們交流的智能設備。“如果說,‘Bixby,你好’,所有設備都會啟動并與你對話。擁有這個按鈕技術上使很多事情變得簡單,且給用戶更好的體驗。“
李仁宗表示,洗衣機或遙控器可能不僅僅只有一個Bixby按鈕,也許未來一天還會有指紋傳感器,虹膜掃描儀或者其他一些生物識別技術等確定使用機器的人是你。
三星還透露下一步計劃,Bixby未來也可能會以App的形式在蘋果iPhone等設備中亮相。
“與我而言,這是很有意義的一件事。”李仁宗說道。
就在采訪即將結束時,我問了他一些問題,這些問題自有Bixby謠言以來我就一直很好奇。
“為什么三星要研發(fā)自己的數(shù)字助手,而不使用Android軟件制造商Google的技術?”
作為一名設備管理人員,控制了產品的體驗也就控制了產品的靈魂。”
“你好,Siri,誰是最棒的語音助手?”
很多情況下,語音命令要比打字方便的多。讓我們來對比一下現(xiàn)有的三大語音助手—Siri,Google Assistant和Bixby語音助手。
我選用了以下機型進行試驗:
這三種助手都能完成包括查看天氣、時間、設定鬧鐘、提醒或打開藍牙等基本操作。
想要拍照?下達自拍命令,其他助手都完成了任務,而Siri僅打開了前置攝像頭并沒有完成拍照。
Bixby 語音助手可進行更多操作。您可以打開攝像頭,對它說:“把后置攝像頭的分辨率調到UHD(超高清)。”
Google Assistant的查詢功能“一馬當先”。對打開藍牙或搜索天氣等指令,Google的反應速度最快。
其他多數(shù)情況下,Siri和Bixby語音助手的反應速度居第二與第三。我發(fā)現(xiàn)用“Hi, Bixby”的解鎖設備甚至比按鍵解鎖慢,這個方面三星需要向同行們借鑒經驗。
▲ Bixby 語音助手可以整理相冊,進行分類。
語音助手一直設法提升執(zhí)行復雜指令的能力?,F(xiàn)在,Bixby 語音助手已能完成“把昨天拍的所有照片整理到‘Weekend’相冊里”這樣的指令了。
除三星自帶App以外,Bixby 語音助手還能在Instagram、Facebook和 Twitter等其他程序中完成復雜指令。您可從Bixby Labs獲取可兼容App的清單。
語音命令:“打開Instagram,在我最新的自拍上添加‘美好的一天’標簽”,Bixby將自動上傳照片并添加標簽,且在發(fā)送前會請您確認。
Google Assistant只在識別到語音命令“打開Instagram”時才打開該app。對它傳達和Bixby一樣的指令,只能得到網頁搜索結果。一旦iOS 11正式發(fā)布,Siri將獲得第三方app更多支持,屆時Siri將能執(zhí)行第三方操作。
Siri和Google Assistant也支持WhatsApp、Lyft和OpenTable等第三方app。它們可識別語音命令“向Charlie發(fā)送一條WhatsApp消息。”(沒錯,Bixby也可以。)
Bixby語音助手可將冗長復雜的命令拆分為多個簡單語句。您可在查詢時點擊“添加自定義指令”或通過Bixby Home下達語音指令實現(xiàn)自定義。
Google Assistant也能通過Google Home app進行自定義。進入設置,選擇Shortcuts,然后將短語指令對應到具體操作??梢哉Z音命令“你好,Google, 逗我開心吧!”它會打開YouTube,播放柯基犬的視頻。
Bixby語音助手的一大優(yōu)勢在于能夠學習語音指令以外的內容。語音命令:“把我的最新自拍發(fā)到Facebook上”,Bixby會打開照片列表供您選擇。我選擇分享相冊中的一張照片,它隨即打開相冊,選擇已選照片,發(fā)布新的Facebook動態(tài)。
gle Assistant交談
Google Assistant的一大突破在于其對話方式更加自然、更符合語境。語音命令搜索Sean Connery的電影,它便可提供電影列表。您可以接著問:“他有多高?”
Google Assistant明白“他”指的是Sean Connery,隨即告訴你答案。這一點Siri暫時還做不到。
要得到電影清單,Bixby 語音助手需要借助特定的句式。如果你說:“播放Sean Connery的電影”,它會在手機上搜索視頻。但如果你問:“Sean Connery出演了哪些影片 ?”或者“網頁搜索Sean Connery的電影”,Bixby 語音助手提供的就是網頁列表。要是接著問他多高,Bixby 語音助手并不知道你指的是Sean Connery。
但Bixby 語音助手在識別app運行環(huán)境上占有優(yōu)勢。觀看YouTube視頻時若按了Bixby鍵,你會發(fā)現(xiàn)Bixby知道你在運行YouTube,而不是本地視頻。語音指令“顯示我的訂閱”,它便明白你想查看自己的YouTube訂閱。
短信功能是這三種助手大展身手的好途徑。如果你使用的是默認消息app,那么這些助手都能發(fā)送并朗讀信息,但Siri是迄今為止最快的。
布指令“瀏覽最新信息”,Bixby和Siri都能立即執(zhí)行,而Google Assistant會先顯示消息再詢問是否需要朗讀。
iOS 11下的Siri在翻譯方面依舊領先。向它詢問“西班牙語怎么說‘哪里有酒吧’?”,你將得到這段短語的譯文文本及音頻。
Siri可將英語即時翻譯成西班牙語、漢語普通話、法語、意大利語和德語。
▲ 就算語言不通,也不用著急。
幸虧有Google 翻譯,Google Assistant得以掌握更多種語言。和Siri類似,它也提供譯文文本及音頻。
若問:“西班牙語的‘哪里有酒吧’怎么說?”或“用西班牙語怎么說‘哪里有酒吧’?”時,Bixby 語音助手就無法識別指令了,它僅進行網絡搜索。
如果我下達翻譯命令,它隨即打開Bixby Vision,你便可點擊相機鍵,對準另一個語言的文本進行翻譯。你可以要求Bixby打開Google翻譯,但目前還不能執(zhí)行“打開Google翻譯,把‘生日快樂’翻譯成西班牙文”這樣的指令。
好文章,需要你的鼓勵
這項研究提出了"高效探測"方法,解決了掩碼圖像建模AI難以有效評估的問題。通過創(chuàng)新的多查詢交叉注意力機制,該方法在減少90%參數(shù)的同時實現(xiàn)10倍速度提升,在七個基準測試中均超越傳統(tǒng)方法。研究還發(fā)現(xiàn)注意力質量與分類性能的強相關性,生成可解釋的注意力圖譜,展現(xiàn)出優(yōu)異的跨域適應性。團隊承諾開源全部代碼,推動技術普及應用。
伊利諾伊大學研究團隊開發(fā)了CLAIMSPECT系統(tǒng),通過層次化分解復雜爭議、智能檢索相關文獻、多角度收集觀點的方法,將傳統(tǒng)的"真假"判斷轉變?yōu)槎嗑S度分析。該系統(tǒng)能夠自動構建爭議話題的分析框架,識別不同觀點及其支撐證據,為科學和政治爭議提供更全面客觀的分析,已在生物醫(yī)學和國際關系領域驗證有效性。
清華大學研究團隊首次提出情感認知融合網絡(ECFN),讓AI能像人類一樣理解和表達情感。該系統(tǒng)通過多層次情感處理架構,在情感識別準確率上比現(xiàn)有最佳系統(tǒng)提升32%,情感表達自然度提升45%。研究突破了傳統(tǒng)AI情感理解的局限,實現(xiàn)了跨模態(tài)情感融合、動態(tài)情感追蹤和個性化情感建模,為醫(yī)療、教育、客服等領域帶來革命性應用前景。
哈佛大學研究團隊通過創(chuàng)新的多智能體強化學習方法,讓AI在戰(zhàn)略游戲中學會復雜推理。研究發(fā)現(xiàn)AI通過游戲競爭能發(fā)展出類人思維能力,在邏輯推理、創(chuàng)造性解決問題等方面表現(xiàn)顯著提升。這項突破性成果為未來AI在醫(yī)療、教育、城市管理等領域的應用奠定基礎,展現(xiàn)了通過模擬人類學習過程培養(yǎng)真正智能AI的新路徑。