再有幾周就到萬圣節(jié)了,今年讓人害怕的東西可不止是鬼怪、還有更多晦暗不明的新難題。
就拿自動駕駛汽車來說,技術(shù)人員直到現(xiàn)在也不清楚怎么才能在完全無需人類介入的情況下實(shí)現(xiàn)自主行駛。哪怕是代表業(yè)界前沿水平的特斯拉FSD,也經(jīng)常會在明顯標(biāo)記為單行道的路面上逆向行駛。
這又帶來了新問題:關(guān)于自動駕駛汽車即將全面鋪開的傳聞,實(shí)際是種被嚴(yán)重夸大的謠言。
馬斯克曾在2019年放出震驚世界的豪言——在2020年內(nèi)部署100萬輛全自動機(jī)器人出租車,專家們也紛紛對此表示肯定。但如今的結(jié)果呢?目前跑在路面上的特斯拉自動駕駛汽車共有……零臺。
https://t.co/NEVnU4Jjgy
— 李開復(fù) (@kaifulee) 2019年5月8日
投資者們對自動駕駛汽車再度延后一年的現(xiàn)狀感到不安。幾年前,大家都以為自動駕駛汽車馬上就會成為常態(tài)。但如今,幾年過去了……距離這個(gè)目標(biāo)似乎還有幾年。
而且如果跟負(fù)責(zé)開發(fā)這類技術(shù)的企業(yè)高管交流過,大家就會意識到,他們?nèi)匀辉谥貜?fù)當(dāng)初的承諾。
所以最核心的問題就變成了,這類技術(shù)的普及是不是永遠(yuǎn)還需要幾年,或者說到底存不存在一個(gè)真正明確的發(fā)展里程碑?
努力解決這個(gè)問題的廠商絕不止是福特、Cruise、Waymo以及特斯拉,但無論是誰,參與其中的企業(yè)都希望能用自動駕駛話題幫自己在媒體上搏點(diǎn)熱度。
還有無數(shù)其他技術(shù)企業(yè)在嘗試解決自治系統(tǒng)的問題。而且他們寧愿直面問題失真的風(fēng)險(xiǎn),也不想停下營銷活動的腳步——大批銷售價(jià)值4萬美元的汽車,至于技術(shù)承諾……這個(gè)總有一天會實(shí)現(xiàn)的。
AEye公司首席科學(xué)家Allen Steinhardt在采訪中討論了這個(gè)問題,希望結(jié)合自身經(jīng)歷聊聊自動駕駛領(lǐng)域的真實(shí)情況。
AEye是一家專注于激光雷達(dá)的公司,目前擁有包括iDAR(智能檢測與測距)雙基架構(gòu)(雙獨(dú)立通信通道)技術(shù)在內(nèi)的100多項(xiàng)專利,希望為激光雷達(dá)提供效果確切的集成化AI解決方案。
另外,Steinhardt之前還在DARPA(美國國防部高級研究計(jì)劃局)擔(dān)任過前首席科學(xué)家。尖端軍事技術(shù)領(lǐng)域的背景再加上豐富的全球規(guī)模交通問題解決經(jīng)驗(yàn),讓他成為自動駕駛汽車領(lǐng)域的頂尖專家。
我們想弄清的第一個(gè)問題就是“為什么”。為什么自動駕駛汽車技術(shù)一直說“還需要幾年”,說著說著就已經(jīng)過去了十年?
援引業(yè)內(nèi)的說法,Steinhardt認(rèn)為真正的問題在于發(fā)明和應(yīng)用的有效結(jié)合。其中最大的挑戰(zhàn),就是如何創(chuàng)造出能夠運(yùn)用現(xiàn)有成果的實(shí)用性技術(shù):
我們的基礎(chǔ)設(shè)施是為人類建造的。……而且無論是軍用還是民用,直接放棄這些現(xiàn)有設(shè)施顯然不太可能。
走在街道上,可以看到停車標(biāo)志、交通燈以及無數(shù)其他用于提醒人類駕駛員注意當(dāng)前路況的視覺元素。我們將路邊標(biāo)牌與GPS系統(tǒng)及加速度計(jì)相結(jié)合,共同為智能手機(jī)或車載系統(tǒng)建立起現(xiàn)代范式,能夠即時(shí)向駕駛員提供方向指引——例如500米后右轉(zhuǎn)。
事實(shí)上,消費(fèi)者們也更傾向于支持馬斯克提出的純視覺型自動駕駛汽車。幾年前,最主流的自動駕駛解決方案就是視覺分析——在汽車上裝滿攝像頭,再訓(xùn)練AI模型以解釋圖像。這樣似乎就能完美替代人類駕駛員的路況判斷了。
但實(shí)際上,我們想要的是類似于人類的駕駛機(jī)器嗎?或者說,純視覺方法到底能帶我們走多遠(yuǎn)?
馬斯克承諾的以深度學(xué)習(xí)算力暴力提升視覺系統(tǒng)效能的思路,必須要以一輛能夠斷網(wǎng)運(yùn)行且同樣效果良好的實(shí)車為依據(jù)。很明顯,沒人受得了一旦網(wǎng)絡(luò)連接故障、車子就得拋錨在路邊。
但正如Steinhardt的提醒,這套方案中的核心并不在于數(shù)據(jù)加密;相反,關(guān)鍵是如何利用現(xiàn)有標(biāo)牌、道路、GPS數(shù)據(jù)等建立起不依賴于現(xiàn)有網(wǎng)絡(luò)基礎(chǔ)設(shè)施的通信陣列。這樣即使車輛不能或不應(yīng)直接使用現(xiàn)有網(wǎng)絡(luò),也需要建立起屬于自己的網(wǎng)絡(luò)體系。
Steinhardt認(rèn)為,問題在于大多數(shù)通信陣列(包括5G)都存在數(shù)據(jù)擁塞與數(shù)據(jù)丟失的風(fēng)險(xiǎn)。對于大量依賴外部數(shù)據(jù)的車輛來說,這會構(gòu)成一大關(guān)鍵故障點(diǎn)。
總而言之,路面上之所以見不到自動駕駛汽車跑來跑去,就是因?yàn)檫@項(xiàng)技術(shù)還沒有完全成熟。就這么簡單。
視覺方法確實(shí)能解決不少問題,但如果我們希望未來的汽車在駕駛效能上與人類一樣甚至更好,那就得想點(diǎn)新辦法。
AEye及其合作伙伴正致力于大規(guī)模生產(chǎn)激光雷達(dá)系統(tǒng),希望在車輛直線行駛和紅燈停車之外探索出更多重要應(yīng)用場景。
拋開方向盤與踏板操作不談,駕駛過程需要考慮的不僅僅是遵守交通規(guī)則和避免撞車。Steinhardt提到幾年前出現(xiàn)的一個(gè)典型場景——一處橋梁意外被洪水沖毀。
這類情況對駕駛員來說可能非常危險(xiǎn)、甚至帶來致命威脅;即使在現(xiàn)代世界中,災(zāi)難期間的信息傳遞仍然比較困難。我們很難斷言在獲得及時(shí)上報(bào)之前,已經(jīng)有多少車輛受到影響;而且一旦網(wǎng)絡(luò)基礎(chǔ)設(shè)施出現(xiàn)故障,傳統(tǒng)通信線路也往往會同時(shí)陷入癱瘓。
AEye的iDAR系統(tǒng)擁有將激光雷達(dá)傳感器轉(zhuǎn)換為光通信網(wǎng)絡(luò)的專利功能;如此一來,傳感器不僅能夠確定道路上發(fā)生的狀況,同時(shí)也能建立起實(shí)時(shí)通信陣列,幫助協(xié)調(diào)多個(gè)車輛節(jié)點(diǎn)之間的“知識”。這樣即使互聯(lián)網(wǎng)發(fā)生故障,或者4G/5G網(wǎng)絡(luò)遭遇擁塞,車載通信陣列仍能以最佳方式運(yùn)作。
正如Steinhardt所言,業(yè)界的目標(biāo)應(yīng)該是引導(dǎo)車輛創(chuàng)建出動態(tài)系統(tǒng),保證“在沒有網(wǎng)絡(luò)基礎(chǔ)設(shè)施的情況下完成互聯(lián)網(wǎng)的一切功能”。
例如,這類系統(tǒng)不僅能夠向車輛實(shí)時(shí)通報(bào)特定范圍內(nèi)的道路變化情況(例如橋梁被洪水沖毀),還可以執(zhí)行其他無數(shù)任務(wù),例如共享關(guān)于道路的匿名統(tǒng)計(jì)數(shù)據(jù)、提供更豐富的乘客娛樂選項(xiàng)、甚至隨時(shí)連通同一區(qū)域內(nèi)的兩位乘車人開展游戲?qū)埂?
Stenhardt還提出了“隨車拍賣系統(tǒng)”的思路,這類系統(tǒng)能夠?qū)崟r(shí)運(yùn)行、以無縫方式移交實(shí)體產(chǎn)品或銷售服務(wù),高效解決由來已久的旅行商問題。
我們可以設(shè)想這樣一個(gè)基于車載平臺的新時(shí)代,銷售與配送都能夠以車輛為起點(diǎn)/終點(diǎn),大大降低環(huán)保成本、改善經(jīng)濟(jì)性。這類系統(tǒng)甚至能夠無縫處理訂單取消或車輛事故,從而消除意外引發(fā)的漣漪效應(yīng)。
更令人興奮的是,如果車輛遇到極端情況——例如陷入泥地?zé)o法脫困,系統(tǒng)還可以與其他遭遇類似問題的車輛合作尋求解決方案,或者發(fā)出警告以提醒其他車輛遠(yuǎn)離這部分“危險(xiǎn)區(qū)域”。
這些應(yīng)用已經(jīng)遠(yuǎn)遠(yuǎn)超出了消費(fèi)級車輛與機(jī)器人出租車的概念空間。鐵路、航空、海運(yùn)與陸運(yùn)行業(yè)已經(jīng)發(fā)展成熟,能夠以彼此交錯(cuò)的數(shù)據(jù)驅(qū)動自治與通信系統(tǒng)這場顛覆性革命。只要這類系統(tǒng)成功落地,將給我們帶來更快、更便宜也更安全的社會運(yùn)作體驗(yàn)。
但說了這么多,我們?nèi)圆磺宄裁磿r(shí)候才能在全球城市街道上看到這類技術(shù)的大規(guī)模民用普及。
好在與其坐等技術(shù)突破,以AEye為代表的眾多企業(yè)正在積極推動這波變革。AEye公司在iDAR、激光雷達(dá)以及其他多個(gè)領(lǐng)域的百余項(xiàng)專利技術(shù),也代表著各廠商與AI開發(fā)人員努力將理想轉(zhuǎn)化為現(xiàn)實(shí)的真切付出。
也許我們距離L4與L5級自動駕駛汽車真的“只有幾年時(shí)間”,也許之前提到的、科幻般的生活新時(shí)代已經(jīng)觸手可及。讓我們共同期待!
好文章,需要你的鼓勵
浙江大學(xué)團(tuán)隊(duì)提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學(xué)、編程等任務(wù)上顯著提升推理準(zhǔn)確率,且不增加計(jì)算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學(xué)研究團(tuán)隊(duì)提出SIRI方法,通過"壓縮-擴(kuò)張"交替訓(xùn)練策略,成功解決了大型推理模型"話多且準(zhǔn)確率低"的問題。實(shí)驗(yàn)顯示,該方法在數(shù)學(xué)競賽題上將模型準(zhǔn)確率提升43.2%的同時(shí),輸出長度減少46.9%,真正實(shí)現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓(xùn)練提供了新思路。
南洋理工大學(xué)與騰訊聯(lián)合研究團(tuán)隊(duì)開發(fā)出Rolling Forcing技術(shù),實(shí)現(xiàn)AI視頻實(shí)時(shí)流式生成的重大突破。該技術(shù)通過滾動窗口聯(lián)合去噪、注意力錨點(diǎn)機(jī)制和高效訓(xùn)練算法三項(xiàng)創(chuàng)新,解決了長視頻生成中的錯(cuò)誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標(biāo)從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學(xué)研究團(tuán)隊(duì)發(fā)現(xiàn),通過讓AI模型學(xué)習(xí)解決幾何問題,能夠顯著提升其空間理解能力。他們構(gòu)建了包含約30000個(gè)幾何題目的Euclid30K數(shù)據(jù)集,使用強(qiáng)化學(xué)習(xí)方法訓(xùn)練多個(gè)AI模型。實(shí)驗(yàn)結(jié)果顯示,幾何訓(xùn)練在四個(gè)空間智能測試基準(zhǔn)上都帶來顯著提升,其中最佳模型達(dá)到49.6%準(zhǔn)確率,超越此前最好成績。這項(xiàng)研究揭示了基礎(chǔ)幾何知識對培養(yǎng)AI空間智能的重要價(jià)值。