埃隆·馬斯克曾經多次強調,特斯拉公司將在2020年年底之前打造出全自動駕駛汽車。“這方面存在很多小問題,最大的挑戰(zhàn)就是如何把這些小問題全數解決掉,再整合進一套統(tǒng)一的系統(tǒng)當中。”
雖然這種完全無需人為干預就能應對旅程中種種狀況的汽車(業(yè)界稱之為「L5級自動駕駛」)也許正在走近,但實際生產出能夠安全合法上路的自動汽車卻又是另一碼事。
全自動駕駛汽車之所以遲遲上不了路,是因為其中仍存在著不少根本性挑戰(zhàn)。下面來看五大最為核心的障礙。
1. 傳感器
自動駕駛汽車使用各種各樣的傳感器以“觀察”周邊環(huán)境,幫助系統(tǒng)檢測諸如行人、其他車輛以及路標等物體。攝像頭負責幫助汽車獲得視覺,激光雷達負責測量物體與車輛之間的距離,普通雷達則檢測物體并跟蹤其行進速度與方向。
這些傳感器會不斷將數據饋送至汽車的控制系統(tǒng)或計算機端,借此決定應在哪里轉向或者何時進行制動。全自動駕駛汽車需要一套能夠在一切條件及環(huán)境下,準確檢測物體、距離、速度等指標的傳感器,且全程無需人為介入。
但惡劣的天氣、繁忙的交通以及帶有涂鴉的道路標志,都會對傳感器的識別能力產生負面影響。特斯拉使用的雷達雖然不太容易受到惡劣天氣條件的影響,但卻仍無法達到全自動駕駛汽車對于物體檢測水平的嚴苛要求。
就目前的情況看,特斯拉的“autopilot”L2級自動駕駛已經釀成過不少事故,包括今年7月撞上了其他駐停車輛。事實證明,該公司的傳感器在應對全天候行駛場景時,還有很長的路要走。
2. 機器學習
大部分自動駕駛汽車使用人工智能與機器學習處理來自傳感器的數據,并根據結合做出關于下一步行動的具體決策。這些算法將幫助系統(tǒng)識別傳感器檢測到的目標,并根據訓練經驗將目標分類為行人、路燈等。最后,汽車再使用此信息確定是否需要回避檢測到的物體,以及接下來需要采取哪些行動——例如制動或轉彎等。
未來,機器也許會擁有比人類駕駛員更高效的對象檢測與分類能力。但至少就目前來看,汽車中所使用的機器學習算法仍然缺少充分的安全性依據。在如何訓練、測試或驗證機器學習算法方面,各標準化機構乃至整個自動駕駛行業(yè)都還沒有達成共識。
3. 開放道路
自動駕駛汽車在駛入開放道路之后,還將繼續(xù)自己的學習過程。它會在新的路段上行駛,檢測出訓練中從未遇到過的物體,并據此進行軟件更新。
那么,我們該如何保證系統(tǒng)能夠始終擁有與已驗證版本擁有相同的安全性?我們必須能夠證明一切新的學習結論都安全可靠,且系統(tǒng)不會忘記之前掌握的安全知識。遺憾的 是,業(yè)界目前對此還沒有統(tǒng)一的解決思路。
4. 監(jiān)管要求
不單是自動駕駛領域,目前還沒有哪個行業(yè)針對自主系統(tǒng)出臺充分的標準與法規(guī)。現(xiàn)有車輛安全性的標準假設,要求駕駛員能夠在緊急情況下立即接管。
對于自動駕駛汽車,法規(guī)只針對某些特殊功能(例如自動車道保持系統(tǒng))做出了規(guī)定。至于包括自動駕駛汽車在內的自動駕駛系統(tǒng),雖然已經有國際標準設定了部分相關要求,但暫時還沒有解決之前提到的傳感器、機器學習與行為學習方面的問題。
因此,只要沒有公認的法規(guī)與標準,自動駕駛汽車無論是否安全、都無權在開放道路上正常行駛。
5. 社會接受度
特斯拉目前的自動駕駛功能已經先后引發(fā)多起事故。由此引發(fā)的社會認可度低下問題不僅來自打算購買這類產品的用戶,也來自與這類用戶共享道路的其他交通參與者。
公眾需要參與到自動駕駛汽車的引入與采用決策當中。如果缺少這個環(huán)節(jié),此項技術就有可能被人民群眾拒之門外。
很明顯,只有解決了前三項挑戰(zhàn),我們才有機會攻克最后兩個障礙。目前,業(yè)界各方都在爭取成為第一家推出全自動駕駛汽車的廠商。但是,如果我們未能就實現(xiàn)汽車安全、提供安全證明以及通過監(jiān)管機構/公眾合作取得認可接納達成共識,那么自動駕駛汽車在未來幾年中仍然只能長期處于測試階段。
對于馬斯克這樣的企業(yè)家來說,這樣的現(xiàn)狀無疑令人沮喪。但正是因為遍布荊棘,率先在安全、保障、法規(guī)與接納度等領域取得突破的廠商,才能發(fā)展為新的巨頭、并引領整個新的時代。
好文章,需要你的鼓勵
浙江大學團隊提出動態(tài)專家搜索方法,讓AI能根據不同問題靈活調整內部專家配置。該方法在數學、編程等任務上顯著提升推理準確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓練策略,成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示,該方法在數學競賽題上將模型準確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓練提供了新思路。
南洋理工大學與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術,實現(xiàn)AI視頻實時流式生成的重大突破。該技術通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質量視頻,延遲僅0.76秒,質量漂移指標從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內容創(chuàng)作開辟新可能。
華中科技大學研究團隊發(fā)現(xiàn),通過讓AI模型學習解決幾何問題,能夠顯著提升其空間理解能力。他們構建了包含約30000個幾何題目的Euclid30K數據集,使用強化學習方法訓練多個AI模型。實驗結果顯示,幾何訓練在四個空間智能測試基準上都帶來顯著提升,其中最佳模型達到49.6%準確率,超越此前最好成績。這項研究揭示了基礎幾何知識對培養(yǎng)AI空間智能的重要價值。