
維多利亞警察局是澳大利亞維多利亞州的主要執(zhí)法機構。在過去一年里,州內共有1.6萬多輛車被盜,涉案費用約1.7億美元,對此維多利亞警方十分頭疼,開始嘗試技術手段去抓偷車賊。
為防止被盜汽車被進一步欺詐性銷售,維州公路局先是啟用了一項網絡服務,以檢查車輛注冊狀況,接著又打算投資研發(fā)一套汽車牌照掃描儀——基于計算機視覺識別系統(tǒng)、可掃描過往車輛、自動識別被盜汽車的固定三腳架攝像機。
然而整套裝置價格高昂,約8600萬美元。有業(yè)內評論員分析,要想將這個成本共計8600萬美元的系統(tǒng)配置在220輛車上,相當于每輛車支出390909美元。
警方的舉措引起了網友Tait Brown的注意。Tait是一名開發(fā)者和設計師,他覺得維州警局的做法太浪費錢,于是突發(fā)奇想,準備用開源技術動手做一個車牌掃描儀模型,如果車輛被盜或未被注冊,它就會自動通知車主。
圖:現有的車牌識別系統(tǒng)
在開始之前,Tait簡單列出了車牌掃描儀產品的三個關鍵點。
將直播視頻流傳給中央處理器,似乎是解決問題最差的方法了。因為這除了會產生昂貴的數據流量費,還會加劇網絡延遲問題。
盡管,集中式的機器學習算法很有效,因為系統(tǒng)會隨著深度學習的過程而變得更精確,但Tait更想知道,如果在本地設備實現這一功能是否就已經“足夠好”。
由于Tait手頭沒有Raspberry Pi(樹莓派,微型電腦)攝像頭或USB網絡攝像頭,所以他就用現成的Dashcam鏡頭替代——一個隨時可用的樣本數據來源,Dashcam鏡頭還有一個好處,它的視頻成像效果,與車載攝像頭所拍攝的視頻質量差不多。
如果依賴于一個專有軟件打造設備,意味著后續(xù)每一次請求都將付費。相比之下,開源技術省錢是毋庸置疑的。
整個解決方案很簡單
產品設計好了以后,就可以操作了。Tait的解決方案是,從Dashcam視頻中獲取圖像,然后通過一個本地安裝在車牌掃描儀設備上的開源車牌識別系統(tǒng)抓取圖像,來查詢汽車的注冊檢查服務,并顯示結果。
傳輸到安裝在執(zhí)法車輛的設備數據包括:汽車出廠型號(只有汽車被盜時才會核實)、注冊狀態(tài)以及車輛被盜時的通知報告。
聽起來是不是很簡單。例如,圖像處理都可以交由openalpr庫處理。這涉及到識別車牌上的字符:
PS:公共訪問維州公路局的API接口是不可用的,因此Tait從官方網絡下載數據,來進行車牌識別測試。
以下是他測試的過程:
但結果出乎意料的準確
測試結果讓Tait感到驚喜。他此前還擔心用開源系統(tǒng)識別車牌的效果會不理想,并且圖像識別算法很可能并未針對澳大利亞車牌進行優(yōu)化。
然而最終的解決方案卻能夠在寬廣的視野中識別車牌。
圖:反光和攝像頭失真也不影響車牌識別
不過難以避免的,解決方案有時候也會出錯。
圖:讀數不正確,誤將M識別為H
但是,解決方案最終還是會糾正錯誤,給出正確反饋。
圖:幾幀后,M已被正確識別,而且有著更高的置信度評分
如以上兩張圖所示,圖像處理的置信度評分從原來的87%上升到了91%以上。
這讓Tait確信,通過提高采樣率可以提高準確率,然后按最高置信度進行排序?;蛘撸部梢哉{整閾值,設置成僅在置信度大于90%的情況下才接受汽車牌照號的驗證。
這些都是很直接的代碼優(yōu)先解決方案(code-first),并且不排除使用本地數據集,來訓練車牌識別軟件。
關于8600萬美元的問題
做完了以上試驗之后,Tait完全想不明白為什么要花費8600萬美元,也沒覺得,經過本地化訓練的開源工具比BlueNet系統(tǒng)(第三方技術服務)的準確性低。
Tait預計,這筆預算其中一部分還包括:對幾個遺留數據庫和軟件應用程序的更新,以支持每秒對每輛車進行高頻率、低延遲的車牌查詢。
另一方面,如果每輛車的識別成本在39.1萬美元左右,確實挺貴,尤其是如果BlueNet系統(tǒng)的識別結果并非特別準確,而且沒有大規(guī)模的IT項目停產或升級相關系統(tǒng)的情況下,根本花不了那么多錢。
試想一下,未來這種車牌識別系統(tǒng)可以有很多應用場景。譬如,系統(tǒng)自動掃描綁匪之后,自動報警并告知家屬綁匪當前的位置和方向,那該有多酷。
如今特斯拉汽車已經配置了攝像頭和傳感器,能夠接收OTA更新,這就相當于目擊者。當然,Uber和Lyft司機也可以配備這些設備,來增加安全性。
簡而言之,使用開源技術和現有組件,似乎有可能提供一個回報率更高、更省錢的解決方案,投資遠遠低于8600萬美元哦!
好文章,需要你的鼓勵
浙江大學團隊提出動態(tài)專家搜索方法,讓AI能根據不同問題靈活調整內部專家配置。該方法在數學、編程等任務上顯著提升推理準確率,且不增加計算成本。研究發(fā)現不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓練策略,成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示,該方法在數學競賽題上將模型準確率提升43.2%的同時,輸出長度減少46.9%,真正實現了效率與性能的雙重優(yōu)化,為AI模型訓練提供了新思路。
南洋理工大學與騰訊聯合研究團隊開發(fā)出Rolling Forcing技術,實現AI視頻實時流式生成的重大突破。該技術通過滾動窗口聯合去噪、注意力錨點機制和高效訓練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質量視頻,延遲僅0.76秒,質量漂移指標從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內容創(chuàng)作開辟新可能。
華中科技大學研究團隊發(fā)現,通過讓AI模型學習解決幾何問題,能夠顯著提升其空間理解能力。他們構建了包含約30000個幾何題目的Euclid30K數據集,使用強化學習方法訓練多個AI模型。實驗結果顯示,幾何訓練在四個空間智能測試基準上都帶來顯著提升,其中最佳模型達到49.6%準確率,超越此前最好成績。這項研究揭示了基礎幾何知識對培養(yǎng)AI空間智能的重要價值。