一張電子地圖的精度,往往決定了你能否借此順利導航到目的地,而在這背后,則是一個鮮為人知的測繪行業(yè)。
電子地圖,只是測繪行業(yè)中眾多細分應用場景之一。
實際上,包括礦山、考古、房地產等各行各業(yè),都離不開測繪,而在產業(yè)數(shù)字化大趨勢下,如何獲取精準的三維空間數(shù)據(jù),將這些現(xiàn)實場景精準地映射到數(shù)字世界中,就成了一個關鍵問題。
在過去很長一段時間里,活躍在測繪市場中的設備大都來自歐美老牌企業(yè),這些設備主要通過復雜的定點掃描方式來獲取三維空間數(shù)據(jù)。
2021年,香港大學MaRS Lab實驗室對外開源了一個名為FAST-LIO的基于激光雷達+視覺快速實現(xiàn)三維建圖的項目,“在此之前,業(yè)界也有一些基于激光雷達實現(xiàn)三維建圖的開源項目,但由于沒有很好的實時性,這些項目無法用在機器人系統(tǒng),尤其是無人機系統(tǒng)中,”秦佑銘告訴科技行者。
更為重要的是,MaRS Lab這一開源項目,還將三維建圖的魯棒性做到了業(yè)界真正可用的程度。
2021年由此成了測繪行業(yè)一個轉折點,在這一年后,國內涌現(xiàn)出一批手持式三維掃描建圖設備集成商。
也是在這一年,還在香港大學MaRS Lab讀博的秦佑銘有了自己的創(chuàng)業(yè)想法。
01 初識機器人
對于理工科學生而言,能夠在大學期間打幾場像樣的比賽,是一種比從書本上學習知識更重要的經(jīng)歷,這其中尤以機器人大賽最受歡迎,也最為性感。
深知大賽重要性的大疆,早在2013年就籌辦了一個以“基于機器視覺的自主移動打靶”為主題的大學生夏令營,這一夏令營在2015年發(fā)展成為RoboMaster機器人大賽,這一大賽后來走向全球,成了在全球大學生中頗具影響力的機器人比賽。
秦佑銘原本是在美國讀大學,當時是在弗吉尼亞理工大學攻讀電子工程專業(yè),2016年,秦佑銘拿到了到大疆實習的名額,當時他所在的實習部門正是大疆內部支撐RoboMaster大賽的部門。
由于秦佑銘閑暇時也喜歡打MOBA游戲,而RoboMaster大賽本質上是機器人版的MOBA游戲,因此,他很快就喜歡上了這一比賽。
于是,當回到弗吉尼亞理工大學后,他在校內組建了一個機器人俱樂部——RoboGrinder,為的正是組隊打RoboMaster大賽。
2017年,作為隊長的秦佑銘第一次帶隊參加RoboMaster大賽,并一直打到了決賽。
據(jù)秦佑銘回憶,“2017年全北美一共只有兩支隊伍打入了決賽,一個是華盛頓大學的隊伍,另一個就是我們。”
為打RoboMaster大賽籌建的RoboGrinder俱樂部是一個復雜的組織。
在這個俱樂部中,所有成員被分為機械設計、電子設計、計算機視覺、機器人操作幾個小組,這幾個小組中,尤以與智能感知高度相關的計算機視覺小組最為重要,它在整個團隊中扮演的是研發(fā)機器人大腦的角色。
在比賽中,機器人時刻需要識別目標、進行軌跡規(guī)劃,乃至全自動打擊目標,因而計算機視覺小組最重要的工作就是構建這樣一套系統(tǒng),這套系統(tǒng)在內部被親切地稱為“物理外掛”。
至于“物理外掛”究竟有多重要,讓秦佑銘記憶猶新的是,在一場RoboMaster比賽中,當時哈工大團隊地面上所有機器人都已經(jīng)被摧毀,眼看就要全軍覆沒時,他們通過僅存的一架裝備自動瞄準系統(tǒng)的無人機,一舉將對方滿血基地打爆。
這樣完全通過人工智能算法實現(xiàn)的逆風翻盤,讓秦佑銘更加篤定了視覺智能的重要性,后來進入香港大學讀博,秦佑銘進入的MaRS Lab實驗室后,研究的正是機器人、尤其是無人機系統(tǒng)。
“有沒有感知和決策系統(tǒng),是區(qū)分一款機器人到底是玩具,還是真正的機器人的重要因素,”秦佑銘告訴科技行者,“現(xiàn)在街頭幾十塊錢買的玩具飛機,也可以通過遙控飛起來,但這并不是機器人,真正的機器人是需要具備環(huán)境感知和自主決策能力的。”
進入香港大學MaRS Lab實驗室后,秦佑銘繼續(xù)在機器人領域深造,當時他的研究方向也更聚焦到了機器人領域尤為關鍵的一個問題——激光雷達建圖上。
也是在這里,秦佑銘遇到了后來和他一起創(chuàng)業(yè)的伙伴。
02 三維建圖新需求
在香港大學讀博期間,秦佑銘一邊和導師做研究,一邊將這些研究成果寫成論文投到了各大期刊,其中有兩篇在業(yè)界引起了很大的反響。
一篇是發(fā)表在全球機器人頂刊《Science Robotics》上的《A self-rotating, single-actuated UAV with extended sensor field of view for autonomous navigation》。
在這篇論文中,秦佑銘介紹了一種搭載了一套SLAM算法、單電機驅動的無人機,這個最簡配置的無人機在諸如礦洞等場景可以自動導航、自主探索。
另一篇則是前文提到的FAST-LIO,也是秦佑銘與后來的創(chuàng)業(yè)伙伴徐威共同合作的一篇論文,這篇論文介紹的是一種基于激光雷達+視覺+IMU多傳感器深度融合的感知系統(tǒng)。
當時這些文章一經(jīng)發(fā)表,在業(yè)界得到了不小的關注,甚至有一些考古、煤礦、房地產領域的團隊循跡找來尋求合作。
“在這些研究成果中,最重要的是背后的三維建圖算法,實際上,當時找到我們的很多團隊,他們內部也都有類似的方案,但他們之前大都是通過定點測量方式進行三維建圖,建圖空間稍微大一些,操作起來就非常麻煩。”秦佑銘告訴科技行者。
更重要的是,無論是人工測量、還是用無人機測量,在實時性和魯棒性上都面臨著很大的挑戰(zhàn)。
例如在礦山場景中,國內現(xiàn)在在大力推進智慧礦山建設,要推進智慧礦山建設、推進礦山安全,以及管理的透明化和信息化,首先就需要采集三維數(shù)據(jù)、為這些礦山建立數(shù)字檔案。
然而,礦山的礦洞通常是一個狹長的隧道,隧道中不僅光線弱、沒有明確的參照物,甚至都沒有GPS,這些礦洞亟需的,正是一套好用的三維建圖方案。
借著這樣的技術成果,秦佑銘的團隊參與到了一些智慧礦山項目中,在參與到產業(yè)中這些實際項目后,秦佑銘深刻感受到,在如今數(shù)字化大潮下,諸如礦山、考古、房地產等行業(yè)對于三維建圖的需求正在不斷涌現(xiàn)。
2021年,在香港大學支持下,秦佑銘和徐威以機器人感知技術為切入點、圍繞三維建圖技術組建了流形科技的核心團隊。
03 Hilti SLAM挑戰(zhàn)賽,贏麻了
2021年創(chuàng)立流形科技時,秦佑銘和徐威還沒有從香港大學畢業(yè),但當時他們和導師在機器人感知領域的技術研究和積累,已經(jīng)在整個測繪領域有了不小的影響。
尤其是在2021年開源的FAST-LIO項目,對國內,乃至全球測繪行業(yè)產生了深遠影響。
這其中,值得一提的是一個叫作Hilti的大賽。
作為全球頂級的建筑工具公司,Hilti與蘇黎世理工大學聯(lián)合舉辦的The HILTI SLAM Challenge大賽一直都是測繪領域最具影響力的三維建圖挑戰(zhàn)賽。
以SLAM算法為核心的技術團隊,能在Hilti數(shù)據(jù)集上跑出怎樣的成績、在HILTI SLAM挑戰(zhàn)賽上拿到怎樣的名次,是工作成果最好的證明。
2021年的HILTI SLAM挑戰(zhàn)賽是在9月份舉行,最終參賽隊伍包括來自全球的20支知名企業(yè)和高校的參賽隊伍,這其中既有來自博世的團隊,也有來自牛津大學、新加坡南洋理工大學的參賽隊伍。
然而,這一年的桂冠卻被一家來自中國的團隊摘得,這個團隊就是中國AI獨角獸企業(yè)曠視,而曠視取勝的秘訣之一,就是基于當時已經(jīng)開源的FAST-LIO設計的SLAM算法。
第二年,這一挑戰(zhàn)賽的冠軍同樣是來自中國的一個團隊,這次的冠軍團隊正是秦佑銘博士和徐威博士所在的團隊。
連續(xù)兩年摘得全球頂級SLAM挑戰(zhàn)賽的桂冠,證實了這一框架的價值,也再次為秦佑銘指明了創(chuàng)業(yè)方向,2022年年底,博士畢業(yè)的秦佑銘和徐威開始專心研發(fā)他們第一款測繪設備。
半年后,一款名為留形機的三維建圖手持設備面市。
一款真正的商用產品,往往要經(jīng)歷兩個階段:技術研發(fā)階段和工程優(yōu)化階段。
流形科技的留形機大部分技術上的問題,秦佑銘和徐威的團隊在博士做學術研究期間就已經(jīng)想明白,也就是FAST-LIO中解決的問題。
后來國內也有團隊基于這套框架設計出了三維建圖的手持設備,不過,秦佑銘告訴科技行者,“我們看到過一些基于FAST-LIO開源框架設計的手持設備,這些設備在實際使用時,機身偏移角度很小,使用者要需要小心翼翼地將設備握在手中,經(jīng)過大門時還要側著身子過去,這些問題就是需要進一步解決的工程優(yōu)化問題。”
流形科技在產品研發(fā)階段,就在與全球知名建筑顧問公司合作,一邊接觸實際項目的工程需求,一邊打磨產品。
例如,2022年,流形科技已經(jīng)將內測版本的留形機用到了香港歷史博物館更新升級中。
香港歷史博物館總面積18500平方米,常設展廳占地7000平方米,內部不僅有多個樓層,而且包含了不同歷史時期的建筑風格和文物展品。
在博物館更新升級過程中,施工方需要館體進行全方位掃描,這樣的多層次、多風格、大面積的空間,讓掃描建圖面臨著極大的挑戰(zhàn)。
最終,流形科技的留形機在這一項目中不僅實現(xiàn)了厘米級精度的三維建圖,而且在20分鐘左右就把復雜的建筑架構轉化成了電腦識別的三維模型。
更重要的是,流形科技的這一手持設備在實際項目中不斷進行工程優(yōu)化后,自今年6月份發(fā)布以來,經(jīng)過固件更新已經(jīng)迭代了26個版本。
如今的留形機擁有很高的魯棒性,可以在任意場景、任意角度下使用,解決了市面上手持設備使用不便的問題。
04 算力涌現(xiàn),測繪下沉
在2021年創(chuàng)業(yè)進入三維建圖領域的秦佑銘是幸運的。
這一年除了像FAST-LIO這樣影響測繪行業(yè)的開源項目越來越多外,三維建圖亟需的算力也有了不小的提升。
2021年11月,在NVIDIA GTC 2021上,NVIDIA正式對外發(fā)布了Jetson AGX Orin。
Jetson AGX Orin基于NVIDIA Ampere架構,相較于上一代產品,性能提升了6倍,每秒可進行 200 萬億次運算,更重要的是,這代AI超算可以很好地支撐機器人、醫(yī)療器械等設備所需要的邊緣算力。
在人工智能計算研究,無論是在學術上,還是在企業(yè)內,都離不開顯卡,秦佑銘早在弗吉尼亞理工大學帶團隊打RoboMaster比賽時,就開始接觸NVIDIA的產品,當時用到的是NVIDIA Jetson TX2。
“特別是像我們做機器人,需要較高的實時算力,一定離不開顯卡和邊緣計算的加持,”秦佑銘告訴科技行者,即便是創(chuàng)業(yè)后,他和團隊研發(fā)的留形機第一款樣機,同樣用到了NVIDIA的GPU。
也是基于這樣的淵源,秦佑銘在創(chuàng)業(yè)時就一直在關注NVIDIA專為加速創(chuàng)業(yè)公司發(fā)展的NVIDIA初創(chuàng)加速計劃 (NVIDIA Inception),最終,秦佑銘和他的團隊不僅在2023年加入了NVIDIA初創(chuàng)加速計劃,還參加了2023 NVIDIA初創(chuàng)企業(yè)展示,并獲得了“榮耀企業(yè)”稱號。
而談及加入NVIDIA初創(chuàng)加速計劃為流形科技帶來的幫助,秦佑銘總結了三個方面:
第一,NVIDIA Inception有一個非?;钴S的社群,在這個社群中,你有任何問題都可以很容易在社群中找到技術參考和支持,這能夠幫助我們產品快速迭代,讓我們少走了不少彎路;
第二,NVIDIA Inception給了我們很多與上下游聯(lián)動的機會,在NVIDIA 初創(chuàng)加速計劃的生態(tài)中,有很多是做邊緣計算的上下游公司,有些本身就是我們的客戶,在商業(yè)方面給了我們很大的幫助;
第三,采購物資方面,NVIDIA官方也會給我們一些支持,這對早期現(xiàn)金流壓力比較大的初創(chuàng)公司也有不小的幫助。
具體到與流形科技產品協(xié)同過程中,由于是基于NVIDIA GPU研發(fā)的產品,流形科技的留形機可以原生輸出USD格式的三維圖像,并能夠與NVIDIA Omniverse生態(tài)系統(tǒng)完美兼容。
也正是在NVIDIA GPU硬件加速下,如今流形科技研發(fā)的留形機已經(jīng)實現(xiàn)了亞厘米級實時真彩點云三維重建。
就在這樣的創(chuàng)業(yè)環(huán)境中,對于流形科技的未來,秦佑銘也有了新的打算。
秦佑銘告訴科技行者,“現(xiàn)在我們新一代產品已經(jīng)實現(xiàn)模塊化設計,可以放在無人機上,也可以放在機器狗上,通過模塊化設計和諸如此類的硬件設備,我們的產品可以進一步深入到更多商用場景中。”
談到更遠的未來,秦佑銘認為,2024年蘋果Vision Pro的發(fā)售將會帶動整個AR/VR產業(yè),未來消費市場對于三維建圖將會有很大的需求,流形科技計劃在2025年初進入消費市場,做一臺用于三維世界的“3D單反”。
而這,也是秦佑銘為他們研發(fā)的產品起名為留形機一個更深遠的意義。
好文章,需要你的鼓勵
浙江大學團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調整內部專家配置。該方法在數(shù)學、編程等任務上顯著提升推理準確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓練策略,成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示,該方法在數(shù)學競賽題上將模型準確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓練提供了新思路。
南洋理工大學與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術,實現(xiàn)AI視頻實時流式生成的重大突破。該技術通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質量視頻,延遲僅0.76秒,質量漂移指標從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內容創(chuàng)作開辟新可能。
華中科技大學研究團隊發(fā)現(xiàn),通過讓AI模型學習解決幾何問題,能夠顯著提升其空間理解能力。他們構建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學習方法訓練多個AI模型。實驗結果顯示,幾何訓練在四個空間智能測試基準上都帶來顯著提升,其中最佳模型達到49.6%準確率,超越此前最好成績。這項研究揭示了基礎幾何知識對培養(yǎng)AI空間智能的重要價值。
關注智造、硬件、機器人。