理論上,你只需要看一眼手機,啟用了FaceID功能的iPhone X就會在一秒鐘內(nèi)識別出你的臉部特征,并自行解鎖,同時,這一技術也將被用于Apple Pay支付和第三方應用等場景中。
有吐槽說,這一功能可能讓iPhone失去一批男性用戶(尤其是已婚男士),反之,這也有可能讓一批男性“被迫”提前用上iPhone X。
蘋果公司在iPhone X中使用了“TrueDepth攝像機系統(tǒng)”(也就是“齊劉海”部分),通過使用里面的傳感器和點陣投影儀,投射出3萬多個點,就能形成一張完整的3D“臉譜”用來識別用戶臉部。據(jù)悉, iPhone X將采用定制的芯片來處理人工智能工作負載,這是一個雙核的“ A11生物神經(jīng)網(wǎng)絡引擎”芯片,每秒運算次數(shù)最高可達6000億次,該芯片賦能的最重要的事情就是使Face ID身份認證功能能夠快速識別人臉。而為保證用戶的隱私,讓用戶更放心,蘋果稱所有相關的數(shù)據(jù)運算都將發(fā)生在本地,不會被上傳到云端或是回傳到蘋果公司。
同時,經(jīng)過不斷被訓練的神經(jīng)網(wǎng)絡建模識別人臉,當你的iPhone X識別你的臉部次數(shù)越多,它就會對你越熟悉。不管你是換發(fā)型、留胡子、戴帽子、戴眼鏡,還是光線強弱不同,它都會認出你。
同為生物識別技術,TouchID的解鎖錯誤率是五萬分之一,而FaceID則是一百萬分之一,成功率極高(雖然蘋果高級副總裁Craig Federighi在發(fā)布會上嘗試使用FaceID功能解鎖手機卻失敗)。對此,大家也不必過度“恐慌”。庫克在發(fā)布會上表示,FaceID要求使用者在刷臉解鎖時必須“集中注意力”(require“user attention”),所以,當手機遠離眼睛,或者用戶閉著眼睛時就不會解鎖,你根本不用擔心在自己睡覺時手機被解鎖(除非你像張飛一樣睜著眼睛睡覺)。
事實上,近幾年來以來,業(yè)界對于臉部識別的應用“屢試不爽”,但一直因為安全問題被詬病。比如只需要通過一張電腦所有者的照片,就可以輕松進入設置了臉部識別登錄方式的電腦;再比如流行科學作家丹·莫倫(Dan Moren)通過一個視頻就擊敗了阿里巴巴的面部識別系統(tǒng)。
然而,一直以“安全”標榜自己的蘋果,定然也不會允許這樣一個“萬眾矚目”的新功能讓自己的“人設”輕易垮掉。在這周小米的新品發(fā)布會上,小米也推出了人臉識別解鎖方面的方案,雖然都是“人臉識別”,但具體技術卻有很大的差距。
蘋果的FaceID,采用的是結構光雙攝方案,通過將3萬多個光點的網(wǎng)絡投射到人臉上,并隨著用戶轉動頭部以映射臉部3D形狀,最終形成的是一個三維圖像,這也是目前安全性最高的人臉識別方案。而小米Note更多還是二維人臉解鎖的方案。
當然,即使是三維面部識別系統(tǒng)也并不是“萬無一失”。就在兩年前,柏林的SR實驗室使用石膏模具,破解了微軟的Hello面部識別系統(tǒng)。這一嘗試在多個使用相同類型紅外深度感應攝像機的品牌筆記本中都成功了。SR 實驗室的創(chuàng)始人Karsten Nohl指出,他們使用的模具不僅模仿了用戶的臉部形狀,還模仿了皮膚的光反射性能。
為了證明自己,蘋果甚至與好萊塢模型團隊進行了人臉模型對比驗證,以保證FaceID所識別的人臉不能被包括蠟像、模具等在內(nèi)的任何仿制品所替代。在發(fā)布會現(xiàn)場,F(xiàn)ederighi展示了一些非常逼真的面具制品,并表示經(jīng)過測試,即使是這些面具再逼真也無法破解FaceID系統(tǒng)。他說,從理論上來說,也許這個世界上有人能夠跟你長的非常相似,他可以破解你的手機系統(tǒng),但是這種概率大概是一百萬分之一。當然,如果是雙胞胎,這個概率就會大大提高。
其實,關于人臉識別的安全性問題很多人心里依然沒底,也許只有經(jīng)過公開測試才能真正打破用戶的疑慮。 但即便如此,目前,已經(jīng)有很多金融機構開始采用人臉識別幫助用戶進行開戶、轉賬、付款,包括支付寶、券商、銀行等等。以招商銀行為例,目前人臉識別已經(jīng)能夠?qū)崿F(xiàn)手機端超過 50 萬的轉賬;對于標準化的個人業(yè)務,配置了人臉識別系統(tǒng)的智能柜臺也已經(jīng)在招行的線下網(wǎng)點投入使用(人臉識別時,系統(tǒng)會要求用戶做出對應動作,如點頭或者眨眼)。
總之,安全與體驗也許永遠沒法兩全。但,這并不意味著這道題無解,如果你的手機數(shù)據(jù)確實非常敏感,你完全可以選擇關閉FaceID識別功能,或者,你也可以選擇允許FaceID進行解鎖,但不用于付款(此解同樣適用于篇頭的“恐慌人群”)。
當然,還有網(wǎng)友對于卸了妝還能不能解鎖表示擔憂,對此,我想說的是——卸了妝能不能解鎖,你心里沒點數(shù)嗎?其實,我自己比較擔心的是,如果我只是想用手機屏幕照個鏡子怎么辦?
話說回來,事實上,蘋果在人臉識別技術方面的布局已經(jīng)不是一年兩年,最近幾年來先后收購了 PolarRose、PrimeSense、Perceptio、Faceshift、Emotient、Turi 等人臉識別相關技術公司。其中,2013 年收購的 3D 傳感技術公司 PrimeSense,曾經(jīng)還因為給微軟的 Kinect 提供了傳感器而走紅。通過傳感器和中間件,可以讓設備感知周邊的三維環(huán)境,實現(xiàn)人機交互。這也是此次FaceID所涉及的關鍵技術之一。
除此之外,在去年年底,蘋果還發(fā)布了第一份關于人工智能的學術論文《Learning from Simulated and Unsupervised Images through Adversarial Training》。這篇論文闡述了如何通過計算機生成圖像而非真實圖像來訓練算法的圖像識別能力。
蘋果在論文中稱,在機器學習研究中,使用合成圖像(例如來自一款視頻游戲)來訓練神經(jīng)網(wǎng)絡要比使用真實圖像更有效。因為合成圖像數(shù)據(jù)已經(jīng)被標記和注釋,而真實的圖像數(shù)據(jù)需要有人耗費巨大的精力去標記計算機看到的每件事物,如一棵樹、一條狗或一輛自行車。
當然,使用合成圖像也存在一定的弊端,導致一種算法所了解的內(nèi)容與真實世界中的場景有所不同。比如,合成圖像數(shù)據(jù)如果不夠真實,就會導致神經(jīng)網(wǎng)絡只能了解到合成圖像中所呈現(xiàn)的細節(jié),而對真實圖像的認識有所不足。
為解決該問題,提高合成圖像數(shù)據(jù)的訓練效果,蘋果研究人員推出了“模擬+無監(jiān)督”的學習方法,以提高模擬圖像的真實感。蘋果研究人員使用一種經(jīng)過修改的新型機器學習技術,被稱為“生成對抗網(wǎng)絡”(GAN),讓兩個神經(jīng)網(wǎng)絡彼此對抗,從而生成更逼真的圖像。
大膽地推想,蘋果應該把這樣一套方法論應用在了iPhone X 的 FaceID功能中。
關于人臉識別技術
人臉識別技術是指利用分析比較的計算機技術識別人臉,其中包括人臉追蹤偵測,自動調(diào)整影像放大,夜間紅外偵測,自動調(diào)整曝光強度等技術。廣義的人臉識別包括構建人臉識別系統(tǒng)的一系列相關技術,包括人臉圖像采集、人臉定位、人臉識別預處理、身份確認以及身份查找等;而狹義的人臉識別特指通過人臉進行身份確認或者身份查找的技術或系統(tǒng)。
技術流程:
關鍵技術
基本方法:
算法分類:
好文章,需要你的鼓勵
浙江大學團隊提出動態(tài)專家搜索方法,讓AI能根據(jù)不同問題靈活調(diào)整內(nèi)部專家配置。該方法在數(shù)學、編程等任務上顯著提升推理準確率,且不增加計算成本。研究發(fā)現(xiàn)不同類型問題偏愛不同專家配置,為AI推理優(yōu)化開辟新路徑。
清華大學研究團隊提出SIRI方法,通過"壓縮-擴張"交替訓練策略,成功解決了大型推理模型"話多且準確率低"的問題。實驗顯示,該方法在數(shù)學競賽題上將模型準確率提升43.2%的同時,輸出長度減少46.9%,真正實現(xiàn)了效率與性能的雙重優(yōu)化,為AI模型訓練提供了新思路。
南洋理工大學與騰訊聯(lián)合研究團隊開發(fā)出Rolling Forcing技術,實現(xiàn)AI視頻實時流式生成的重大突破。該技術通過滾動窗口聯(lián)合去噪、注意力錨點機制和高效訓練算法三項創(chuàng)新,解決了長視頻生成中的錯誤累積問題,可在單GPU上以16fps速度生成多分鐘高質(zhì)量視頻,延遲僅0.76秒,質(zhì)量漂移指標從傳統(tǒng)方法的1.66降至0.01,為交互式媒體和內(nèi)容創(chuàng)作開辟新可能。
華中科技大學研究團隊發(fā)現(xiàn),通過讓AI模型學習解決幾何問題,能夠顯著提升其空間理解能力。他們構建了包含約30000個幾何題目的Euclid30K數(shù)據(jù)集,使用強化學習方法訓練多個AI模型。實驗結果顯示,幾何訓練在四個空間智能測試基準上都帶來顯著提升,其中最佳模型達到49.6%準確率,超越此前最好成績。這項研究揭示了基礎幾何知識對培養(yǎng)AI空間智能的重要價值。