理論上,你只需要看一眼手機,啟用了FaceID功能的iPhone X就會在一秒鐘內(nèi)識別出你的臉部特征,并自行解鎖,同時,這一技術(shù)也將被用于Apple Pay支付和第三方應(yīng)用等場景中。
有吐槽說,這一功能可能讓iPhone失去一批男性用戶(尤其是已婚男士),反之,這也有可能讓一批男性“被迫”提前用上iPhone X。
蘋果公司在iPhone X中使用了“TrueDepth攝像機系統(tǒng)”(也就是“齊劉海”部分),通過使用里面的傳感器和點陣投影儀,投射出3萬多個點,就能形成一張完整的3D“臉譜”用來識別用戶臉部。據(jù)悉, iPhone X將采用定制的芯片來處理人工智能工作負(fù)載,這是一個雙核的“ A11生物神經(jīng)網(wǎng)絡(luò)引擎”芯片,每秒運算次數(shù)最高可達6000億次,該芯片賦能的最重要的事情就是使Face ID身份認(rèn)證功能能夠快速識別人臉。而為保證用戶的隱私,讓用戶更放心,蘋果稱所有相關(guān)的數(shù)據(jù)運算都將發(fā)生在本地,不會被上傳到云端或是回傳到蘋果公司。
同時,經(jīng)過不斷被訓(xùn)練的神經(jīng)網(wǎng)絡(luò)建模識別人臉,當(dāng)你的iPhone X識別你的臉部次數(shù)越多,它就會對你越熟悉。不管你是換發(fā)型、留胡子、戴帽子、戴眼鏡,還是光線強弱不同,它都會認(rèn)出你。
同為生物識別技術(shù),TouchID的解鎖錯誤率是五萬分之一,而FaceID則是一百萬分之一,成功率極高(雖然蘋果高級副總裁Craig Federighi在發(fā)布會上嘗試使用FaceID功能解鎖手機卻失?。?。對此,大家也不必過度“恐慌”。庫克在發(fā)布會上表示,FaceID要求使用者在刷臉解鎖時必須“集中注意力”(require“user attention”),所以,當(dāng)手機遠(yuǎn)離眼睛,或者用戶閉著眼睛時就不會解鎖,你根本不用擔(dān)心在自己睡覺時手機被解鎖(除非你像張飛一樣睜著眼睛睡覺)。
事實上,近幾年來以來,業(yè)界對于臉部識別的應(yīng)用“屢試不爽”,但一直因為安全問題被詬病。比如只需要通過一張電腦所有者的照片,就可以輕松進入設(shè)置了臉部識別登錄方式的電腦;再比如流行科學(xué)作家丹·莫倫(Dan Moren)通過一個視頻就擊敗了阿里巴巴的面部識別系統(tǒng)。
然而,一直以“安全”標(biāo)榜自己的蘋果,定然也不會允許這樣一個“萬眾矚目”的新功能讓自己的“人設(shè)”輕易垮掉。在這周小米的新品發(fā)布會上,小米也推出了人臉識別解鎖方面的方案,雖然都是“人臉識別”,但具體技術(shù)卻有很大的差距。
蘋果的FaceID,采用的是結(jié)構(gòu)光雙攝方案,通過將3萬多個光點的網(wǎng)絡(luò)投射到人臉上,并隨著用戶轉(zhuǎn)動頭部以映射臉部3D形狀,最終形成的是一個三維圖像,這也是目前安全性最高的人臉識別方案。而小米Note更多還是二維人臉解鎖的方案。
當(dāng)然,即使是三維面部識別系統(tǒng)也并不是“萬無一失”。就在兩年前,柏林的SR實驗室使用石膏模具,破解了微軟的Hello面部識別系統(tǒng)。這一嘗試在多個使用相同類型紅外深度感應(yīng)攝像機的品牌筆記本中都成功了。SR 實驗室的創(chuàng)始人Karsten Nohl指出,他們使用的模具不僅模仿了用戶的臉部形狀,還模仿了皮膚的光反射性能。
為了證明自己,蘋果甚至與好萊塢模型團隊進行了人臉模型對比驗證,以保證FaceID所識別的人臉不能被包括蠟像、模具等在內(nèi)的任何仿制品所替代。在發(fā)布會現(xiàn)場,F(xiàn)ederighi展示了一些非常逼真的面具制品,并表示經(jīng)過測試,即使是這些面具再逼真也無法破解FaceID系統(tǒng)。他說,從理論上來說,也許這個世界上有人能夠跟你長的非常相似,他可以破解你的手機系統(tǒng),但是這種概率大概是一百萬分之一。當(dāng)然,如果是雙胞胎,這個概率就會大大提高。
其實,關(guān)于人臉識別的安全性問題很多人心里依然沒底,也許只有經(jīng)過公開測試才能真正打破用戶的疑慮。 但即便如此,目前,已經(jīng)有很多金融機構(gòu)開始采用人臉識別幫助用戶進行開戶、轉(zhuǎn)賬、付款,包括支付寶、券商、銀行等等。以招商銀行為例,目前人臉識別已經(jīng)能夠?qū)崿F(xiàn)手機端超過 50 萬的轉(zhuǎn)賬;對于標(biāo)準(zhǔn)化的個人業(yè)務(wù),配置了人臉識別系統(tǒng)的智能柜臺也已經(jīng)在招行的線下網(wǎng)點投入使用(人臉識別時,系統(tǒng)會要求用戶做出對應(yīng)動作,如點頭或者眨眼)。
總之,安全與體驗也許永遠(yuǎn)沒法兩全。但,這并不意味著這道題無解,如果你的手機數(shù)據(jù)確實非常敏感,你完全可以選擇關(guān)閉FaceID識別功能,或者,你也可以選擇允許FaceID進行解鎖,但不用于付款(此解同樣適用于篇頭的“恐慌人群”)。
當(dāng)然,還有網(wǎng)友對于卸了妝還能不能解鎖表示擔(dān)憂,對此,我想說的是——卸了妝能不能解鎖,你心里沒點數(shù)嗎?其實,我自己比較擔(dān)心的是,如果我只是想用手機屏幕照個鏡子怎么辦?
話說回來,事實上,蘋果在人臉識別技術(shù)方面的布局已經(jīng)不是一年兩年,最近幾年來先后收購了 PolarRose、PrimeSense、Perceptio、Faceshift、Emotient、Turi 等人臉識別相關(guān)技術(shù)公司。其中,2013 年收購的 3D 傳感技術(shù)公司 PrimeSense,曾經(jīng)還因為給微軟的 Kinect 提供了傳感器而走紅。通過傳感器和中間件,可以讓設(shè)備感知周邊的三維環(huán)境,實現(xiàn)人機交互。這也是此次FaceID所涉及的關(guān)鍵技術(shù)之一。
除此之外,在去年年底,蘋果還發(fā)布了第一份關(guān)于人工智能的學(xué)術(shù)論文《Learning from Simulated and Unsupervised Images through Adversarial Training》。這篇論文闡述了如何通過計算機生成圖像而非真實圖像來訓(xùn)練算法的圖像識別能力。
蘋果在論文中稱,在機器學(xué)習(xí)研究中,使用合成圖像(例如來自一款視頻游戲)來訓(xùn)練神經(jīng)網(wǎng)絡(luò)要比使用真實圖像更有效。因為合成圖像數(shù)據(jù)已經(jīng)被標(biāo)記和注釋,而真實的圖像數(shù)據(jù)需要有人耗費巨大的精力去標(biāo)記計算機看到的每件事物,如一棵樹、一條狗或一輛自行車。
當(dāng)然,使用合成圖像也存在一定的弊端,導(dǎo)致一種算法所了解的內(nèi)容與真實世界中的場景有所不同。比如,合成圖像數(shù)據(jù)如果不夠真實,就會導(dǎo)致神經(jīng)網(wǎng)絡(luò)只能了解到合成圖像中所呈現(xiàn)的細(xì)節(jié),而對真實圖像的認(rèn)識有所不足。
為解決該問題,提高合成圖像數(shù)據(jù)的訓(xùn)練效果,蘋果研究人員推出了“模擬+無監(jiān)督”的學(xué)習(xí)方法,以提高模擬圖像的真實感。蘋果研究人員使用一種經(jīng)過修改的新型機器學(xué)習(xí)技術(shù),被稱為“生成對抗網(wǎng)絡(luò)”(GAN),讓兩個神經(jīng)網(wǎng)絡(luò)彼此對抗,從而生成更逼真的圖像。
大膽地推想,蘋果應(yīng)該把這樣一套方法論應(yīng)用在了iPhone X 的 FaceID功能中。
關(guān)于人臉識別技術(shù)
人臉識別技術(shù)是指利用分析比較的計算機技術(shù)識別人臉,其中包括人臉追蹤偵測,自動調(diào)整影像放大,夜間紅外偵測,自動調(diào)整曝光強度等技術(shù)。廣義的人臉識別包括構(gòu)建人臉識別系統(tǒng)的一系列相關(guān)技術(shù),包括人臉圖像采集、人臉定位、人臉識別預(yù)處理、身份確認(rèn)以及身份查找等;而狹義的人臉識別特指通過人臉進行身份確認(rèn)或者身份查找的技術(shù)或系統(tǒng)。
技術(shù)流程:
關(guān)鍵技術(shù)
基本方法:
算法分類:
好文章,需要你的鼓勵
新加坡國立大學(xué)研究團隊開發(fā)了SPIRAL框架,通過讓AI與自己對弈零和游戲來提升推理能力。實驗顯示,僅訓(xùn)練AI玩簡單撲克游戲就能讓其數(shù)學(xué)推理能力提升8.6%,通用推理提升8.4%,且無需任何數(shù)學(xué)題目作為訓(xùn)練材料。研究發(fā)現(xiàn)游戲中的三種推理模式能成功轉(zhuǎn)移到數(shù)學(xué)解題中,為AI訓(xùn)練提供了新思路。
同濟大學(xué)團隊開發(fā)的GIGA-ToF技術(shù)通過融合多幀圖像的"圖結(jié)構(gòu)"信息,創(chuàng)新性地解決了3D相機噪聲問題。該技術(shù)利用圖像間的不變幾何關(guān)系,結(jié)合深度學(xué)習(xí)和數(shù)學(xué)優(yōu)化方法,在合成數(shù)據(jù)集上實現(xiàn)37.9%的精度提升,并在真實設(shè)備上展現(xiàn)出色泛化能力,為機器人、AR和自動駕駛等領(lǐng)域提供更可靠的3D視覺解決方案。
伊利諾伊大學(xué)研究團隊通過對比實驗發(fā)現(xiàn),經(jīng)過強化學(xué)習(xí)訓(xùn)練的視覺語言模型雖然表現(xiàn)出"頓悟時刻"現(xiàn)象,但這些自我糾錯行為并不能實際提升推理準(zhǔn)確率。研究揭示了AI模型存在"生成-驗證差距",即生成答案的能力強于驗證答案質(zhì)量的能力,且模型在自我驗證時無法有效利用視覺信息,為AI多模態(tài)推理發(fā)展提供了重要啟示。
MIT等頂尖機構(gòu)聯(lián)合提出SparseLoRA技術(shù),通過動態(tài)稀疏性實現(xiàn)大語言模型訓(xùn)練加速1.6倍,計算成本降低2.2倍。該方法使用SVD稀疏性估計器智能選擇重要計算部分,在保持模型性能的同時顯著提升訓(xùn)練效率,已在多個任務(wù)上驗證有效性。