【導讀】iPhone X的全面屏設計,蘋果在該手機上取消了實體Home鍵,并且用Face ID人臉識別取代了以往Touch ID指紋識別。據(jù)稱此方法比 TouchID 更安全,誤差率低至 1:1,000,000。
什么是Face ID?
蘋果公司在iPhone X中使用了“TrueDepth攝像機系統(tǒng)”(也就是“齊劉海”部分),通過使用里面的傳感器和點陣投影儀,投射出3萬多個點,就能形成一張完整的3D“臉譜”用來識別用戶臉部。據(jù)悉, iPhone X采用定制的芯片來處理人工智能工作負載,這是一個雙核的“ A11生物神經網(wǎng)絡引擎”芯片,每秒運算次數(shù)最高可達6000億次,該芯片賦能的最重要的事情就是使Face ID身份認證功能能夠快速識別人臉。同時,經過不斷被訓練的神經網(wǎng)絡建模識別人臉,當你的iPhone X識別你的臉部次數(shù)越多,它就會對你越熟悉。不管你是換發(fā)型、留胡子、戴帽子、戴眼鏡,還是光線強弱不同,它都會認出你。
同為生物識別技術,TouchID的解鎖錯誤率是五萬分之一,而FaceID則是一百萬分之一,
iPhoneX人臉識別功能主要靠劉海部位的原深感攝像頭實現(xiàn),主要包括距離感應器、泛光感應元件、點陣投影儀和紅外鏡頭。雖然iPhone X實際進行人臉識別的過程非常復雜,不過可以簡化成以下幾個步驟:
1、檢測物體靠近:當各位拿起手機時,首先工作的是距離感應器,它將會告訴iPhone X是否有物體進行靠近;
2、檢測用戶臉部:泛光感應元件采用垂直腔面發(fā)射激光器(VCSEL),POPPUR只要大家知道它會發(fā)射低功率紅外光就可以了。在距離感應器檢測到物體后,泛光感應元件就會對前方物體進行掃描,由紅外鏡頭接收信息,并傳給A11芯片神經網(wǎng)絡系統(tǒng)進行判斷,識別為臉部后再進行下一步操作。
3、獲取3D人臉信息:雖然檢測到是人臉,但是泛光感應元件發(fā)出的只是簡單紅外光,并不能記錄空間信息,這時候點陣投影器發(fā)射的高功率紅外結構光就派上用場了。結構光一般指呈條紋狀或者點陣狀的特殊光線,這種光線在打到凹凸不平的物體表面時會造成圖像扭曲,從而獲得物體的空間深度信息。
4、結構光接收:用于人臉識別的光線對精度要求比較高,不僅點陣投影儀發(fā)射的點要足夠多(三萬多個),同時還要防止環(huán)境光干擾,因此紅外鏡頭上還搭載濾光片,除了特定頻率的紅外光都會被剔除掉(為了保證感應能力和避免太陽光的干擾,一般選擇800~900nm波長附近的近紅外光)。
5、收集完結構光等信息后,手機通過3D圖像處理芯片可以生成具備空間信息的三維圖像。這些信息將會經過特殊調制,以數(shù)據(jù)形式與保存在處理器的Secure Enclave的Face ID編碼(注冊Face ID時錄入的信息,無法被提取到手機外或者被傳到云端)進行配對,匹配度滿足蘋果設置的要求后手機就能實現(xiàn)解鎖。
事實上,近幾年來以來,業(yè)界對于臉部識別的應用“屢試不爽”,但一直因為安全問題被詬病。比如只需要通過一張電腦所有者的照片,就可以輕松進入設置了臉部識別登錄方式的電腦;再比如流行科學作家丹·莫倫(Dan Moren)通過一個視頻就擊敗了阿里巴巴的面部識別系統(tǒng)。
蘋果的FaceID,采用的是結構光雙攝方案,通過將3萬多個光點的網(wǎng)絡投射到人臉上,并隨著用戶轉動頭部以映射臉部3D形狀,最終形成的是一個三維圖像,這也是目前安全性最高的人臉識別方案。而其它技術更多還是二維人臉解鎖的方案。
Face ID安全嗎?
蘋果iPhone X的面部識別功能中包含“注意力檢測”功能,這個功能可以確認你是在清醒的狀態(tài)下使用手機。因此當你睡覺時,有人試圖解鎖你手機的行為將會失敗。
“注意力檢測”原理為人眼視線檢測,檢測用戶視線方向,判斷用戶的注視區(qū)域,系眼球追蹤技術的一部分。這部分功能同樣是由“齊劉海”硬件實現(xiàn)(蘋果收購的眼動追蹤企業(yè)SMI為技術提供方),利用紅外鏡頭和泛光感應元件,實現(xiàn)人眼瞳孔的特征定位,在通過AI芯片A11的深度學習估算人眼視線方向。
在操作應用上其中涉及的公開專利原理摘要為,一種方法包括接收計算機化系統(tǒng)的用戶的身體至少一部分的三維(3D)映射序列,并從3D映射中提取用戶頭部的3D坐標 ?;陬^部的3D坐標,識別由用戶執(zhí)行的注視方向以及在耦合到計算機化系統(tǒng)的顯示器上,在注視方向上呈現(xiàn)的交互項目。從3D映射中提取指示;指示用戶正在特定方向上移動身體的肢體,并且響應于該指示,將所識別的交互項目重新定位在顯示器上。
這項于2016年12月份公開的專利,即是注意力檢查的原理,將上圖的PC機及攝像設備想象縮小到手機端,用戶只有在眼睛注意力集中在一個圓圈中,同時它會要求用戶將頭部放在同一個圓圈中。這一步驟同時完成人臉圖像掃描,以及注視點映射。
當今視線檢測技術的精度可以達到1°以下,一些多年從事眼動分析的技術公司可以做到0.4°的高精度。按照1°的偏差精度來計算,當用戶注視iPhone X手機屏幕圓圈時,視線偏差距離不超過5mm。因此,通過“注意力檢測”技術,當人眼的關注視線落在手機屏幕上時,F(xiàn)ace ID認為此時用戶傳達了交互的目的,即進行解鎖。而在用戶視線偏離手機屏幕時,“注意力檢測”結果將幫助Face ID不要誤解鎖手機。
Face ID會失效嗎?
Face ID為滿足不同時段不同環(huán)境對攝像頭的要求,如白天、黑夜、室內、室外。攝像頭會使用紅外光(泛光感應元件)照亮你的臉,使用紅外鏡頭捕捉圖像。以下是人臉識別的具體步驟:
1、首先,把IR圖像從相機發(fā)送到iPhone X的神經引擎里,以構建用戶的人臉3D模型
2、將用戶的3D模型或“驗證圖像”在計算機算法中呈現(xiàn),并將其與用戶存儲的模板或“設置圖像”進行比較;
3、根據(jù)這兩個圖像之間的相似度得出對比數(shù)值,看驗證圖像和設置圖像是否匹配;
4、如果對比數(shù)值高于某個確定數(shù)值,iPhone X會通過你的身份驗證并解鎖。
因此,F(xiàn)ace ID是否會失效要看蘋果對于閾值的設定,如果設定較高的閾值,相應失效問題就會小很多。
2D人臉識別技術與3D人臉識別技術
對于刷臉消費、刷臉解鎖這些“黑科技”,人們其實一點都不陌生,但如果要深入其中,普通人也只能說出一個關鍵詞:人臉識別。而人臉識別技術實際上可以區(qū)分為2D和3D兩種。
1、2D人臉識別:2D人臉識別是目前最為常見的人臉識別技術之一,其工作原理是后期人臉識別系統(tǒng)對圖片中的人臉進識別,通過設定數(shù)百或數(shù)千個點,并記錄點與點之間的函數(shù),該函數(shù)即為此人的面部信息。
2、3D人臉識別: 3D人臉識別是采用3D結構光技術,通過3D結構光內的數(shù)萬個光線點對人臉進行掃描后,從而提供更為精確的面部信息,而這類面部信息并不會受到口紅、粉底等化妝品的影響。與2D人臉識別相比,3D人臉識別將提供更為精確的面部數(shù)據(jù),最終讓數(shù)據(jù)更加安全可靠。
“普通視覺傳感設備讓萬物看到世界,而3D傳感技術則讓萬物能像人一樣‘看清’世界。”
3D傳感技術原理
要談3D傳感技術,就必須先弄清楚光學測量分類以及其原理。
光學測量分為主動測距法和被動測距法。主動測距方法的基本思想是利用特定的、人為控制光源和聲源對物體目標進行照射,根據(jù)物體表面的反射特性及光學、聲學特性來獲取目標的三維信息。其特點是具有較高的測距精度、抗干擾能力和實時性,具有代表性的主動測距方法有結構光法、飛行時間法、和三角測距法。
主動測距法
結構光法
根據(jù)投影光束形態(tài)的不同,結構光法又可分為光點式結構光法、光條式結構光法和光面式結構光法等。
目前應用中較廣,且在深度測量中具有明顯優(yōu)勢的方法是面結構光測量法。面結構光測量將各種模式的面結構投影到被測物體上,例如將分布較密集的均勻光柵投影到被測物體上面,由于被測物體表面凹凸不平,具有不同的深度,所以表面反射回來的光柵條紋會隨著表面不同的深度發(fā)生畸變,這個過程可以看作是由物體表面的深度信息對光柵的條紋進行調制。所以被測物體的表面信息也就被調制在反射回來的光柵之中。通過被測物體反射回來的光柵與參考光柵之間的幾何關系,分析得到每一個被測點之間的高度差和深度信息。
結構光的優(yōu)點是計算簡單,測量精度較高,對于平坦的、無明顯紋理和形狀變化的表面區(qū)域都可進行精密的測量。其缺點是對設備和外界光線要求高,造價昂貴。目前,結構光法主要應用在條件良好的室內。
飛行時間法(ToF)
飛行時間(Time of Flight,簡稱ToF)法,又叫做激光雷達(LiDAR)測距法。它將脈沖激光信號投射到物體表面,反射信號沿幾乎相同路徑反向傳至接收器,利用發(fā)射和接收脈沖激光信號的時間差可實現(xiàn)被測量表面每個像素的距離測量。
ToF直接利用光傳播特性,不需要進行灰度圖像的獲取與分析,因此距離的獲取不受物體表面性質的影響,可快速準確地獲取景物表面完整的三維信息。缺點則是需要較復雜的光電設備,價格偏貴。
三角測距法
三角測距法又稱主動三角法,是基于光學三角原理,根據(jù)光源、物體和檢測器三者之間的幾何成像關系來確定空間物體各點的三維坐標。在實際測量過程中,它常用激光作為光源,用CCD相機作為檢測器。這種方式主要用于工業(yè)勘探、工件表面粗糙度檢測、輪胎檢測、飛機檢測等工業(yè)、航空、軍事領域,在消費電子類產品還不曾涉及。
被動測距法
被動測距技術不需要人為地設置輻射源,只利用場景在自然光照下的二維圖像來重建景物的三維信息,具有適應性強、實現(xiàn)手段靈活、造價低的優(yōu)點。但是這種方法是用低維信號來計算高維信號的,所以其使用的算法復雜。被動測距按照使用的視覺傳感器數(shù)量可分為單目視覺、雙目立體視覺和多目視覺三大類。
單目視覺
單目視覺是指僅利用一臺照相機拍攝一張相片來進行測量。因僅需要一臺相機,所以該方法的優(yōu)點是結構簡單、相機標定容易,同時還避免了立體視覺的小視場問題和匹配困難問題。
單目視覺方法又可分聚焦法和離焦法兩類。聚焦法是指首先使相機相對于被測點處于聚焦位置,然后根據(jù)透鏡成像公式求得被測點相對于相機的距離。相機偏離聚焦位置會帶來測量誤差,因此尋求精確的聚焦位置是關鍵所在。而離焦法不要求相機相對于被測點處于聚焦位置,而是根據(jù)標定出的離焦模型計算被測點相對于相機的距離,這樣就避免了由于尋求精確的聚焦位置而降低測量效率的問題,但離焦模型的準確標定是該方法的主要難點。
雙目立體視覺
雙目立體視覺的基本原理是從兩個視點觀察同一景物,以獲取在不同視角下的感知圖像,然后通過三角測量原理計算圖像像素間的位置偏差(視差)來獲取景物的三維信息。這一過程與人類視覺感知過程是類似的。
在雙目立體視覺系統(tǒng)的硬件結構中,通常采用兩個攝像機作為視覺信號的采集設備,通過雙輸入通道圖像采集卡與計算機連接,把攝像機采集到的模擬信號經過采樣、濾波、強化、模數(shù)轉換,最終向計算機提供圖像數(shù)據(jù)。一個完整的雙目立體視覺系統(tǒng)通常可分為數(shù)字圖像采集、相機標定、圖像預處理與特征提取、圖像校正、立體匹配、三維重建六大部分。
多目立體視覺
多目立體視覺系統(tǒng)是對雙目視覺系統(tǒng)的一種拓展。所謂多目立體視覺系統(tǒng),就是采用多個攝像機設置于多個視點,或者由一個攝像機從多個視點觀測三維景物的視覺系統(tǒng)。
對多目系統(tǒng)所采集到的景物圖像進行感知、識別和理解的技術被稱為多目立體視覺系統(tǒng)技術。在雙目立體視覺中,對于給定的物體距離,視差與基線長度成正比,基線越長,對距離的計算越精確。但是當基線過長時,需要在相對較大的視覺范圍內進行搜索,從而增加計算量。利用多基線立體匹配是消除誤匹配、提高視差測量準確性的有效方法之。基線數(shù)目的增加可以通過增加相機來實現(xiàn)。
光電3D影像技術
根據(jù)獲取圖像信息方法的不同,光電3D影像技術分為有源和無源兩種技術,無源技術主要是接受物體的輻射或者環(huán)境的發(fā)射,有源技術是通過投射一束調制的或未調制的光到物體上通過檢測物體反射的光來形成3D圖像。
以前大多數(shù)技術研究集中在無源3D技術上,利用三角測量原理,通過兩臺相距一定距離的照相機,左邊照相機產生的圖像表示深度信息,右邊照相機產生差異的二維圖像。關鍵是產生深度信息的照相機需要分離出深度信息。無源3D影像技術需要拍攝的物體具有突出的輪廓特點,比如邊緣、角、線等。其優(yōu)點是不需要特殊的硬件條件,并成功使用在好幾個方面。這種技術的缺點是需要兩臺或者更多的高質量的照相機、圖像處理軟件。圖像質量、拍照速度、數(shù)據(jù)傳輸?shù)榷际沁@種機制能否被廣泛應用的限制因素。
有源3D光電圖像方法是投射一束有規(guī)律的空間分布的線狀光到物體上從而產生一個網(wǎng)狀格的深度。廣泛使用的有源光方法是飛行時間(time off light)方法,最近幾年,市場上出現(xiàn)的3D照相機都是基于飛行時間方法,這些3D照相機主要應用于工業(yè)控制,通過飛行時間方法檢測相位來實現(xiàn)3D影像。一束幾十兆赫茲被調制的近紅外光照射到物體上,物體反射的光進入3D照相機,由于立體物體的遠近距離不同,反射光的相位存在一個延遲,通過檢測原始光束以及反射光束的相位延遲從而檢測出物體的景深,從而實現(xiàn)3D圖像。這種3D圖像傳感器的制作由ZMD公司完成,ZMD公司根據(jù)3D圖像傳感器需要高速的特點從噪聲和速度進行工藝優(yōu)化,響應速度可以到100MHz以上。
3D傳感技術的應用
其實,除了用于手機的人臉識別,3D傳感技術已經應用到了很多方面,在2018中國互聯(lián)網(wǎng)大會上,有國人廠家推出的智慧家庭新生態(tài)解決方案,賦予電視3D人臉識別、精準內容推薦、手勢交互等創(chuàng)新功能,顛覆智慧家庭客廳體驗。通過3D人臉識別技術,電視可在不獲取用戶隱私的前提下,精準識別出機頂盒前的觀眾的用戶畫像信息,包括性別、年齡、情緒等等。同時,系統(tǒng)根據(jù)登錄的用戶角色信息,通過綜合統(tǒng)計分析該用戶角色的行為數(shù)據(jù),可為用戶提供“千人千面”的個性化EPG界面,精準推薦電視節(jié)目、視頻點播、游戲應用等內容。
此外,3D傳感技術可以賦能各行各業(yè):首先是機器人廠商,尤其是服務性機器人的眼睛需要3D視覺技術,去感知周邊的環(huán)境,例如目標距離、障礙物等信息;其次是安防廠商,在傳統(tǒng)的安防攝像頭里面再加裝一個視覺傳感器,就可以獲得一個更加精準的三維立體信息;還有門禁門鎖,3D的刷臉識別相比2D的刷臉識別,安全等級和精準性可以提升一級;最后,就手機行業(yè)的發(fā)展趨勢來說,3D傳感技術未來的應用空間很大,刷臉等生物識別都離不開3D傳感技術,此外VR、AR、美顏也可以搭載3D傳感技術去做一些交互性、娛樂性的體驗。還有各種各樣的智能硬件,凡是需要采集物體深度信息的相關功能,都會用到3D傳感技術。
推薦閱讀: