人臉識別系統的幾個過程淺析

[導讀]人臉識別（FaceRecognition，FR）是一種基於人的臉部特徵信息進行身份識別的一種生物識別技術。

　　人臉識別（FaceRecognition，FR）是一種基於人的臉部特徵信息進行身份識別的一種生物識別技術。用攝像機或攝像頭採集含有人臉的圖像或視頻流，並自動在圖像中檢測和跟蹤人臉，進而對檢測到的人臉進行臉部識別的一系列相關技術，通常也叫做人像識別、面部識別。

　　人臉識別系統的幾個過程淺析

　　人臉識別系統的研究始於20世紀60年代，80年代后隨着計算機技術和光學成像技術的發展得到提高，而真正進入初級的應用階段則在90年後期；最近幾年隨着以深度學習為主的人工智能技術進步，人臉識別技術得到了迅猛的發展。“人臉識別系統”集成了人工智能、機器識別、機器學習、模型理論、專家系統、視頻圖像處理等多種專業技術，是綜合性比較強的系統工程技術。

圖源：圖蟲創意

　　人臉識別流程

　　人臉識別系統通常包括幾個過程：人臉圖像採集及檢測、關鍵點提取、人臉規整（圖像處理）、人臉特徵提取和人臉識別比對。

　　人臉圖像採集。不同的人臉圖像都能通過攝像鏡頭採集下來，比如靜態圖像、動態圖像、不同的位置、不同表情等方面都可以得到很好的採集。當用戶在採集設備的拍攝範圍內時，採集設備會自動搜索並拍攝用戶的人臉圖像。

　　人臉檢測。人臉檢測在實際中主要用於人臉識別的預處理，即在圖像中準確標定出人臉的位置和大小。

　　關鍵點提取（特徵提取）。人臉識別系統可使用的特徵通常分為視覺特徵、像素統計特徵、人臉圖像變換係數特徵、人臉圖像代數特徵等。人臉特徵提取就是針對人臉的某些特徵進行的。人臉特徵提取，也稱人臉表徵，它是對人臉進行特徵建模的過程。人臉特徵提取的方法歸納起來分為兩大類：一種是基於知識的表徵方法；另外一種是基於代數特徵或統計學習的表徵方法。

　　人臉規整（預處理）。對於人臉的圖像預處理是基於人臉檢測結果，對圖像進行處理並最終服務於特徵提取的過程。系統獲取的原始圖像由於受到各種條件的限制和隨機干擾，往往不能直接使用，必須在圖像處理的早期階段對它進行灰度校正、噪聲過濾等圖像預處理。對於人臉圖像而言，其預處理過程主要包括人臉圖像的光線補償、灰度變換、直方圖均衡化、歸一化、幾何校正、濾波以及銳化等。

　　人臉識別比對（匹配與識別）。提取的人臉圖像的特徵數據與數據庫中存儲的特徵模板進行搜索匹配，通過設定一個閾值，當相似度超過這一閾值，則把匹配得到的結果輸出。人臉識別就是將待識別的人臉特徵與已得到的人臉特徵模板進行比較，根據相似程度對人臉的身份信息進行判斷。可分為1:1、1:N、屬性識別。其中1:1是將2張人臉對應的特徵值向量進行比對，1:N是將1張人臉照片的特徵值向量和另外N張人臉對應的特徵值向量進行比對，輸出相似度最高或者相似度排名前X的人臉。

　　人臉特徵分析算法

　　人臉識別技術中被廣泛採用的區域特徵分析算法，它融合了計算機圖像處理技術與生物統計學原理於一體，利用計算機圖像處理技術從視頻中提取人像特徵點，利用生物統計學的原理進行分析建立數學模型，即人臉特徵模板。利用已建成的人臉特徵模板與被測者的人的面像進行特徵分析，根據分析的結果來給出一個相似值。通過這個值即可確定是否為同一人。

　　人臉識別的方法很多，主要的人臉識別方法有：

　　（1）幾何特徵的人臉識別方法：幾何特徵可以是眼、鼻、嘴等的形狀和它們之間的幾何關係（如相互之間的距離）。這些算法識別速度快，需要的內存小，但識別率較低。

　　（2）基於特徵臉（PCA）的人臉識別方法：特徵臉方法是基於KL變換的人臉識別方法，KL變換是圖像壓縮的一種最優正交變換。高維的圖像空間經過KL變換后得到一組新的正交基，保留其中重要的正交基，由這些基可以張成低維線性空間。如果假設人臉在這些低維線性空間的投影具有可分性，就可以將這些投影用作識別的特徵矢量，這就是特徵臉方法的基本思想。這些方法需要較多的訓練樣本，而且完全是基於圖像灰度的統計特性的。目前有一些改進型的特徵臉方法。

　　（3）神經網絡的人臉識別方法：神經網絡的輸入可以是降低分辨率的人臉圖像、局部區域的自相關函數、局部紋理的二階矩等。這類方法同樣需要較多的樣本進行訓練，而在許多應用中，樣本數量是很有限的。

　　（4）彈性圖匹配的人臉識別方法：彈性圖匹配法在二維的空間中定義了一種對於通常的人臉變形具有一定的不變性的距離，並採用屬性拓撲圖來代表人臉，拓撲圖的任一頂點均包含一特徵向量，用來記錄人臉在該頂點位置附近的信息。該方法結合了灰度特性和幾何因素，在比對時可以允許圖像存在彈性形變，在克服表情變化對識別的影響方面收到了較好的效果，同時對於單個人也不再需要多個樣本進行訓練。

　　（5）線段Hausdorff距離（LHD）的人臉識別方法：心理學的研究表明，人類在識別輪廓圖（比如漫畫）的速度和準確度上絲毫不比識別灰度圖差。LHD是基於從人臉灰度圖像中提取出來的線段圖的，它定義的是兩個線段集之間的距離，與眾不同的是，LHD並不建立不同線段集之間線段的一一對應關係，因此它更能適應線段圖之間的微小變化。實驗結果表明，LHD在不同光照條件下和不同姿態情況下都有非常出色的表現，但是它在大表情的情況下識別效果不好。

　　（6）支持向量機（SVM）的人臉識別方法：支持向量機是統計模式識別領域的一個新的熱點，它試圖使得學習機在經驗風險和泛化能力上達到一種妥協，從而提高學習機的性能。支持向量機主要解決的是一個2分類問題，它的基本思想是試圖把一個低維的線性不可分的問題轉化成一個高維的線性可分的問題。通常的實驗結果表明SVM有較好的識別率，但是它需要大量的訓練樣本（每類300個），這在實際應用中往往是不現實的。而且支持向量機訓練時間長，方法實現複雜，該函數的取法沒有統一的理論。

　　重要關鍵技術

　　基於大數據的深度學習

　　在人臉識別原理一節中提到了一些特徵提取和分類算法，可以理解為是一種淺層的學習模型。淺層學習可以在一定規模的數據集下可以發揮較強的表達能力，但當數據量不斷增大時，這些模型就會處於欠擬合的狀態。通俗點說就是數據量太大，模型不夠複雜，覆蓋不了所有數據。所以說，深度學習是近年來特別熱門的研究課題。

　　基於大數據的深度學習，將是人臉識別技術的主要趨勢之一。深度學習，往往含有更深的層次結構。越是低層，特徵越簡單，越是高層，特徵越抽象，但越接近所要表達的意圖。舉個例子，從字到詞，再到句，到語義，是層層深化的過程，這就是一個典型的深層結構。回到圖像分析的範疇，對於一個圖片來說，最低級的特徵是像素，也就是0到255的矩陣。通過像素，無法理解圖片里的目標是什麼，但我們可以從像素中找到了邊緣特徵，然後用邊緣特徵組合成不同的部件，最後形成了不同種類的目標物，這個才是我們所想要實現的。

　　利用深度學習提取出的人臉特徵，相比傳統技術，更能表示人臉之間的相關性，輔之有效的分類方法，能夠顯著提高算法識別率。深度學習非常依賴大數據，這也是為什麼這項技術在近幾年取得突破的原因。更多更豐富的樣本數據加入到訓練模型中，意味着算法模型將更通用，更貼近現實世界模型。另一方面，深度學習的理論性還需要加強，模型還需要優化。這一點，相信在眾多學術界和工業界同仁的努力下，深度學習將取得更大的成功。屆時人臉識別應用，或許能如現在的車牌識別技術一樣，深入到我們的生活中。

　　3D人臉識別技術

　　3D人臉識別技術是人臉識別重要發展發現。目前大部分的人臉識別應用的範疇限定在2D圖像上。人臉實質上是一個立體模型，而2D人臉識別容易受到姿態、光照、表情等因素影響，是因為2D圖像本身有一個缺陷，無法很好地表示深度信息。如果說深度學習是從人的認知角度來理解人臉識別，那麼3D技術就是從現實模型來反映人臉識別。

　　目前關於3D人臉識別方向的算法研究並沒有2D人臉識別技術那麼豐富和深入，許多因素限制了這項技術的發展。首先，3D人臉識別往往需要特定的採集設備，如3D攝像機或雙目攝像機。目前這類採集設備價格還比較昂貴，主要用於特定場景。其次，3D建模過程需要的計算量較大，對硬件要求較高，也限制了目前的應用。第三，3D人臉識別數據庫比較稀少，研究者缺少訓練樣本和測試樣本，無法開展更深入的理論研究。相信隨着未來芯片技術和傳感器的發展，當計算能力不再收到制約，3D採集設備成本大幅下降的時候，3D人臉識別將取得重要突破。

推薦文章: