人臉檢測(cè)算法設置徹底改變(biàn)圖像搜索-北京軟件開發公司

人臉檢測(cè)算法設置徹底改變(biàn)圖像搜索-北京軟件開發公司_北京軟件開發公司

發表日期：2018-11-12 14:05:35 文章編輯：宜天信達浏覽次數:

早在2001年，兩位計算機科學家Paul Viola和Michael Jones就引發瞭計算機人臉檢測領域的一場革命。經過多年的停滞，他們的突破是一種可以實時識别圖像中的面部的算法。實際上，所謂的Viola-Jones算法非常快速和簡單，很快就被内置到标準的傻瓜相機中。

他們的部分訣竅是忽略面部識别中更加困難的問題，而隻關注檢測。他們也隻關注從正面看的面孔，忽略瞭從一個角度看到的任何面孔。鑒於這些界限，他們意識到鼻梁通常形成一條垂直線，比附近的眼窩更亮。他們還注意到眼睛經常處於陰影中，因此形成瞭較暗的水平帶。

因此，Viola和Jones構建瞭一種算法，該算法首先查找可能是鼻子的圖像中的垂直亮帶，然後查找可能是眼睛的水平暗帶，然後查找與臉相關的其他一般模式。

由他們自己檢測，這些特征都沒有強烈暗示面部。但是當它們在級聯中一個接一個地被檢測到時，結果是圖像中的面部的良好指示。因此，這個過程的名稱：探測器級聯。由於這些測試都很簡單，因此生成的算法可以快速實時運行。

但是，雖然Viola-Jones算法對於從正面看到的面部是一種啓示，但它無法從任何其他角度精確地發現面部。這嚴重限制瞭它如何用於面部搜索引擎。

這就是雅虎對此問題感興趣的原因。今天，加利福尼亞州雅虎實驗室的Sachin Farfade和Mohammad Saberian以及斯坦福大學附近的Li-Jia Li，揭示瞭一種解決問題的新方法，即使在部分遮擋的情況下也可以在某個角度發現面部問題。他們說他們的新方法比其他方法更簡單，但卻達到瞭先進的性能。

Farfade和co使用一種根本不同的方法來構建他們的模型。他們利用近年來在一種稱爲深度卷積神經網絡的機器學習上取得的進步。我們的想法是使用大量帶注釋的示例數據庫來訓練多層神經網絡，在這種情況下，從多個角度拍攝人臉照片。

爲此，Farfade和co創建瞭一個包含200,000張圖像的數據庫，其中包括各種角度和方向的面部以及另外2000萬張沒有面部的圖像。然後他們在50,000次疊代中以128個圖像批量訓練他們的神經網絡。

結果是一種算法，即使在部分遮擋的情況下也可以從各種角度發現面部。它可以非常精確地在同一圖像中發現許多面部。

該團隊稱這種方法爲Deep Dense Face Detector，並稱它與其他算法相比較。“我們使用其他基於深度學習的方法評估瞭所提出的方法，並表明我們的方法可以獲得更快，更準確的結果，”他們說。

更重要的是，他們的算法在颠倒時能夠更好地識别面部，其他方法還沒有完善。並且他們說，使用包含更多颠倒面的數據集可以做得更好。“我們計劃使用更好的採樣策略和更複雜的數據增強技術，以進一步提高所提出的檢測遮擋和旋轉面部方法的性能。”

這是一項有趣的工作，展示瞭人臉檢測的快速進展。深度卷積神經網絡技術本身隻有幾年的曆史，已經在對象和人臉識别方面取得瞭重大進展。

這種算法的巨大希望在於圖像搜索。目前，可以直接搜索在特定地點或特定時間拍攝的圖像。但很難找到特定人物拍攝的照片。這是朝這個方向邁出的一步。在不遠的将來，這種能力不可避免地會伴随我們。

當它到來時，世界将變得更小。這不僅僅是将來可以搜索的圖片，而是數字化圖像的整個曆史，包括大量的視頻和CCTV鏡頭。無論如何，這将成爲一股強大的力量。