昆明噬撼电子有限公司

人臉檢測算法系統(tǒng)開發(fā)徹底改變圖像搜索

早在2001年,兩位計算機科學家Paul Viola和Michael Jones就引發(fā)了計算機人臉檢測領(lǐng)域的一場革命。經(jīng)過多年的停滯,他們的突破是一種可以實時識別圖像中的面部的算法。實際上,所謂的Viola-Jones算法非??焖俸秃唵?,很快就被內(nèi)置到標準的傻瓜相機中。

人臉檢測mg(1).jpg

他們的部分訣竅是忽略面部識別中更加困難的問題,而只關(guān)注檢測。他們也只關(guān)注從正面看的面孔,忽略了從一個角度看到的任何面孔。鑒于這些界限,他們意識到鼻梁通常形成一條垂直線,比附近的眼窩更亮。他們還注意到眼睛經(jīng)常處于陰影中,因此形成了較暗的水平帶。

因此,Viola和Jones構(gòu)建了一種算法,該算法首先查找可能是鼻子的圖像中的垂直亮帶,然后查找可能是眼睛的水平暗帶,然后查找與臉相關(guān)的其他一般模式。

由他們自己檢測,這些特征都沒有強烈暗示面部。但是當它們在級聯(lián)中一個接一個地被檢測到時,結(jié)果是圖像中的面部的良好指示。因此,這個過程的名稱:探測器級聯(lián)。由于這些測試都很簡單,因此生成的算法可以快速實時運行。

但是,雖然Viola-Jones算法對于從正面看到的面部是一種啟示,但它無法從任何其他角度精確地發(fā)現(xiàn)面部。這嚴重限制了它如何用于面部搜索引擎。

這就是雅虎對此問題感興趣的原因。今天,加利福尼亞州雅虎實驗室的Sachin Farfade和Mohammad Saberian以及斯坦福大學附近的Li-Jia Li,揭示了一種解決問題的新方法,即使在部分遮擋的情況下也可以在某個角度發(fā)現(xiàn)面部問題。他們說他們的新方法比其他方法更簡單,但卻達到了先進的性能。

Farfade和co使用一種根本不同的方法來構(gòu)建他們的模型。他們利用近年來在一種稱為深度卷積神經(jīng)網(wǎng)絡(luò)的機器學習上取得的進步。我們的想法是使用大量帶注釋的示例數(shù)據(jù)庫來訓練多層神經(jīng)網(wǎng)絡(luò),在這種情況下,從多個角度拍攝人臉照片。

為此,F(xiàn)arfade和co創(chuàng)建了一個包含200,000張圖像的數(shù)據(jù)庫,其中包括各種角度和方向的面部以及另外2000萬張沒有面部的圖像。然后他們在50,000次迭代中以128個圖像批量訓練他們的神經(jīng)網(wǎng)絡(luò)。

結(jié)果是一種算法,即使在部分遮擋的情況下也可以從各種角度發(fā)現(xiàn)面部。它可以非常精確地在同一圖像中發(fā)現(xiàn)許多面部。

該團隊稱這種方法為Deep Dense Face Detector,并稱它與其他算法相比較?!拔覀兪褂闷渌谏疃葘W習的方法評估了所提出的方法,并表明我們的方法可以獲得更快,更準確的結(jié)果,”他們說。

更重要的是,他們的算法在顛倒時能夠更好地識別面部,其他方法還沒有完善。并且他們說,使用包含更多顛倒面的數(shù)據(jù)集可以做得更好。“我們計劃使用更好的采樣策略和更復雜的數(shù)據(jù)增強技術(shù),以進一步提高所提出的檢測遮擋和旋轉(zhuǎn)面部方法的性能?!?/p>

這是一項有趣的工作,展示了人臉檢測的快速進展。深度卷積神經(jīng)網(wǎng)絡(luò)技術(shù)本身只有幾年的歷史,已經(jīng)在對象和人臉識別方面取得了重大進展。

這種算法的巨大希望在于圖像搜索。目前,可以直接搜索在特定地點或特定時間拍攝的圖像。但很難找到特定人物拍攝的照片。這是朝這個方向邁出的一步。在不遠的將來,這種能力不可避免地會伴隨我們。

當它到來時,世界將變得更小。這不僅僅是將來可以搜索的圖片,而是數(shù)字化圖像的整個歷史,包括大量的視頻和CCTV鏡頭。無論如何,這將成為一股強大的力量。

下一篇 電商類網(wǎng)站系統(tǒng)定制開發(fā)

最新案例 查看更多

查看 
确山县| 修文县| 台前县| 浪卡子县| 和田市| 历史| 富宁县| 龙陵县| 泰宁县| 东城区| 台山市| 安泽县| 桑植县| 神池县| 汉寿县| 平利县| 萝北县| 岑巩县| 手机| 宜都市| 南召县| 西昌市| 荥经县| 盐边县| 浦城县| 黔江区| 灵台县| 花垣县| 塔河县| 突泉县| 石景山区| 镇宁| 永宁县| 衡东县| 宁蒗| 信丰县| 曲麻莱县| 土默特左旗| 延长县| 扎兰屯市| 临海市|