對人臉識別的11個誤解
過去十年內(nèi),隨著我們在人工智能領(lǐng)域取得長足進步,我們能夠為嵌入式系統(tǒng)增加一些先進功能,例如人臉識別。雖然人臉識別能夠帶來諸多好處,但人們有時仍然認為它的使用存在問題,甚至充滿了爭議。事實究竟如何?在本文中,我們將澄清一些對人臉識別的誤解。
本文引用地址:http://cafeforensic.com/article/202005/413251.htm1) 人臉識別的成本非常昂貴
人們會覺得要讓計算機能夠識別人臉,解決方案必須采用高端硬件。畢竟,自21世紀前十年中期以來,深度學習算法在圖像分類方面的突破都利用了圖形處理單元(GPU)的強大處理能力,這些單元通常在緊耦合集群中使用。但對于嵌入式系統(tǒng)(例如家庭安保和門禁控制產(chǎn)品)的人臉識別應(yīng)用開發(fā)人員而言,并不需要如此復雜的機器學習流程。設(shè)計高效率的算法,側(cè)重于檢測人臉、將人臉與已注冊的圖像進行匹配,所需的處理能力將遠低于研究級別的算力。
2) 人臉識別非常困難
機器學習的一大關(guān)鍵難點是將設(shè)計流程與應(yīng)用相匹配,以便能夠在訓練時產(chǎn)生有用的結(jié)果。但在人臉學習等應(yīng)用中,不需要從頭開始構(gòu)建這些結(jié)構(gòu)。我們可以使用基于經(jīng)過驗證的機器學習過程構(gòu)建的平臺,它們不僅能快速提供高性能,而且提供一定程度的定制能力,滿足不同目標市場的需要。
3) 人臉識別需要高性能處理
很多人看到,在云計算環(huán)境中,我們將高性能硬件用于機器學習,于是他們想當然地假定機器學習都是重量級進程。但是,這些系統(tǒng)需要能夠適應(yīng)很多不同應(yīng)用,而且它們可以充分利用支持所有深度學習架構(gòu)的開源工具。因而,即便對于推理應(yīng)用,當使用網(wǎng)絡(luò)來分析實際數(shù)據(jù)時,模型具有高度的數(shù)據(jù)和計算冗余。 嵌入式解決方案可以顯著減少這些開銷,因而能夠在32位MCU上運行復雜的人臉識別算法。
4) 人臉識別不太安全
人臉識別在嵌入式系統(tǒng)中的一大重要應(yīng)用是門禁控制,如果有人手持自拍照靠近攝像頭企圖蒙混過關(guān),需要確保門鎖不會被打開,也無法越過報警系統(tǒng)。正因為如此,采用機器學習技術(shù)的集成式視覺平臺非常重要。這些技術(shù)能夠?qū)D像執(zhí)行檢查,確保將可用數(shù)據(jù)饋送到機器學習算法。靈活確保管道可以處理可見光數(shù)據(jù)以及更多內(nèi)容。在這種情況下,使用紅外傳感器或圖像傳感器可以幫助系統(tǒng)能夠辨別真?zhèn)巍?/p>
5) 人臉識別侵犯隱私
公眾熟悉的眾多應(yīng)用需要將原始數(shù)據(jù)上傳至云服務(wù)器,然后在云服務(wù)器上處理數(shù)據(jù)。這是很多消費者擔憂的問題,他們不希望自己在住宅及周邊區(qū)域的活動在互聯(lián)網(wǎng)上傳播,甚至可能在服務(wù)器遭受惡意攻擊后被披露。有些平臺可在本地執(zhí)行所有圖像處理和人臉識別功能,例如恩智浦基于MCU的EdgeReady解決方案。數(shù)據(jù)自始至終不會離開平臺,從而確保最終產(chǎn)品可以最大程度地保護用戶隱私。
6) 人臉識別在黑暗中無法進行
具有集成人臉識別功能的安全系統(tǒng)或電動門經(jīng)常需要在不太理想的照明條件下工作。人臉識別技術(shù)似乎要依賴于可見光才能正常工作,夜間工作或斷電可能成為一大難題。但是,通過將可見光圖像傳感器與在紅外線光譜上工作的輔助器件配合使用,或使用飛行時間數(shù)據(jù)來構(gòu)建范圍內(nèi)對象的3D映射,可以非常簡單地解決這個問題。采用這種方法,無光照不再是難題,由于不要求解決方案采用人工照明,它還有助于提高實用性和降低功耗。
7) 人臉識別需要人工智能方面的專業(yè)知識
整體來說,人工智能是一個非常寬泛和復雜的領(lǐng)域。僅在深度學習方面,arXiv網(wǎng)站上每天都會出現(xiàn)新學術(shù)論文,探討不同技術(shù)領(lǐng)域和新管道結(jié)構(gòu)。但如果您使用專為人臉識別設(shè)計的平臺,例如恩智浦基于MCU的解決方案,就很容易得到高質(zhì)量的結(jié)果,因為它不僅采用了機器學習技術(shù),還提供了針對任務(wù)設(shè)計的完整圖像處理工具包。
8) 人臉識別的功耗很高
使用經(jīng)過優(yōu)化的人工智能和圖像處理,我們可以在MCU上運行人臉識別,而并非在服務(wù)器平臺的高性能GPU上運行。這帶來了更多優(yōu)勢:我們可以使用目前MCU支持的眾多節(jié)能模式。MCU解決方案不需要啟動Linux等重量級操作系統(tǒng),這意味著在不需要主處理器的情況下可將其關(guān)閉。但如果運動傳感器確定視場范圍內(nèi)有足夠的活動需要注意,仍可在十分之一秒內(nèi)喚醒處理器,實現(xiàn)完整的人臉識別功能。
9) 訓練對于最終用戶來說是一項繁瑣的任務(wù)
早期在平板電腦和智能手機等嵌入式系統(tǒng)中實現(xiàn)的人臉識別需要一系列不同的姿態(tài),以便有效地訓練神經(jīng)網(wǎng)絡(luò),用于識別新用戶的臉部。隨著遷移學習等技術(shù)的進步,只需讓人臉面對攝像頭一次,即可進行特征訓練,并將特征添加到經(jīng)過許可的用戶數(shù)據(jù)庫。
10) 人臉識別的應(yīng)用受限
與任何技術(shù)相同,在創(chuàng)新公司將技術(shù)投入應(yīng)用之前,我們很難想像到技術(shù)將會如何使用。人臉識別似乎僅限于安保和門禁控制應(yīng)用,因為它們是目前常見的使用方式。但智能電器和電動工具可以將這項技術(shù)用于安全用途:禁用功能,避免小孩受傷。設(shè)備的設(shè)計目的將不再只是識別人臉,還要識別表情。設(shè)備能夠讀取情感信號,例如失望、困惑或高興,并且作出相應(yīng)的回應(yīng),改進整體用戶體驗。
11) 人臉識別需要重量級操作系統(tǒng)
由于深度學習的很多研究級別工具作為開源軟件工具包提供,而這些工具包是針對Linux編寫的,所以人們很容易會認為人臉識別等應(yīng)用需要Linux。但支持核心技術(shù)的嵌入式系統(tǒng)既不需要存儲器成本,也不需要Linux系統(tǒng)的長啟動時間。基于MCU的解決方案可以運行輕量級的操作系統(tǒng),消耗的存儲器空間更少,啟動時間更短,并且還支持高級電源優(yōu)化。
評論