科學(xué)家發(fā)現(xiàn)了一種應(yīng)用于智慧醫(yī)院等領(lǐng)域的人臉識別模型
人臉識別工具是一種計算模型,可以在眾多領(lǐng)域得到應(yīng)用,醫(yī)學(xué)領(lǐng)域的智慧醫(yī)院環(huán)節(jié)也不例外。
在醫(yī)院的就醫(yī)環(huán)節(jié),醫(yī)院的管理人員可以用人臉識別代替社???、身份證等識讀設(shè)備。在醫(yī)保支付環(huán)節(jié),人臉識別還可以進行支付認證。在醫(yī)院影像領(lǐng)域,人臉識別可以和PACS系統(tǒng)很好結(jié)合,輔助醫(yī)療技術(shù)影像科的專家識別身份,判定疾病的癥狀等。人臉識別,智慧醫(yī)院領(lǐng)域領(lǐng)域必不可少。
雖然現(xiàn)在大多數(shù)現(xiàn)有的人臉識別模型都表現(xiàn)得非常好,但仍有很大的改進空間。倫敦瑪麗女王大學(xué)的研究人員最近為人臉識別創(chuàng)造了一種新的、有前景的架構(gòu)。
“使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)和基于邊緣損失的整體方法主導(dǎo)了人臉識別的研究,”進行這項研究的兩名研究人員孫仲林(Zhonglin Sun)和Georgios Tzimiropoulos說。
“在這項工作中,我們從兩個方面出發(fā):首先,我們使用視覺轉(zhuǎn)換器作為一個架構(gòu)來訓(xùn)練一個非常強的人臉識別基線,簡稱fViT,它已經(jīng)超過了大多數(shù)最先進的人臉識別方法。其次,我們利用視覺變壓器(ViTs)的固有屬性來處理從不規(guī)則網(wǎng)格中提取的信息(視覺標記),設(shè)計出一種用于人臉識別的管道?!?/span>
大多數(shù)廣泛使用的人臉識別方法都是基于CNN,這是一類人工神經(jīng)網(wǎng)絡(luò),可以自主學(xué)習(xí)在圖像中尋找模式,例如識別特定的物體或人。雖然其中一些方法取得了非常好的性能,但最近的工作突出了另一類人臉識別算法的潛力,即視覺變壓器(ViTs)。
與CNN相比,ViTs將圖像分割成特定大小的補丁,然后在這些補丁中添加嵌入。CNN通常全面分析圖像。然后,得到的向量序列被饋送到標準轉(zhuǎn)換器,這是一個深度學(xué)習(xí)模型,它對正在分析的數(shù)據(jù)的不同部分進行不同的加權(quán)。
研究人員在他們的論文中解釋說:“與CNN相反,ViT實際上可以在從不規(guī)則網(wǎng)格中提取的補丁上工作,并且不需要用于卷積的均勻間隔采樣網(wǎng)格。”“由于人臉是由部分(如眼睛、鼻子、嘴唇)組成的結(jié)構(gòu)化對象,并且受到深度學(xué)習(xí)之前基于部分的面部識別開創(chuàng)性工作的啟發(fā),我們建議將ViT應(yīng)用于代表面部部分的補丁?!?/span>
由Sun和Tzimiropoulos創(chuàng)建的視覺轉(zhuǎn)換器架構(gòu),被稱為部分fViT,由一個輕量級網(wǎng)絡(luò)和一個視覺轉(zhuǎn)換器組成。網(wǎng)絡(luò)預(yù)測面部標志的坐標(例如,鼻子,嘴巴等),而變壓器分析包含預(yù)測標志的補丁。
他們的架構(gòu)在所有測試數(shù)據(jù)集上都取得了驚人的準確性,與許多其他最先進的人臉識別模型相當(dāng)。此外,他們的模型似乎在沒有經(jīng)過專門訓(xùn)練的情況下成功地勾畫出了面部地標。