NEC與東京工業(yè)大學(xué)通過(guò)學(xué)習(xí)了專家的變換技能的AI技術(shù),將可見光攝像頭與非可見光攝像頭拍攝的圖像自動(dòng)高效統(tǒng)合,提高對(duì)象物・狀況的視覺(jué)識(shí)別度,共同開發(fā)了即便在惡劣環(huán)境下也可以快速判斷是否存在異;蛭kU(xiǎn)物的“多模圖像融合技術(shù)”。
NEC與日本國(guó)立大學(xué)法人東京工業(yè)大學(xué)工學(xué)院奧富正敏教授、田中正行特定副教授的研究團(tuán)隊(duì)(以下簡(jiǎn)稱東京工業(yè)大學(xué))共同開發(fā)了“多模(注1)圖像融合技術(shù)”,通過(guò)AI技術(shù)將一般攝像頭拍攝的可見光圖像與熱成像相機(jī)拍攝的非可見光圖像進(jìn)行自動(dòng)高效合成,且提高了單個(gè)圖像拍攝時(shí)的視覺(jué)識(shí)別度。
在需要瞬時(shí)視覺(jué)識(shí)別的各個(gè)領(lǐng)域中利用此項(xiàng)技術(shù),即便在惡劣條件下也可以實(shí)現(xiàn)正確判斷。例如,夜間或濃霧等惡劣天氣條件下也可以正常進(jìn)行的設(shè)施監(jiān)控;即便迎面行駛汽車的刺眼的車燈及黑暗造成視覺(jué)死角也可以使用的自動(dòng)駕駛支持;不僅可以監(jiān)測(cè)建筑表面的裂縫,還可以監(jiān)測(cè)其內(nèi)部異常的基礎(chǔ)設(shè)施點(diǎn)檢等。
以往想要合成不同種類攝像頭拍攝的圖像需要專家進(jìn)行復(fù)雜的手動(dòng)合成作業(yè)。而此技術(shù)則將各種攝像頭采集的圖像通過(guò)AI技術(shù)自動(dòng)高效合成,無(wú)需手工操作。并且充分利用可見光圖像和非可見光圖像各自的優(yōu)勢(shì),即便是以往人眼難以看清的場(chǎng)景也可以獲得較高的視覺(jué)識(shí)別度。
NEC與東京工業(yè)大學(xué)今后也將繼續(xù)通過(guò)產(chǎn)學(xué)合作形式共同研發(fā)支撐各項(xiàng)社會(huì)基礎(chǔ)設(shè)施安心安全運(yùn)轉(zhuǎn)的圖像處理以及AI相關(guān)技術(shù)。
【背景】
近年來(lái),在圖像傳感器的不斷升級(jí)及成本持續(xù)下降的背景下,將熱成像攝像頭及可捕捉物體內(nèi)部構(gòu)造的X光・太赫茲波・毫米波攝像頭等非可見光攝像頭應(yīng)用到夜間、濃霧等惡劣天氣、逆光、遮蔽等不利條件下的監(jiān)控及診斷的情況越來(lái)越普及。但是這些非可見光攝像頭比可見光攝像頭的分辨率和畫質(zhì)都要低,視覺(jué)識(shí)別起來(lái)很困難,因此需要將可見光攝像頭與之配合在一起使用,通過(guò)對(duì)比雙方的圖像進(jìn)行監(jiān)視和診斷。因此,想要快速精準(zhǔn)地判斷對(duì)象物體的狀況是比較困難的。為解決這個(gè)課題,最好的辦法就是將兩種圖像合成一個(gè)圖像,但是過(guò)去的合成辦法需要精通攝像頭和攝影環(huán)境的專家親自手動(dòng)調(diào)整,從各自單獨(dú)的圖像中抽取出適于合成的部分,一邊注意防止過(guò)度曝光和曝光不足以及噪點(diǎn)增強(qiáng)破壞圖像等問(wèn)題,一邊進(jìn)行復(fù)雜的圖像合成作業(yè)。另外,在非可見光中包含的用于判斷異常及危險(xiǎn)物的特征很可能因?yàn)楹铣稍斐蓙G失,這也是一個(gè)重要課題。
NEC與東京工業(yè)大學(xué)通過(guò)學(xué)習(xí)了專家的變換技能的AI技術(shù),將可見光攝像頭與非可見光攝像頭拍攝的圖像自動(dòng)高效統(tǒng)合,提高對(duì)象物・狀況的視覺(jué)識(shí)別度,共同開發(fā)了即便在惡劣環(huán)境下也可以快速判斷是否存在異;蛭kU(xiǎn)物的“多模圖像融合技術(shù)”。
【新技術(shù)的優(yōu)點(diǎn)】
AI技術(shù)自動(dòng)從多個(gè)圖像中選擇出視覺(jué)識(shí)別度高的圖像,并在強(qiáng)調(diào)非可見光中包含的細(xì)小特征的同時(shí)進(jìn)行圖像合成,從而實(shí)現(xiàn)打破以往局限性的高度視覺(jué)識(shí)別。
AI技術(shù)會(huì)根據(jù)熱成像攝像頭、太赫茲攝像頭等攝像頭種類、環(huán)境特征(亮度、光線方向、有無(wú)障礙物)等不同條件,對(duì)圖像內(nèi)各部分的視覺(jué)識(shí)別度的高低進(jìn)行評(píng)價(jià),從而從各個(gè)圖像中自動(dòng)抽取出最適宜的部分。
此外,AI技術(shù)在處理非可見光攝像頭拍攝的圖像時(shí),會(huì)針對(duì)異常及危險(xiǎn)物的細(xì)小特征進(jìn)行解析,進(jìn)行適當(dāng)?shù)膹?qiáng)弱調(diào)整以避免因過(guò)度曝光及曝光不足而破壞圖像,從而自動(dòng)生成以往無(wú)法實(shí)現(xiàn)的高視覺(jué)識(shí)別度的多模(可見光-非可見光)融合圖像。
(注1) Multimodal(多模)
多種模式、形態(tài)。本文中提到的多模是指可見光攝像頭拍攝的圖像和紅外線攝像頭等非可見光攝像頭拍攝的圖像。
(注2) 獲得創(chuàng)新研發(fā)推進(jìn)項(xiàng)目(ImPACT)Tough Robotics Challenge關(guān)于惡劣環(huán)境模擬設(shè)備的許可并使用。
|