機器視覺或稱計算機視覺是用一個可以代替人眼的光學(xué)裝置和傳感器來對客觀世界三維場景進行感知,即獲取物體的數(shù)字圖像,利用計算機或者芯片,結(jié)合專門應(yīng)用軟件來模擬人腦的判斷準(zhǔn)則而對所獲取的數(shù)字圖像進行測量和判斷。該技術(shù)已廣泛用于實際的測量、控制和檢測中,隨著芯片技術(shù)發(fā)展,在人工智能各個領(lǐng)域應(yīng)用也逐步展開。
一個典型的工業(yè)機器視覺系統(tǒng)包括:光源、鏡頭、相機 (包括CCD相機和COMS相機)、圖像處理單元 (或機器視覺芯片)、圖像處理軟件、監(jiān)視器、通訊、輸入輸出單元等。系統(tǒng)可再分為主端電腦、影像采集與影像處理器、影像攝影機、CCTV鏡頭、顯微鏡頭、照明設(shè)備、Halogen光源、LED光源、高周波螢光燈源、閃光燈源、其他特殊光源、影像顯示器、LCD、機構(gòu)及控制系統(tǒng)、控制器、精密桌臺、伺服運動機臺。
機器視覺之于人工智能的意義等同于視覺之于人類的意義,而決定著機器視覺的就是圖像處理技術(shù)。不同的應(yīng)用領(lǐng)域需要不同的圖像處理算法來實現(xiàn)機器視覺。常用的機器視覺領(lǐng)域圖像算法有運動目標(biāo)檢測算法、基于深度學(xué)習(xí)的人臉?biāo)惴ǖ取?/p>
下面介紹下機器視覺中的運動目標(biāo)檢測圖像算法,該方法是運動物體識別和跟蹤的基礎(chǔ)。移動物體的檢測依據(jù)視頻圖像中背景環(huán)境的不同可以分為靜態(tài)背景檢測和動態(tài)背景檢測。由于篇幅有限,我們這里只介紹靜態(tài)背景檢測算法。常見的靜態(tài)背景目標(biāo)的檢測算法包括幀間差分法、背景減除法、光流法等。這些背景不變算法的優(yōu)缺點描述如下。
算法名稱 | 算法優(yōu)點 | 算法缺點 |
幀間差算法 | 能適應(yīng)環(huán)境變化、計算相對容易,穩(wěn)定性好。 | 容易產(chǎn)生空洞現(xiàn)象,靜止目標(biāo)沒法檢測 |
背景減除法 | 速度快、能檢測靜止目標(biāo)準(zhǔn)確性高 | 對光照比較敏感 |
光流法 | 適用于運動環(huán)境中物體檢測,能直接計算運動信息 | 由于計算骨薪下所骨高賠性較弱 |
在上述檢測算法中,幀間差分法和背景減除法更加適用于如視頻監(jiān)控、智能交通系統(tǒng)等圖像背景靜止的環(huán)境中。光流法則更加適用于背景不斷變化的動態(tài)環(huán)境中。下面我們來介紹以上三種常用算法的基本原理。
幀間差分法
適應(yīng)環(huán)境能力強、計算量小、且穩(wěn)定性好,是目前應(yīng)用廣泛的一類運動檢測方法。其原理是將相幀或者三幀序列圖像像素點的對應(yīng)灰度值進行相減,如果灰度差值大于閾值則說明此處物體發(fā)生了變化,它是運動的;如果像素的灰度差值小于給定閾值說明此處物體沒有發(fā)生變化,認為它是靜止的。將像素灰度值發(fā)生變化的部分標(biāo)記出來,這些被標(biāo)記的點就組成了運動目標(biāo)區(qū)域。進一步對灰度圖像進行二值化分析,提取目標(biāo)運動信息,區(qū)分出前景和背景圖像,進而分割出運動目標(biāo)。
背景減除法
其實是一種特別的幀間差分法,背景減除法根據(jù)將當(dāng)前幀圖像與背景模型做差來實現(xiàn)對運動目標(biāo)的檢測。這種方法首先獲取背景模型,并將其保存起來,當(dāng)對某一幀圖像進行檢測時,用實時獲取的幀圖像與背景模型做差分運算,得到要檢測的運動目標(biāo)。
光流法
當(dāng)運動目標(biāo)在監(jiān)控場景中產(chǎn)生運動的時候,物體表面會形成位移矢量場,根據(jù)其變化可以得到運動目標(biāo)。光流是指移動物體在其對應(yīng)的灰度圖像上的表面運動,在光流場中,運動目標(biāo)的速度矢量形成的平面投影構(gòu)成了目標(biāo)的運動信息。運動目標(biāo)在投影上形成的速度矢量是比較均勻,運動目標(biāo)速度不同形成的速度矢量也不相同,通過光流的計算結(jié)果就可以區(qū)分出速度不同的運動目標(biāo)。
圖像處理算法
一開始應(yīng)用應(yīng)該是采用服務(wù)器的軟件算法來完成,隨著互聯(lián)網(wǎng)技術(shù)的不斷成熟,會擴展到云端計算來完成,但是這樣對于網(wǎng)絡(luò)帶寬要求非常大,對于云服務(wù)器的計量量要求也非常高。筆者估計,視頻圖像處理技術(shù)算法的大規(guī)模產(chǎn)業(yè)化應(yīng)用,必然是需要專業(yè)的芯片來完成,該芯片就是機器視覺 (CV) 芯片。芯片方式一定是能夠降低成本,同時提高運算能力。從近年的整個行業(yè)情況來看,計算機視覺作為人工智能領(lǐng)域最重要的方向之一,由于機器視覺芯片誕生和深度學(xué)習(xí)算法不斷發(fā)展,近幾年獲得了巨大的發(fā)展,各項應(yīng)用在不同的行業(yè)里開始落地生根。