常用的圖像處理算法:數(shù)字圖像處理基礎(chǔ)、遙感數(shù)字圖像處理、機器視覺、計算機視覺
圖像處理程序:C++ OpenCV、Matlab與圖像處理
數(shù)字圖像處理-概述
其實,造成“不可能圖形”(三角形的三個角都是90°)的并不是圖形本身,而是你對圖形的三維知覺系統(tǒng),這一系列在你知覺圖形的立體心理模型時強制作用。在把二維平面圖形知覺為你三維立體心理圖形時,執(zhí)行這一過程的機制會極大地影響你的視覺系統(tǒng)。
正是在這一強制執(zhí)行的機制的影響下,你的視覺系統(tǒng)對圖形中的每一個點都賦予了深度。換句話說,一幅圖像的某些二維結(jié)構(gòu)元素和你三維知覺解釋系統(tǒng)的某些結(jié)構(gòu)元素相對應(yīng)。二維直線被解釋成三維直線。二維的平面被解釋為三維的平面。在透視圖像中,銳角和鈍角都被解釋為90°角。外面的線段被看作是外形輪廓的分界線。這一外形分界線在你定義整個心理圖像的外形輪廓時起著及其重要的作用。這說明,在沒有相反信息的影響下,你的視覺系統(tǒng)總是假定你從一個主要視角觀看事物。
三角形的每一個頂角都產(chǎn)生透視,三個90°的角,而且,每條邊的距離變化不同。把三個頂角合成一個整體,就產(chǎn)生了一個空間不可能圖形。
相對性:環(huán)境對比的影響
計算機視覺的發(fā)展歷史:
1950s:二維圖像分析和識別,如光學(xué)字符識別,工件表面、顯微圖片和航空圖片的分析和解釋等。是模式識別的重要內(nèi)容。
1960s:MIT的Roberts通過計算機程序從數(shù)字圖像中提取出諸如立方體、楔形體、棱柱體等多面體的三維結(jié)構(gòu),并對物體形狀及物體的空間關(guān)系進(jìn)行描述.這項研究開創(chuàng)了以理解三維場景為目的的三維計算機視覺的研究.Roberts對積木世界的創(chuàng)造性研究給人們以極大的啟發(fā),許多人相信,一旦由白色積木玩具組成的三維世界可以被理解,則可以推廣到理解更復(fù)雜的三維場景.
1970s:出現(xiàn)了一些視覺應(yīng)用系統(tǒng).
-70年代中期,麻省理工學(xué)院(MIT)人工智能(AI)實驗室正式開設(shè)“計算機視覺” ( Machine Vision) 課程,由B.K.P.Horn教授講授.
-David Marr教授于1973年應(yīng)邀在MIT AI 實驗室領(lǐng)導(dǎo)一個以博士生為主體的研究小組,1977年提出了不同于“積木世界”分析方法的計算視覺理論.
1980s:Marr理論成為計算機視覺研究領(lǐng)域中的一個十分重要的理論框架.(ICCV, Marr獎)
計算機視覺獲得蓬勃發(fā)展,新概念、新方法、新理論、新應(yīng)用不斷涌現(xiàn),比如,基于感知特征群的物體識別理論框架,主動視覺理論框架,視覺集成理論框架等.
Marr模型
80年代初,Marr首次從信息處理的角度綜合了圖像處理、心理物理學(xué)、神經(jīng)生理學(xué)及臨床神經(jīng)病理學(xué)的研究成果,提出了第一個較完備的視覺系統(tǒng)框架。
Marr將系統(tǒng)分為基元圖、2.5維圖(部分的、不完整的三維信息,缺少深度信息)和三維模型三個層次來表達(dá)視覺信息的處理過程,而每層的表達(dá)將適當(dāng)?shù)男畔⒚骼驶?/p>
基元圖:使亮度變化(邊沿)的信息明朗化,如角點、邊緣、紋理、線條、邊界等基本特征。
2.5維圖:使表面朝向的信息明朗化,如場景可見部分的深度、法線方向、輪廓等。
三維模型:物體的形狀與空間位置信息明朗化。
優(yōu)點:系統(tǒng)地闡述了用二維圖像恢復(fù)三維物體的可能性和一般性方法。
缺點:沒有考慮視覺本身具有的反饋機制和不同層次的處理力度。
計算機視覺(Computer Vision)與相關(guān)學(xué)科的關(guān)系
- 圖像處理 (Image Processing) 圖像處理通常是把一幅圖像變換成另外一幅圖像,也就是說,圖像處理系統(tǒng)的輸入是圖像,輸出仍然是圖像,信息恢復(fù)任務(wù)則留給人來完成。
- 計算機圖形學(xué) (Computer Graphics) 通過幾何基元,如線、圓和自由曲面等,來生成圖像,屬于圖像綜合,它在可視化(Visualization)和虛擬現(xiàn)實(Virtual Reality)中起著很重要的作用.計算機視覺正好是解決相反的問題,即從圖像中估計幾何基元和其它特征,屬于圖像分析.
- 模式識別 (Pattern Recognition) 研究分類問題,確定符號、圖畫、物體等輸入對象的類別.強調(diào)一類事物區(qū)別于其它事物所具有的共同特征。一般不關(guān)心三維世界的恢復(fù)問題。
- 人工智能 (Artificial Intelligence) 涉及到智能系統(tǒng)的設(shè)計和智能計算的研究.在經(jīng)過圖像處理和圖像特征提取過程后,接下來要用人工智能方法對場景特征進(jìn)行表示,并分析和理解場景.
- 媒體計算 (Multimedia Computing) 文字\圖形\圖像\動畫\視頻\音頻等各類感覺媒體的共性基礎(chǔ)計算理論、計算方法,以及媒體系統(tǒng)實現(xiàn)技術(shù)。以實現(xiàn)下一代計算機能聽、能看、會說、會學(xué)習(xí)為目標(biāo)。
- 認(rèn)知科學(xué)與神經(jīng)科學(xué) (Cognitive science and Neuroscience) 將人類視覺作為主要的研究對象.計算機視覺中已有的許多方法與人類視覺極為相似.許多計算機視覺研究者對研究人類視覺計算模型比研究計算機視覺系統(tǒng)更感興趣,希望計算機視覺更加自然化,更加接近生物視覺
圖信號處理層次
- 圖像處理:圖像采集、儲存;圖像重建;圖像變換、增強、恢復(fù)、校正;圖像(視頻)壓縮編碼。
- 圖像分析:邊緣檢測、圖像分割;目標(biāo)表達(dá)、描述;目標(biāo)顏色、形狀、紋理、空間和運動分析;目標(biāo)檢測、識別。
- 圖像理解:圖像配準(zhǔn)、融合;3-D表示、建模、場景恢復(fù);圖像感知、解釋、推理;基于內(nèi)容的圖像和視頻檢索。
計算機視覺技術(shù)的應(yīng)用
- 工業(yè)領(lǐng)域(生產(chǎn)裝配、質(zhì)量檢驗)
- 機器人(星球探測機器人)
- 遙感圖像分析(植被分析)
- 醫(yī)學(xué)圖像分析(骨骼定位)
- 安全鑒別、監(jiān)視與跟蹤(門禁系統(tǒng)、視頻監(jiān)控)
- 國防系統(tǒng)(目標(biāo)自動識別與目標(biāo)跟蹤)
- 圖像與視頻檢索(基于內(nèi)容的檢索)
- 文物保護(hù)(數(shù)字博物館)
- 其他(游戲、動畫、體育、人機交互)