現(xiàn)在很多計算機視覺的研究人員,恐怕對“馬爾計算視覺”根本不了解,這不能不說是一件非常遺憾的事。目前,在計算機上調(diào)“深度網(wǎng)絡(luò)”來提高物體識別的精度似乎就等于從事“視覺研究”。事實上,馬爾的計算視覺的提出,不論在理論上還是研究視覺的方法論上,均具有劃時代的意義。
馬爾的計算視覺分為三個層次: 計算理論、表達和算法以及算法實現(xiàn)。由于馬爾認為算法實現(xiàn)并不影響算法的功能和效果,所以,馬爾計算視覺理論主要討論“計算理論”和“表達與算法”二部分內(nèi)容。馬爾認為,大腦的神經(jīng)計算和計算機的數(shù)值計算沒有本質(zhì)區(qū)別,所以馬爾沒有對“算法實現(xiàn)”進行任何探討。從現(xiàn)在神經(jīng)科學(xué)的進展看,“神經(jīng)計算”與數(shù)值計算在有些情況下會產(chǎn)生本質(zhì)區(qū)別,如目前興起的神經(jīng)形態(tài)計算( Neuromorphological computing),但總體上說,“數(shù)值計算”可以“模擬神經(jīng)計算”。至少從現(xiàn)在看,“算法的不同實現(xiàn)途徑”,并不影響馬爾計算視覺理論的本質(zhì)屬性。
1)計算理論(Computational Theory)
計算理論需要明確視覺目的, 或視覺的主要功能是什么。上世紀70年代,人們對大腦的認識還非常粗淺,目前普遍使用的非創(chuàng)傷型成像手段,如功能核磁共振(FMRI)等,還沒有普及。所以,人們主要靠病理學(xué)和心理學(xué)結(jié)果來推斷生理功能。即使目前,人們對“視覺的主要功能”到底是什么,也仍然沒有定論。如最近幾年,MIT的 DiCarlo等人提出了所謂的“目標(biāo)驅(qū)動的感知信息建!狈椒ǎ╕amins &DiCarlo et al. 2016a)。他們猜測,猴子IT區(qū)(IT: interiortemporal cortex, 物體識別區(qū))的神經(jīng)元對物體的響應(yīng)(neuronal responses)“可以通過層次化的卷積神經(jīng)網(wǎng)絡(luò)”(HCNN: Hierarchical Convolutional Neural Networks )來建模。他們認為,只要對HCNN在圖像物體分類任務(wù)下進行訓(xùn)練,則訓(xùn)練好的HCNN 可以很好定量預(yù)測IT 區(qū)神經(jīng)元的響應(yīng)(Yamins et al. 2014, 2016b)。由于僅僅“控制圖像分類性能”對IT神經(jīng)元響應(yīng)(群體神經(jīng)元對某一輸入圖像物體的響應(yīng),就是神經(jīng)元對該物體的表達或編碼)進行定量預(yù)測,所以他們將這種框架稱之為“目標(biāo)驅(qū)動的框架”。目標(biāo)驅(qū)動的框架提供了一種新的比較通用的建模群體神經(jīng)元編碼的途徑,但也存在很大的不足。能否真正像作者所言的那樣,僅僅靠“訓(xùn)練圖像分類的HCNN”就可以定量預(yù)測神經(jīng)元對圖像物體的響應(yīng),仍是一個有待進一步深入研究的課題。
馬爾認為視覺不管有多少功能,主要功能在于“從視網(wǎng)膜成像的二維圖像來恢復(fù)空間物體的可見三維表面形狀”,稱之為“三維重建”(3D reconstruction)。而且,馬爾認為,這種重建過程不是天生就有的,而是可以通過計算完成的。J.J. Gibson 等心理學(xué)家,包括格式塔心里學(xué)學(xué)派( Gestalt psychology),認為視覺的很多功能是天生就有的?梢韵胂,如果一種視覺功能與生具有,不可建模,就談不上計算,也許就不存在今天的“計算機視覺”這門學(xué)科了。
那么,馬爾的計算理論是什么呢?這一方面,馬爾在其書中似乎并不是介紹得特別具體。他舉了一個購買商品的例子,說明計算理論的重要性。如商店結(jié)賬要用加法而不是乘法。試想如果用乘法結(jié)賬,每個商品1元錢,則不管你購買多少件商品,你僅僅需要付一元錢。
馬爾的計算理論認為,圖像是物理空間在視網(wǎng)膜上的投影,所以圖像信息蘊含了物理空間的內(nèi)在信息,因此,任何計算視覺計算理論和方法都應(yīng)該從圖像出發(fā),充分挖掘圖像所蘊含的對應(yīng)物理空間的內(nèi)在屬性。也就是說,馬爾的視覺計算理論就是要“挖掘關(guān)于成像物理場景的內(nèi)在屬性來完成相應(yīng)的視覺問題計算”。因為從數(shù)學(xué)的觀點看,僅僅從圖像出發(fā),很多視覺問題具有“歧義性”,如典型的左右眼圖像之間的對應(yīng)問題。如果沒有任何先驗知識,圖像點對應(yīng)關(guān)系不能唯一確定。不管任何動物或人,生活的環(huán)境都不是隨機的,不管有意識或無意識,時時刻刻都在利用這些先驗知識,來解釋看到的場景和指導(dǎo)日常的行為和行動。如桌子上放一個水杯的場景,人們會正確地解釋為桌子上放了一個水杯,而不把他們看作一個新物體。當(dāng)然,人類也會經(jīng)常出錯,如大量錯覺現(xiàn)象。從這個意義上來說,讓計算機來模仿人類視覺是否一定是一條好的途徑也是一個未知的命題。飛機的飛行需要借助空氣動力學(xué)知識,而不是機械地模仿鳥如何飛。
2)表達和算法(Representationand Algorithm)
識別物體之前,不管是計算機還是人,大腦(或計算機內(nèi)存)中事先要有對該物體的存儲形式,稱之為物體表達(object representation). 馬爾視覺計算理論認為,物體的表達形式為該物體的三維幾何形狀。馬爾當(dāng)時猜測,由于人在識別物體時與觀察物體的視角無關(guān),而不同視角下同一物體在視網(wǎng)膜上的成像又不同,所以物體在大腦中的表達不可能是二維的,可能是三維形狀,因為三維形狀不依賴于觀察視角。另外,當(dāng)時病理學(xué)研究發(fā)現(xiàn),有些病人無法辨認“茶杯”,但可以毫無困難地畫出茶杯的形狀,因此馬爾覺得,這些病人也佐證了他的猜測。從目前對大腦的研究看,大腦的功能是分區(qū)的。物體的“幾何形狀”和“語義”儲存在不同的腦區(qū)。另外,物體識別也不是絕對地與視角無關(guān),僅僅在一個比較小的變化范圍內(nèi)與視角無關(guān)。所以,從當(dāng)前的研究看,馬爾的物體的“三維表達”猜測基本上是不正確的,至少是不完全正確的,但馬爾的計算理論仍具有重要的理論意義和應(yīng)用價值。
大林上位機機器視覺,_常州電工培訓(xùn)_常州PLC培訓(xùn)_常州機器視覺培訓(xùn)_常州上位機培訓(xùn)_常州工業(yè)機器人培訓(xùn),最適合電工及plc編程人員學(xué)習(xí)的上位機機器視覺課程 大林老師:15861139266(微信同號)
簡言之,馬爾視覺計算理論的“物體表達”,是指“物體坐標(biāo)系下的三維形狀表達”。注意,從數(shù)學(xué)上來說,一個三維幾何形狀,選取的坐標(biāo)系不同,表達函數(shù)亦不同。如一個球體,如果以球心為坐標(biāo)原點,則球面可以簡單表達為:x^2+y^2+z^2=1。 但如果觀測者在x軸上2倍半徑處觀測,則可見球面部分在觀測者坐標(biāo)系下的方程為:x=2-sqrt(1-y^2-z^2)。由此可見,同一物體,選用的坐標(biāo)系不同,表達方式亦不同。馬爾將“觀測者坐標(biāo)系下的三維幾何形狀表達”稱之為“2.5維表達”,物體坐標(biāo)系下的表達為“三維表達”。所以,在后續(xù)的算法部分,馬爾重點研究了如何從圖像先計算“2.5維表達”,然后轉(zhuǎn)化為“三維表達”的計算方法和過程。
算法部分是馬爾計算視覺的主體內(nèi)容。馬爾認為,從圖像到三維表達,要經(jīng)過三個計算層次:首先從圖像得到一些基元(primal sketch), 然后通過立體視覺(stereopsis)等模塊將基元提升到2.5維表達,最后提升到三維表達。
下圖總結(jié)給出了馬爾視覺計算理論的算法流程:
馬爾計算理論中算法的三個計算層次
由上圖所示,首先從圖像提取邊緣信息(二階導(dǎo)數(shù)的過零點),然后提取點狀基元(blob, 線狀基元(edge)和桿狀基元 (bar), 進而對這些初級基元(raw primal sketch)組合形成完整基元(full primal sketch),上述過程為視覺計算理論的特征提取階段。在此基礎(chǔ)上,通過立體視覺和運動視覺等模塊,將基元提升到2.5維表達。最后,將2.5維表達提升到三維表達。在馬爾的《視覺》一書中,重點介紹了特征提取和2.5維表達對應(yīng)的計算方法。在2.5維表達部分,也僅僅重點介紹了立體視覺和運動視覺部分。由于當(dāng)雙眼(左右相機)的相互位置已知時(計算機視覺中稱之為相機外參數(shù)),立體視覺就轉(zhuǎn)化為“左右圖像點的對應(yīng)問題”(image point correspondence), 所以,馬爾在立體視覺部分重點介紹了圖像點之間的匹配問題,即如何剔除誤匹配,并給出了對應(yīng)算法。
立體視覺等計算得到的三維空間點僅僅是在“觀測者坐標(biāo)系下的坐標(biāo)”,是物體的2.5維表示。如何進一步提升到物體坐標(biāo)系下的三維表示,馬爾給出了一些思路,但這方面都很粗泛。如確定物體的旋轉(zhuǎn)主軸等等,這部分內(nèi)容,類似于后來人們提出的“骨架模型”(skeleton model)構(gòu)造.
需要指出的是,馬爾的視覺計算理論是一種理論體系。在此體系下,可以進一步豐富具體的計算模塊,構(gòu)建“通用性視覺系統(tǒng)”(general vision system)。只可惜馬爾(Jan.15,1945 ~ Nov.17,1980 )1980年底就因白血病去世,包括他的《視覺》一書,也是他去世后出版的。馬爾的英年早逝,不能說不是計算機視覺界的一大損失。由于馬爾的貢獻,所以二年一度的國際計算機視覺大會(ICCV: International Conference on Computer Vision)設(shè)有馬爾獎(MarrPrize),作為會議的最佳論文獎。另外,在認知科學(xué)領(lǐng)域,也設(shè)有馬爾獎,因為馬爾對認知科學(xué)也有巨大的貢獻。以同一人名在不同領(lǐng)域設(shè)立獎項,實屬罕見,可見馬爾對計算機視覺的影響有多深遠。正如S. Edelman 和 L. M. Vaina 在《 International Encyclopedia of the Social & Behavioral Sciences 》中對馬爾的評價那樣,“馬爾前期給出的集成數(shù)學(xué)和神經(jīng)生物學(xué)對大腦理解的三項工作,已足以使他在任何情況下在英國經(jīng)驗主義二個半世紀的科學(xué)殿堂中占有重要的一席,…, 然而,他進一步提出了更加有影響的計算視覺理論”。所以,從事計算機視覺研究的人員對馬爾計算視覺不了解,實在是一件比較遺憾的事。
一、課程目標(biāo)
本公司本著為工控事業(yè)培育和輸出從電工基礎(chǔ)到機器視覺的人才理念,著力于讓小白成為工控業(yè)專家為目標(biāo)。
大林上位機視覺軟件培訓(xùn)專家特開設(shè)從電工基礎(chǔ)、PLC、運動控制、上位機、工業(yè)機器人、機器視覺培訓(xùn)課程,為實現(xiàn)工業(yè)4.0事業(yè)而不懈努力。
機構(gòu)課程全程真實教學(xué)、實干為主,不裝逼,不扯淡,只嘮干貨,能做項目!
二、老師介紹
大林老師
是專業(yè)從事上位機視覺軟件的開發(fā)與培訓(xùn),多年從事上位機機器視覺相關(guān)項目開發(fā),對電氣人員學(xué)習(xí)C#開發(fā)視覺軟件有獨到的見解,即使您是零基礎(chǔ)或只要從事過電氣自動化相關(guān)工作的學(xué)員都能夠輕松快速學(xué)會。
三、校區(qū)介紹
大林上位機機器視覺培訓(xùn)機構(gòu),分為兩個校區(qū),蘇州校區(qū)(蘇州木瀆),常州校區(qū)(常州新北)
四、硬件設(shè)施
校區(qū)提供2000多平方的實訓(xùn)基地,完美的設(shè)備硬件配套,可以做到邊學(xué)習(xí)邊操作,鑒于本機構(gòu)隸屬于某自動化公司,學(xué)員可以配合邊學(xué)習(xí)邊配合公司開發(fā)人員完成項目,這樣學(xué)習(xí)起來事半功倍
五、畢業(yè)服務(wù)
學(xué)業(yè)完成后本公司可以擇優(yōu)錄取,在我們自動化公司的實習(xí),解決您的后顧之憂
六、課程對象
1.零基礎(chǔ)無任何相關(guān)知識
2.有電氣及PLC編程基礎(chǔ)的更容易入手
3.需要系統(tǒng)性提升整體能力
4.跨行業(yè)轉(zhuǎn)型
5.想擁有一份體面高收入
6.對自己前途迷茫
7.學(xué)歷低英語不好
七、課程特色
為您量身提供零基礎(chǔ)快速成為上位機及機器視覺軟件開發(fā)專家的學(xué)習(xí)方案
承接企事業(yè)單位定制個性化學(xué)員集體培訓(xùn)。
八、課程內(nèi)容
小白亦可通過學(xué)習(xí)成為工業(yè)軟件開發(fā)專家,從電氣圖,到梯形圖,到高級語言SCL,再到C#,突破高級語言難的瓶頸,輕松掌握。
從零開始,從電氣基本元件入手,跟隨課程遞進學(xué)習(xí),PLC,工業(yè)機器人,數(shù)據(jù)庫,運動控制器,上位機,機器視覺,統(tǒng)統(tǒng)一網(wǎng)打盡。
歡迎親臨現(xiàn)場咨詢,老師私人定制課程 ,學(xué)習(xí)更清晰!
九、授課方式
1、線下現(xiàn)場授課更直觀,知識點更易吸收,現(xiàn)場互動更易理解和運用。
1,贈送老師錄制課程隨時隨地輕松學(xué)習(xí)
2,贈送配套書籍不限環(huán)境隨意學(xué)習(xí)
3,課間和課后答疑知識掌握更牢固
4,現(xiàn)場設(shè)備隨意使用,人機結(jié)合熟練運用,加深知識理解。
5,老師指導(dǎo)完善簡歷,輕松上崗。
2、線上視頻錄播課程-整套
1,贈送配套書籍不限環(huán)境隨意學(xué)習(xí)
2,售后答疑輕松解答
3,福利:線下報名課程原價抵扣
3、 線上視頻課程+現(xiàn)場設(shè)備實操
1,贈送配套書籍不限環(huán)境隨意學(xué)習(xí)
2,售后答疑輕松解答
3,現(xiàn)場和課后答疑知識掌握更牢固
4,現(xiàn)場設(shè)備隨意使用,人機結(jié)合熟練運用,加深知識理解
5,福利:線下報名課程原價抵扣