《數(shù)字圖像處理》PPT課件.ppt

上傳人：tia****nde 文檔編號：14166625 上傳時間：2020-07-08 格式：PPT 頁數(shù)：137 大?。?.42MB

收藏版權(quán)申訴舉報下載

第1頁 / 共137頁

第2頁 / 共137頁

第3頁 / 共137頁

下載文檔到電腦，查找使用更方便

14.9 積分

下載資源

還剩頁未讀，繼續(xù)閱讀

資源描述：

《《數(shù)字圖像處理》PPT課件.ppt》由會員分享，可在線閱讀，更多相關(guān)《《數(shù)字圖像處理》PPT課件.ppt（137頁珍藏版）》請在裝配圖網(wǎng)上搜索。

1、數(shù)字圖像處理,鄧廷權(quán) 哈爾濱工程大學(xué)理學(xué)院,圖像處理的基本方法,圖像處理（image processing）對圖像加工的各種技術(shù)方法的統(tǒng)稱，它已被廣泛地應(yīng)用于許多領(lǐng)域。基本方法模擬圖像處理數(shù)字圖像處理,一、模擬圖像處理,包括光學(xué)圖像處理和電子圖像處理（電子光學(xué)處理）光學(xué)方法是圖像處理發(fā)展的起源，1946年法國的Duffienx提出傅立葉光學(xué)，1964年美國密執(zhí)安大學(xué)的A.Vanderlugt制成空間濾頻器光學(xué)處理具有處理速度快（可實時和并行處理，如電視模擬圖像處理可達25幀/秒或30幀/秒）、信息量大、分辨率高、經(jīng)濟等優(yōu)點模擬圖像處理的缺點是精度差、靈活性差，器件具有專用性，并且

2、缺乏判斷分析能力，不具備非線性處理能力趨勢：將光學(xué)處理和計算機相結(jié)合的方法，如利用光學(xué)方法對圖像進行傅立葉變換，再用計算機對頻譜分析,二、數(shù)字圖像處理,將圖像轉(zhuǎn)換成一個數(shù)據(jù)矩陣存放在圖像存儲器中，然后再利用數(shù)字計算機，或其它的大規(guī)模集成數(shù)字器件（如DSP），對圖像信息進行數(shù)字運算或處理，以提高圖像的質(zhì)量或達到人們所預(yù)期的其它效果優(yōu)點：精度高、處理內(nèi)容豐富、可以進行復(fù)雜的非線性處理，處理方式靈活，同樣的圖像硬件系統(tǒng)，在改變軟件之后可以用于其它完全不同的任務(wù) 缺點：由于目前計算機性能的限制，數(shù)字圖像處理的速度有限，對于一些有實時性要求的任務(wù)，必須利用DSP加速或構(gòu)建專用系統(tǒng),,廣義的數(shù)字圖像處

3、理是指從圖像獲取到圖像信息輸出的全過程，即圖像處理系統(tǒng) 與計算機應(yīng)用相關(guān)的設(shè)備圖像處理相關(guān)的方法有效軟件的實現(xiàn) 圖像處理軟件的應(yīng)用圖像信息在計算機中的表示圖像數(shù)據(jù)庫及檢索圖像信息應(yīng)用等狹義的數(shù)字圖像處理僅指其中對圖像信息進行處理,廣義圖像處理,圖像信息獲取，即獲取研究對象的圖像，并轉(zhuǎn)換成數(shù)字信號，以便于計算機或其它數(shù)字設(shè)備處理研究重點：圖像成像設(shè)備和數(shù)字化設(shè)備圖像信息的存儲圖像存儲設(shè)備，以及圖像存儲的格式、圖像壓縮標準以及圖像數(shù)據(jù)庫技術(shù)等圖像信息的傳送，包括內(nèi)部傳送與遠距離傳送內(nèi)部傳送多采用DMA（Direct Memory Access）；遠距離傳送圖像壓縮技術(shù)，減少占

4、用帶寬圖像信息處理，即狹義的圖像處理利用計算機可以實現(xiàn)的算法圖像的輸出與顯示，即為人或計算機提供便于理解以及識別的圖像軟拷貝與硬拷貝兩種形式,狹義的計算機圖像處理（一）,幾何處理坐標變換：圖像的放大與縮小、旋轉(zhuǎn)、移動圖像畸變校正幾何特征計算等算術(shù)與邏輯運算圖像的加減乘除，與或非等運算此類運算既簡單有效，又是其它處理的基礎(chǔ) 圖像增強根據(jù)任務(wù)目標突出圖像中感興趣的信息，消除干擾，改善圖像的視覺效果或增強便于機器識別的信息此三項是圖像預(yù)處理中常涉及的內(nèi)容,狹義的計算機圖像處理（二）,圖像復(fù)原根據(jù)圖像退化模型，消除退化因素，恢復(fù)原始的圖像。如散焦是造成圖像模糊的一個重要的因素

5、，而散焦模型可以通過實驗數(shù)據(jù)和理論分析獲得，利用逆濾波就可以消除散焦圖像編碼研究壓縮圖像數(shù)據(jù)的方法，需要研究并利用圖像的冗余特征，如統(tǒng)計冗余、生理視覺冗余、知識冗余等圖像分割根據(jù)圖像的某些特征將圖像劃分為不同的區(qū)域，以便于對圖像中的物體或目標進行分析與識別。如“機動車視覺系統(tǒng)”中根據(jù)圖像中的灰度信息分割白色導(dǎo)引線和路面,狹義的計算機圖像處理（三）,圖像重建前面六個研究方面輸入的是圖像，而圖像重建輸入的是非圖像信息，如數(shù)據(jù)、公式等，輸出為圖像。主要有卷積反投影法等。常用于醫(yī)學(xué)設(shè)備，CT等圖像模式識別在圖像分割的基礎(chǔ)上提取特征，對圖像中的內(nèi)容進行判決分類圖像分析與理解在圖像模式識

6、別的基礎(chǔ)上進一步發(fā)展，根據(jù)圖像局部內(nèi)容之間的關(guān)系，利用有關(guān)知識進行推理與聯(lián)想，對圖像中所表現(xiàn)的內(nèi)容進行理解,課程介紹,教材圖像處理和分析基礎(chǔ)，高等教育出版社，2004,課程介紹,參考資料李叔梁譯岡薩雷斯數(shù)字圖像處理1981 Kenneth R.CastlemanDigital Image Processing1998 陳彩廷譯羅森菲爾德數(shù)字圖像分析1987 吳健康數(shù)字圖像分析1989 R.CGonzalez，R.EWoodsDigital Image Processing，Addison-Wesley，Reading MA，1992,課程介紹,主要參考資料 Computer Vision

7、Graphics and Image Processing IEEE TransPattern Analysis & Machine Intelligence Pattern Recognition Pattern Recognition Letter Image and Vision Computing 模式識別與人工智能、中國圖像圖形學(xué)報計算機學(xué)報、自動化學(xué)報,第一章圖像技術(shù)基礎(chǔ),1.1圖像和像素 1.2圖像技術(shù)及分類 1.3圖像表示 1.4圖像顯示 1.5圖像存儲與格式 1.6* 視覺基礎(chǔ) 1.7* 顏色視覺和色度學(xué),1.1圖像,圖像(image) 在一般的意義下，可以認為一幅圖像就

8、是一個東西的一個表示，它包含了所表示物體的相關(guān)描述信息，出現(xiàn)形式多種多樣可視的和不可視的；抽象的和實際的；適于和不適于計算機處理的,一、按照圖像的存在形式分,（1）物理圖像 (physical images)物質(zhì)或能量的實際分布可見的圖像(visible image)：人眼可以看到并接受的圖像圖片 (picture)，包括照片 (photograph)、圖 (drawings指用線條畫成的)和畫 (paintings)，圖片等價于圖像，也就是說picture經(jīng)常和image一詞混用光圖像 (optical images)，即用透鏡、光柵和全息術(shù)產(chǎn)生的圖像，如熒幕、屏幕上出現(xiàn)的影像。

9、光(學(xué))圖像是光強度的空間分布不可見的圖像：如溫度、壓力、高度以及人口密度等的分布圖,,（2）抽象圖像即數(shù)學(xué)圖像，包括連續(xù)函數(shù)和離散函數(shù) 離散函數(shù)圖像就是計算機可以處理的形式物理圖像必須要變成離散函數(shù)才能被計算機處理,二、按照圖像的色彩特性分,彩色圖像，又稱為多光譜圖像圖像上的每個點有多于一個的局部特征彩色電視中重現(xiàn)的三基色圖像，每個像素點就需要有紅、綠、藍三個基色的三個亮度值表示。遙感圖像可以提供多達7個不同通道的信息黑白圖像，又稱灰度圖像、亮度圖像、單色圖像等每個像素點只有一個亮度值黑白照片黑白電視畫面,三、按照圖像的光譜特性分,可見光圖像紅外光圖像雷達圖像聲吶圖像

10、,四、按照圖像的時間特性分,靜止圖像不隨時間變化的圖像，如各類圖片動態(tài)圖像隨時間變化的圖像，如電視和電影畫面,圖像的類型,圖像信息的分類,三類符號信息景物信息情緒信息,圖像信息(1)符號信息,一般是用文字、符號、圖形等表示的具體的或抽象的事物電路圖、機械圖、打印的文件等，它們中包含有規(guī)則、含義明確的符號，這些圖像一般用二值圖像表示就足夠了，因為符號的顏色不提供新的有效信息，對圖像的理解沒有幫助地圖中也包含大量符號，但需要關(guān)注顏色信息，因為它們都有確定的物理含義，如藍色一般表示濕地，綠色的深淺也表明了海拔高度,圖像信息(2)景物信息,是一種能夠使人產(chǎn)生主觀感覺，但不取決于人本身的

11、客觀場景中包含的信息。景物信息內(nèi)容豐富，較難以表達，只有在明確目標的前提下，才能得到正確處理如衛(wèi)星云圖中蘊含著氣旋信息，氣旋的位置與強度是一種客觀存在,圖像信息(3)情緒信息,依賴于觀察者，如藝術(shù)圖片的效果就與觀看者本身的生理、心理、修養(yǎng)有很大的關(guān)系，此類信息無法刻畫,1.2圖像技術(shù)及分類,,幾個學(xué)科之間的關(guān)系,圖像處理（低級，像素）：圖像圖像圖像分析（中級，目標）：圖像數(shù)據(jù) 圖像理解（高級，符號）：數(shù)據(jù)、符號場景模式識別：圖像符號計算機圖形學(xué)（Computer Graphics）：數(shù)據(jù)圖像，用計算機將由概念或數(shù)學(xué)模型表示的物體（不是實物）進行處理，并顯示成圖像計算機視覺(Comp

12、uter Vision)：圖像場景，研究模擬人眼功能的理解自然景物的系統(tǒng) 數(shù)字成像(Digital Imaging)：更廣義的一個概念，涵蓋任何用計算機來操作（manipulate）與圖像有關(guān)數(shù)據(jù)的技術(shù)，包括計算機圖形學(xué)、計算機視覺、數(shù)字圖像處理與分析,不斷拓展的應(yīng)用領(lǐng)域,遙感(Remote Sensing) 生物醫(yī)學(xué)(Physic) 文件處理(File Manipulation) 科學(xué)研究(Science Research) 工業(yè)檢測(Industry Check) 機器人視覺(Robot Vision) 軍事(Military Affairs) 公安(Public Security) 其他

13、,公安(Public Security),身份辨識監(jiān)控不開箱檢查鑒定,身份的生物識別技術(shù),眼睛虹膜、視網(wǎng)膜手掌指紋語音面孔、臉部血管簽名基因氣味,眼睛：最可靠的身份證,虹膜：纖維組織，有250 以上的特征點每個虹膜的可識別特征可以得到512字節(jié)的資料，稱為虹膜代碼不同人眼的虹膜的60%左右的紋路是相同的，40%是不同的兩人同一只眼虹膜特征相同的概率是十萬分之一，兩眼相同的概率是一千億萬分之一視網(wǎng)膜：血管構(gòu)造也具有唯一性和穩(wěn)定性的特點，可能還更為有效（可獲得400個特征點,人眼虹膜識別系統(tǒng),手掌識別,一種最為快捷方便的方法識別手掌的幾何特征手掌放在錄入頭表面后，由

14、紅外相機獲取圖像。然后對手掌的整體形狀、手指和關(guān)節(jié)的形狀和長度進行測量，從而得到手掌的特征點準確度不是很高，不能對手掌的其它特征，比如掌紋、傷疤進行分析可利用的特征點約2050個,指紋：最成熟的識別技術(shù),從可靠性說，人與人之間，擁有相同指紋的概率為十億分之一每個指紋的特征點很多， “節(jié)點” ，也就是指紋紋路的分叉、終止或打圈處的坐標位置。通常，手指上有70個節(jié)點，他們同時具有7種以上的唯一的特征。根據(jù)美國聯(lián)邦調(diào)查局的研究，在可以用軟件識別的節(jié)點中，最多有7個或8個相同點進行指紋識別時，首先用指紋讀取設(shè)備獲得指紋的圖像，然后對原始圖像進行初步處理，使得更清晰。指紋識別軟件在指紋上找到節(jié)點

15、，并轉(zhuǎn)換成特定的數(shù)據(jù)。最后，通過模糊比較的方法，把這些數(shù)據(jù)與數(shù)據(jù)庫中的指紋數(shù)據(jù)進行比較，得到匹配結(jié)果最新進展，與指紋的深度信息融合，進一步提高了識別的可靠性和數(shù)據(jù)的獨特性,人臉識別：最友好、直接的系統(tǒng),人臉檢測（Face Detection）人臉表征（Face Representation）人臉鑒別（Face Identification）：即人臉識別表情分析(Facial Expression Analysis) 物理分類（Physical Classification）,筆跡識別：友善的生物識別技術(shù),專用簽名輸入板，用戶在板上留下自己的簽名，識別過程幾乎瞬間完成簽名力學(xué)辨識，

16、建立在其簽名時的力度上的。關(guān)鍵在于區(qū)分出不同的簽名部分，那些是習(xí)慣性的，那些是每次簽名是都不同的。這個系統(tǒng)主要對每個人簽名時筆的移動進行動態(tài)分析，如速度的變化、運筆的壓力、方向和筆劃的長度等，而不是簽名的圖像本身簽名識別的可靠性不是很高,1.3圖像表示,一、圖像的連續(xù)模型,1、基本的連續(xù)模型,圖像可以用灰度級G在x，y二維空間的連續(xù)變換來描述，即g(x,y)。時間序列圖像的描述為： g1(x,y),g2(x,y),,gt(x,y)或 g(x,y,t) 圖像處理 f(x,y)=Sg(x,y)(1) 式（1）中S可以是有意施加的某種處理方法，也可以是圖像系統(tǒng)中導(dǎo)致圖像退化的原因。 G(

17、x,y)=S-1f(x,y) (2) 式（2）是圖像復(fù)原的基本模型,2、照明反射模型,f(x,y)= i(x,y)r(x,y) 其中 0 i(x,y) Bm, 0 r(x,y) 1 i(x,y)照射分量，r(x,y)反射分量， Bm最大光照強度 gmin g gmax, gmin=imin rmin, gmax=imax rmax gmin，gmax是圖像灰度范圍該模型常用于同態(tài)濾波，計算機圖形：真實感模型,噪聲的模型,噪聲的特征噪聲的來源噪聲模型,（1）噪聲的特征,圖像信號f(x,y) 噪聲n(x,y)，隨機性的，可以用隨機過程來描述。一般常用統(tǒng)計特征來描述，如均值、方差、相關(guān)函數(shù)等

18、均值En(x,y)反映噪聲的直流分量均方值En2(x,y)反映噪聲的總功率均方差E(n(x,y)-En(x,y))2描述噪聲的交流功率均值的平方En(x,y)2，表示噪聲的直流功率,（2）噪聲的來源,外部噪聲從處理系統(tǒng)外來的影響，如電磁波干擾內(nèi)部噪聲 (1)由光和電的基本性質(zhì)引起的噪聲 (2)機械運動產(chǎn)生的噪聲 (3)元器件材料本身的缺陷帶來的噪聲 (4)系統(tǒng)內(nèi)部電路噪聲,噪聲分類,從統(tǒng)計觀點看平穩(wěn)噪聲凡是統(tǒng)計特征不隨時間變化的；非平穩(wěn)噪聲統(tǒng)計特征隨時間變化的。從噪聲幅度分布的統(tǒng)計來看其密度函數(shù)有高斯型、瑞利型等，分別稱為高斯噪聲和瑞利噪聲。按噪聲頻譜形狀命名的，如頻譜

19、均勻分布的噪聲稱為白噪聲，頻譜與頻率成反比的稱為1/f噪聲，頻譜與頻率平方成正比的稱為三角噪聲,（3）噪聲的模型,加法性噪聲 g(x,y)=f(x,y)+n(x,y) 乘法噪聲 g(x,y)=f(x,y)1+n(x,y)=f(x,y)+f(x,y)n(x,y),二、離散模型,數(shù)字圖像處理的幾個基本術(shù)語,數(shù)字化(digitizing) 將一幅圖像從其原來的形式轉(zhuǎn)換為數(shù)字形式的處理過程，包括“掃描”、“采樣”與“量化”三個步驟通常將“掃描”合并到“采樣”階段，合并為兩個過程,掃描（scanning）,將一個數(shù)學(xué)虛擬網(wǎng)格覆蓋在一幅圖像上，圖像的平面空間被離散化成一個個的有序的格子（格子的形式可以有

20、多種形式，通常易于物理實現(xiàn)的是矩形，且每個格子完全相同），然后按照格子的排列順序依次讀取圖像的信息，此讀取過程稱為“掃描”。在掃描過程中被讀取的小塊圖像稱為圖像元素(picture element)，簡稱像素(pixel)，它的描述包括空間坐標以及圖像信息兩個部分。不太嚴格的情況下，掃描也可以用作數(shù)字化的等價詞。矩形掃描網(wǎng)格常稱為光柵(raster),采樣(sampling),在一幅圖像的每個像素位置上測量灰度值。采樣通常是由一個圖像傳感元件完成，它將每個像素處的亮度轉(zhuǎn)換成與其成正比的電壓值。采樣完成圖像空間的數(shù)字化，在CCD攝像機中，是由一個個感光單元實現(xiàn)的。圖像數(shù)字化時必須遵守“采樣定

21、理”，才能保證圖像可恢復(fù) 奈奎斯準則：采樣頻率必須需大于等于被采樣信號的最大頻率的2倍,量化(quantization),將采樣時測量的灰度值轉(zhuǎn)化成整數(shù)表示由于數(shù)字計算機只能處理數(shù)字，因此必須將連續(xù)的測量值轉(zhuǎn)化為離散的整數(shù)。因此在圖像傳感器后面，經(jīng)常跟隨一個電子線路的模數(shù)轉(zhuǎn)換器(ADC)，將電壓值轉(zhuǎn)化成一個整數(shù) 經(jīng)過數(shù)字化得到一幅圖像的數(shù)字表示，即數(shù)字圖像f(x,y), f(x,y)以及x、y都是整數(shù),幾個重要概念,1、處理：讓某個事物受到一個過程的作用 2、過程（ process ）：指能導(dǎo)致某個所期望目標的一系列的動作或操作 3、數(shù)字圖像處理：對一個物體的數(shù)字表示施加一系列的操作，以得到

22、所期望的結(jié)果 4、數(shù)字圖像的限制性定義：一個被采樣和量化后的二維函數(shù)（該二維函數(shù)由光學(xué)方法產(chǎn)生），采用等距離矩形網(wǎng)格采樣，對幅度進行等間隔量化一幅數(shù)字圖像是一個被量化的采樣數(shù)值的二維矩陣,,6、顯示（display）：由一幅數(shù)字圖像生成一可見的、直觀的圖像 “回放”、“圖像重建”、“硬拷貝”、“圖像記錄” 顯示設(shè)備有暫時的、永久的兩類 10、對比度（contrast）：一幅圖像中灰度反差的大小 11、噪聲（noise）：加性的或乘法性的污染 12、采樣密度（sampling density）：圖像上單位長度包含的采樣點數(shù) 像素間距（pixel spacing）=1/采樣密度,,13、放大率

23、（magnification）：圖像中物體與其所對應(yīng)的景物中物體的比例關(guān)系 14、運算（operation）：注意運算前后圖像之間的對應(yīng)關(guān)系（1）全局運算：對整幅圖像同時處理（2）點運算：由對應(yīng)點決定（3）局部運算：由中心像素周圍的有關(guān)像素決定,數(shù)字圖像，數(shù)字化,（1）連續(xù)畫面空間坐標離散化采樣方形、三角形、正六角形點陣等（2）采樣點（像素）幅值（實數(shù)）取整量化均勻、非均勻/矢量、標量,1、圖像的均勻采樣,y,,,|x|,,,,二維采樣定理Nyquist采樣定理,對于二維有限帶寬信號fc(x,y)，如果其二維傅立葉變換只在 |u|Uc， |v|Vc 的范圍內(nèi)不為零，那么

24、采樣間隔必須滿足 x 1/2Uc， y 1/2Vc 這樣才能保證信號可以重構(gòu),2、圖像的量化,量化的準則是：若 fi f < fi+1 則g=gi,量化誤差,量化誤差量化失真由量化誤差產(chǎn)生的圖像失真最優(yōu)量化器量化均方誤差最小非線性,非均勻采樣和量化,非均勻采樣灰度級變化大區(qū)域精確采樣，平滑區(qū)域粗采樣非均勻量化灰度級變化劇烈處，人眼分辨力差，邊界附近較少灰度級；平緩區(qū)域較多灰度級，避免假輪廓,3、數(shù)字圖像的表示,數(shù)字圖像，矩陣元素：像元圖像元素：像素電視圖像：512512 128 一般圖像：256256 64,數(shù)字圖像舉例,矩陣,上圖中g(shù)(x,y)既可以表示整幅

25、圖像，也可以表示x行y列交點處的圖像的像素值，g(x,y)的值都是整數(shù) 圖像的數(shù)據(jù)量（bit）b=MNk 圖像清晰度（可分辨的細節(jié)的程度）取決于N和 k。N小，檢測板效應(yīng)； k小，假輪廓,只改變灰度級：8、16、32、64、128、256,只改變空間分辨率512、256、128、64、32、16,鄰域,四鄰域對角鄰域八鄰域,四鄰域與八鄰域,從數(shù)字圖像中抽取對稱鄰域,連通性,4-連通 8-連通 m-連通近鄰與通路連通域 4-連通域 8-連通域,,像素間距離歐氏距離(DE)：(x-s)2+(y-t)21/2 城區(qū)距離(D4)：|x-s|+|y-t| 棋盤距離(D8)：max(|x-s|，

26、|y-t|),1.4圖像顯示,圖像顯示圖像顯示設(shè)備：顯示器，打印設(shè)備等半調(diào)輸出半調(diào)輸出示例抖動技術(shù),1.5圖像存儲與格式,圖像存儲存儲量單位：比特（bit) 字節(jié)B（8bit）千字節(jié)KB（103B）兆MB(106B) 吉GB(109B) 太TB(1012B),,存儲器示例快速存儲器聯(lián)機存儲器數(shù)據(jù)庫存儲器圖像數(shù)據(jù)存儲格式矢量形式光柵形式,,圖像文件格式 BMP格式 GIF格式 TIFF格式 JPEG格式,常見圖像存儲格式,1.6*視覺基礎(chǔ),視覺生理/視覺特性/視覺模型視覺基礎(chǔ)/視覺應(yīng)用它們與圖像研究的關(guān)系見下圖,視覺研究與圖像的關(guān)系,1、圖像質(zhì)量評價與視覺心

27、理,對圖像質(zhì)量的最終評價是由人的感覺器官和心理狀態(tài)來決定的。與圖像內(nèi)容以及觀察者的心理因素有關(guān) 從圖像信息傳輸角度出發(fā)，圖像系統(tǒng)評價的真正尺度應(yīng)該是發(fā)出信息者的意圖為接收信息者所理解的程度，而不是對發(fā)出信息者發(fā)出的圖像象素信息集合的簡單接收,2、畫面組成和視覺心理,視野指眼球不動時所能見到的范圍如果把注視點作為中心，可見的范圍上方約65，下方約75，左右視角約為104 (現(xiàn)在的電視畫面約占78)，但視力好的部位僅限于中央23左右為了適應(yīng)大的畫面和立體景象的機理，眼球必須轉(zhuǎn)動使視線移動中心視力分辨率強，可以進行圖像細節(jié)的認識周邊視力分辨率差，可以將視目標特征部分檢出，利用檢出的目標圖像特

28、征去控制眼球運動另外周邊視可以認識圖像的全貌，而中心視只能認識圖像的一小部分要產(chǎn)生充分的臨場感，畫面尺寸應(yīng)該產(chǎn)生30以上視野，如寬銀幕電影,3、視覺的時空頻率分析,影響圖像銳度的主要因素。視覺神經(jīng)具有的Mach效應(yīng)和RocaSulzer微分效應(yīng)，中樞神經(jīng)的Craik-Obrien積分效應(yīng)等是視覺信息處理的基礎(chǔ)，因此可以將視覺特性和圖像處理結(jié)合起來研究空間分辨力人眼對空間景物細節(jié)的分辨能力有限，對黑白圖像約為一度時間分辨力對亮度的響應(yīng)有時延和殘留，因而對景物亮度的變化也有分辨力，過快的變化無法分辨視覺惰性。當(dāng)離散畫面的重復(fù)頻率不低于24Hz時，可形成連續(xù)畫面的感覺，即人眼不能分辨相

29、鄰兩幅畫面間的差別，而低于24Hz時，有閃爍感,4、視覺的時空頻率分析,人眼對畫面靜止部分的分辨率高于活動部分對靜止部分減少時間分辨率，而對活動部分減少空間分辨率，可以達到數(shù)據(jù)壓縮的效果。幅度分辨力人眼對景物亮度層次的分辨力也有限，過小的亮度差別無法分辨。對彩色圖像的色調(diào)和飽和度的分辨力人的視覺對彩色細節(jié)的分辨力要比亮度細節(jié)差，在國際無線電咨詢委員會（ITU-R，原CCIR）601標準中，就利用了這種特性，將色差信號的空間分辨率減半，仍可以得到非常好的圖像質(zhì)量。對立體圖像的景深分辨力等,5、視覺生理和模型的研究,視覺生理指視覺信息的產(chǎn)生部分視細胞(圖像信息感受器)和其它神經(jīng)細胞以

30、及大腦高級中樞的神經(jīng)系統(tǒng)的信息產(chǎn)生、傳輸和處理的機理插入單個細胞的微小電極側(cè)抑制現(xiàn)象、馬赫效應(yīng)等對大腦高級神經(jīng)中樞的“思考過程”才剛起步,人類視覺機制今后的研究方向,從基礎(chǔ)研究逐步轉(zhuǎn)到和圖像相關(guān)的視覺綜合化、體系化的研究搞清決定圖像質(zhì)量的主觀因素，做出其總的結(jié)構(gòu)模型找出人腦真正接收信息的容量，大腦有效接收圖像的顯示方式弄清圖像信源和信宿的結(jié)構(gòu)，建立起包括人的因素在內(nèi)的信息論研究視覺和其它感覺的相乘作用，即視覺和其它感覺的互相影響開發(fā)自組織作用的綜合研究，進一步建立發(fā)展“思考過程” 研究視覺和行為的關(guān)系,人類視覺感知過程,人眼結(jié)構(gòu) 眼睛中圖像的形成視覺特性,人眼的結(jié)構(gòu),,視覺生

31、理特點對圖像處理方法的影響很大,,錐狀（cone）視覺：白晝視覺，色彩桿狀（rod）視覺：夜視覺，低照度敏感視錐細胞和視桿細胞在視網(wǎng)膜上的分布,眼睛中圖像的形成,成像的幾何原理視覺信息的產(chǎn)生視覺信息的傳遞視覺信息的加工處理,（1）成像的幾何原理,當(dāng)晶狀體的折射能力由最小變到最大時，晶狀體的聚焦中心與視網(wǎng)膜之間的距離由17mm縮小到14mm。當(dāng)眼睛聚焦到遠于3m的物體時，晶狀體的折射能力最弱，當(dāng)聚焦到非常近的物體時，其折射能力最強,用眼睛觀察樹的光學(xué)表示法，C點為晶狀體的光學(xué)中心,成像尺寸計算,觀測者看一個距離100m，高15m的樹：設(shè)x表示視網(wǎng)膜上形成的圖像

32、的大小，單位mm，則有 15/100=x/17, x=2.55mm,（2）視覺信息的產(chǎn)生,光化電過程色覺理論主要有兩種三色學(xué) 三種視色素，對光的影響峰值分別在紅、綠、藍區(qū)，綜合后形成色覺信息四色學(xué)說三對視色素(白-黑，紅-綠，黃-藍)，它們的組合響應(yīng)產(chǎn)生色覺信息,人類感光細胞的敏感曲線,三種不同頻率響應(yīng)的錐，各對紅、綠、藍具有最強的響應(yīng)，彩色的識別功能,（3）視覺信息的傳遞,眼球內(nèi) 眼球外,（4）視覺信息的加工處理,簡單型細胞檢測圖像的明暗邊界和線條的位置和方向，復(fù)雜型細胞對直線和邊界的運動方向敏感，低級超復(fù)雜型細胞檢測直線和邊界的長度、寬度，而高級超復(fù)雜型細胞可以檢測曲線和

33、邊緣曲度等,視覺特性,亮度適應(yīng)與鑒別分辨力對比靈敏度同時對比效應(yīng) 閾值效應(yīng)和掩蓋效應(yīng) 視覺運動特性視覺空間頻率特性視覺時間頻率特性,主觀亮度感受特性,,分辨力,在不同的亮度適應(yīng)級，人眼的分辨力不同，如圖所示，I是背景光強，I是光強的變化，稱log(I/I) 為韋伯比，表示光強分辨力,光強分辨力的典型韋伯比,對比靈敏度,,同時對比效應(yīng),心理學(xué)實驗表明，人眼感受到的亮度不是光強的簡單函數(shù)，如馬赫帶效應(yīng)和同時對比效應(yīng),馬赫帶效應(yīng),同時對比效應(yīng),視覺閾值效應(yīng)和掩蓋效應(yīng),視覺閾值正好可以被看到的刺激（干擾或失真）值，它是一個統(tǒng)計值，在圖像質(zhì)量的主觀評價中有廣泛的應(yīng)用掩蓋效應(yīng) 視覺閾值隨圖像

34、內(nèi)容的變化而變化，在平坦區(qū)閾值低，對失真也敏感；在邊緣和紋理區(qū)，視覺存在掩蓋效應(yīng)，對失真不敏感,視覺運動特性,周邊視力對圖像中運動變化部分很靈敏，有特征抽取作用，從而控制眼肌轉(zhuǎn)動視軸，使視力集中對準這些部位，以便看清其細節(jié) 電視眼球標記攝像機(television eye-marker camera)試驗,視覺空間頻率特性,亮暗在空間上作正弦變化的條紋圖案，物理對比度和感覺對比度之比隨空間頻率變化而變化的曲線，稱為調(diào)制傳遞函數(shù)MTF( Modulation Transfer Function),閃爍對MTF的影響,閃爍頻率為1HZ 閃爍頻率為6HZ 閃爍頻率為16HZ 閃爍頻率為20HZ,對

35、比靈敏度,300 100 30 10 3,0.3 1 3 10 30,,,,,,,,空間頻率/cdeg-1,,,,,,,,,,,,,,,視覺時間頻率特性,,視覺的簡單數(shù)學(xué)模型,亮度視覺模型彩色視覺模型,1、亮度視覺模型,,線性光學(xué)系統(tǒng),光學(xué)系統(tǒng)的調(diào)制傳遞函數(shù)MTF,黑白視覺對數(shù)模型,,簡單的黑白視覺對數(shù)模型,視覺信息的融合,,|H3(Wx,Wy)|,黑白視覺擴展模型,ThomasYoung三色假說,2、彩色視覺模型,彩色響應(yīng),在上圖模型中，e1、e2、e3代表視網(wǎng)膜三個具有S1()、S2()、S3()譜靈敏度的感受器，其輸出分別為 C()為入射光譜的能量分布函數(shù),彩色信息融合,

36、e1、e2、e3經(jīng)對數(shù)傳遞后合并為d1、d2、d3并輸出：,色譜靈敏度曲線,彩色視覺擴展型模型,1.7*顏色視覺和色度學(xué),3個基本顏色紅（R, red）、綠(G, green)和藍( B, blue) 國際照明委員會（CIE），1931年規(guī)定3種基本色的波長為R:700nm, G:546.1nm, B:435.8nm,三色系統(tǒng),利用3基色疊加可產(chǎn)生光的3補色：品紅（M, magenta，即紅加藍）、藍綠（C, cyan，即綠加藍）、黃（Y, yellow，即紅加綠）。按一定的比例混合3基色或?qū)?個補色與相對的基色混合就可以產(chǎn)生白色。光的混合滿足加色定理,顏色特征,區(qū)分顏色通常用3種基本特性：

37、輝度（又常用亮度、明度）色調(diào) 飽和度色調(diào)和飽和度合起來稱為色度。顏色可以用輝度和色度共同表示,坐標系,顏色還可以用色品值r、g、b（相對色系數(shù)）表示，定義如下，為組成某種顏色所需的紅、綠、藍的量稱為3個刺激量，分別用R、G、B表示： C=rR+gG+bB 其中,彩色匹配規(guī)則,任何彩色可以用不多于三個基色配成混合色的光亮度等于各分量亮度之和人眼不能分解混合彩色的各個分量在某一亮度等級上的彩色匹配可適用于較寬的亮度范圍彩色相加定律：若一彩色C1與彩色C2相匹配（同樣彩色感覺），而彩色C1與彩色C2相混合的彩色匹配，可以如下表示 C1=C2，即C1彩色與C2彩色相匹配 1C1+2 C2，

38、即一混合色包含1份的C1和2份的C2 彩色相加定律表示為若 C1=C2， C1=C2 則1C1+2 C2= 1C1+2 C2,彩色匹配,彩色相減：當(dāng)C1、C2混合色與C1、C2混合色相匹配時，若C2與C2相匹配，則C1和C1也匹配，即已知 C1+ C2= C1+C2，若 C2=C2，則 C1=C1 轉(zhuǎn)移定律：若C1與C2 匹配， C2 又與C3匹配，則C1與C3匹配，即已知C2= C1， C2= C3，則 C1= C3 匹配定律（Grassman定理）：在亮度既不太高，也不太低的條件下，有三種配色方案 C=1C1+2 C2+3C3 C+1C1=2 C2+3C3 C+1C1+2 C

39、2=3C3,色度圖,色品坐標系,xyz相對三色系數(shù) （色品坐標） x+y+z=1,(x,y) CIE色度圖對應(yīng)于 x=y=0.33的 E點，稱等能量點，為CIE標準白光,通用的彩色模型,RGB模型 HSI模型,RGB模型,（1）RGB模型,視覺生理模型色調(diào)（H，Hue）、色飽和度（S，Saturation）以及明度（I，Intensity）（Museum，孟塞爾顏色系統(tǒng)）在特定應(yīng)用環(huán)境中，用于圖像分析有特殊的優(yōu)勢在只有光照亮度發(fā)生變化的應(yīng)用中，不考慮明度，只使用色度進行區(qū)域分割,（2）HSI模型,,,,RGB到HSI,HSI到RGB,顏色特征豐富了圖像處理的方法,色彩的識別，色彩分解，

40、提取特征。濾色鏡，遙感、著色后細胞,4、其他顏色空間（模型）,（1）YUV模型：適用于PAL和SECAM彩色電視制式，Y：亮度，U，V表示色差,,（）YCbCr：以演播室質(zhì)量標準為目標的CCIR601編碼方案采用的顏色模型，Y：亮度，Cb和Cr表示色度,,（3）YIQ：適用于NTSC彩色電視制式，Y：亮度，I和Q表示色度,,（4）L*u*v*：CIE1976發(fā)布，L*：米制明度，u*和v*表示米制色度（色度和飽和度),,X,Y,Z是所考察顏色對應(yīng)的三基色的三個刺激量，X0,Y0,Z0是該顏色在完全漫反色時的三個刺激值兩種顏色的色差為,,（5）L*a*b*：也是CIE1976發(fā)布，L*：米制明度，a*和b*表示米制色度（色度和飽和度) ，分別表示該顏色中紅色和黃色所占的比重,,兩種顏色的色差為 a*和b*表示該顏色中紅色和黃色的補色所占的比重,本章要點,1.1有關(guān)圖像和像素的基本概念 1.2圖像技術(shù)的三個層次：圖像處理、圖像分析和圖像理解 1.3圖像表示方法和鄰域的概念 1.4圖像顯示設(shè)備和技術(shù) 1.5圖像存儲器和圖像文件格式 1.6視覺基礎(chǔ)和亮度知覺 1.7顏色視覺和色度學(xué),

展開閱讀全文

溫馨提示:
1: 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

點擊下載此資源

《數(shù)字圖像處理》PPT課件.ppt

最新文檔

相關(guān)資源

相關(guān)搜索