《數(shù)字圖像處理》PPT課件.ppt
《《數(shù)字圖像處理》PPT課件.ppt》由會員分享,可在線閱讀,更多相關(guān)《《數(shù)字圖像處理》PPT課件.ppt(137頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、數(shù)字圖像處理,鄧廷權(quán) 哈爾濱工程大學(xué)理學(xué)院,圖像處理的基本方法,圖像處理(image processing) 對圖像加工的各種技術(shù)方法的統(tǒng)稱,它已被廣泛地應(yīng)用于許多領(lǐng)域。 基本方法 模擬圖像處理 數(shù)字圖像處理,一、模擬圖像處理,包括光學(xué)圖像處理和電子圖像處理(電子光學(xué)處理) 光學(xué)方法是圖像處理發(fā)展的起源,1946年法國的Duffienx提出傅立葉光學(xué),1964年美國密執(zhí)安大學(xué)的A.Vanderlugt制成空間濾頻器 光學(xué)處理具有處理速度快(可實時和并行處理,如電視模擬圖像處理可達25幀/秒或30幀/秒)、信息量大、分辨率高、經(jīng)濟等優(yōu)點 模擬圖像處理的缺點是精度差、靈活性差,器件具有專用性,并且
2、缺乏判斷分析能力,不具備非線性處理能力 趨勢:將光學(xué)處理和計算機相結(jié)合的方法,如利用光學(xué)方法對圖像進行傅立葉變換,再用計算機對頻譜分析,二、數(shù)字圖像處理,將圖像轉(zhuǎn)換成一個數(shù)據(jù)矩陣存放在圖像存儲器中,然后再利用數(shù)字計算機,或其它的大規(guī)模集成數(shù)字器件(如DSP),對圖像信息進行數(shù)字運算或處理,以提高圖像的質(zhì)量或達到人們所預(yù)期的其它效果 優(yōu)點:精度高、處理內(nèi)容豐富、可以進行復(fù)雜的非線性處理,處理方式靈活,同樣的圖像硬件系統(tǒng),在改變軟件之后可以用于其它完全不同的任務(wù) 缺點:由于目前計算機性能的限制,數(shù)字圖像處理的速度有限,對于一些有實時性要求的任務(wù),必須利用DSP加速或構(gòu)建專用系統(tǒng),,廣義的數(shù)字圖像處
3、理是指從圖像獲取到圖像信息輸出的全過程,即圖像處理系統(tǒng) 與計算機應(yīng)用相關(guān)的設(shè)備 圖像處理相關(guān)的方法 有效軟件的實現(xiàn) 圖像處理軟件的應(yīng)用 圖像信息在計算機中的表示 圖像數(shù)據(jù)庫及檢索 圖像信息應(yīng)用等 狹義的數(shù)字圖像處理僅指其中對圖像信息進行處理,廣義圖像處理,圖像信息獲取,即獲取研究對象的圖像,并轉(zhuǎn)換成數(shù)字信號,以便于計算機或其它數(shù)字設(shè)備處理 研究重點:圖像成像設(shè)備和數(shù)字化設(shè)備 圖像信息的存儲 圖像存儲設(shè)備,以及圖像存儲的格式、圖像壓縮標準以及圖像數(shù)據(jù)庫技術(shù)等 圖像信息的傳送,包括內(nèi)部傳送與遠距離傳送 內(nèi)部傳送多采用DMA(Direct Memory Access);遠距離傳送圖像壓縮技術(shù),減少占
4、用帶寬 圖像信息處理,即狹義的圖像處理 利用計算機可以實現(xiàn)的算法 圖像的輸出與顯示,即為人或計算機提供便于理解以及識別的圖像 軟拷貝與硬拷貝兩種形式,狹義的計算機圖像處理(一),幾何處理 坐標變換:圖像的放大與縮小、旋轉(zhuǎn)、移動 圖像畸變校正 幾何特征計算等 算術(shù)與邏輯運算 圖像的加減乘除,與或非等運算 此類運算既簡單有效,又是其它處理的基礎(chǔ) 圖像增強 根據(jù)任務(wù)目標突出圖像中感興趣的信息,消除干擾,改善圖像的視覺效果或增強便于機器識別的信息 此三項是圖像預(yù)處理中常涉及的內(nèi)容,狹義的計算機圖像處理(二),圖像復(fù)原 根據(jù)圖像退化模型,消除退化因素,恢復(fù)原始的圖像。如散焦是造成圖像模糊的一個重要的因素
5、,而散焦模型可以通過實驗數(shù)據(jù)和理論分析獲得,利用逆濾波就可以消除散焦 圖像編碼 研究壓縮圖像數(shù)據(jù)的方法,需要研究并利用圖像的冗余特征,如統(tǒng)計冗余、生理視覺冗余、知識冗余等 圖像分割 根據(jù)圖像的某些特征將圖像劃分為不同的區(qū)域,以便于對圖像中的物體或目標進行分析與識別。如“機動車視覺系統(tǒng)”中根據(jù)圖像中的灰度信息分割白色導(dǎo)引線和路面,狹義的計算機圖像處理(三),圖像重建 前面六個研究方面輸入的是圖像,而圖像重建輸入的是非圖像信息,如數(shù)據(jù)、公式等,輸出為圖像。主要有卷積反投影法等。常用于醫(yī)學(xué)設(shè)備,CT等 圖像模式識別 在圖像分割的基礎(chǔ)上提取特征,對圖像中的內(nèi)容進行判決分類 圖像分析與理解 在圖像模式識
6、別的基礎(chǔ)上進一步發(fā)展,根據(jù)圖像局部內(nèi)容之間的關(guān)系,利用有關(guān)知識進行推理與聯(lián)想,對圖像中所表現(xiàn)的內(nèi)容進行理解,課程介紹,教材 圖像處理和分析基礎(chǔ),高等教育出版社,2004,課程介紹,參考資料 李叔梁譯岡薩雷斯數(shù)字圖像處理1981 Kenneth R.CastlemanDigital Image Processing1998 陳彩廷譯羅森菲爾德數(shù)字圖像分析1987 吳健康數(shù)字圖像分析1989 R.CGonzalez,R.EWoodsDigital Image Processing,Addison-Wesley,Reading MA,1992,課程介紹,主要參考資料 Computer Vision
7、Graphics and Image Processing IEEE TransPattern Analysis & Machine Intelligence Pattern Recognition Pattern Recognition Letter Image and Vision Computing 模式識別與人工智能、中國圖像圖形學(xué)報 計算機學(xué)報、自動化學(xué)報,第一章圖像技術(shù)基礎(chǔ),1.1圖像和像素 1.2圖像技術(shù)及分類 1.3圖像表示 1.4圖像顯示 1.5圖像存儲與格式 1.6* 視覺基礎(chǔ) 1.7* 顏色視覺和色度學(xué),1.1圖像,圖像(image) 在一般的意義下,可以認為一幅圖像就
8、是一個東西的一個表示,它包含了所表示物體的相關(guān)描述信息,出現(xiàn)形式多種多樣 可視的和不可視的; 抽象的和實際的; 適于和不適于計算機處理的,一、按照圖像的存在形式分,(1)物理圖像 (physical images)物質(zhì)或能量的實際分布 可見的圖像(visible image):人眼可以看到并接受的圖像 圖片 (picture),包括照片 (photograph)、圖 (drawings指用線條畫成的)和畫 (paintings),圖片等價于圖像,也就是說picture經(jīng)常和image一詞混用 光圖像 (optical images),即用透鏡、光柵和全息術(shù)產(chǎn)生的圖像,如熒幕、屏幕上出現(xiàn)的影像。
9、光(學(xué))圖像是光強度的空間分布 不可見的圖像:如溫度、壓力、高度以及人口密度等的分布圖,,(2)抽象圖像 即數(shù)學(xué)圖像,包括連續(xù)函數(shù)和離散函數(shù) 離散函數(shù)圖像就是計算機可以處理的形式 物理圖像必須要變成離散函數(shù)才能被計算機處理,二、按照圖像的色彩特性分,彩色圖像,又稱為多光譜圖像 圖像上的每個點有多于一個的局部特征 彩色電視中重現(xiàn)的三基色圖像,每個像素點就需要有紅、綠、藍三個基色的三個亮度值表示。遙感圖像可以提供多達7個不同通道的信息 黑白圖像,又稱灰度圖像、亮度圖像、單色圖像等 每個像素點只有一個亮度值 黑白照片 黑白電視畫面,三、按照圖像的光譜特性分,可見光圖像 紅外光圖像 雷達圖像 聲吶圖像
10、,四、按照圖像的時間特性分,靜止圖像 不隨時間變化的圖像,如各類圖片 動態(tài)圖像 隨時間變化的圖像,如電視和電影畫面,圖像的類型,圖像信息的分類,三類 符號信息 景物信息 情緒信息,圖像信息(1)符號信息,一般是用文字、符號、圖形等表示的具體的或抽象的事物 電路圖、機械圖、打印的文件等,它們中包含有規(guī)則、含義明確的符號,這些圖像一般用二值圖像表示就足夠了,因為符號的顏色不提供新的有效信息,對圖像的理解沒有幫助 地圖中也包含大量符號,但需要關(guān)注顏色信息,因為它們都有確定的物理含義,如藍色一般表示濕地,綠色的深淺也表明了海拔高度,圖像信息(2)景物信息,是一種能夠使人產(chǎn)生主觀感覺,但不取決于人本身的
11、客觀場景中包含的信息。景物信息內(nèi)容豐富,較難以表達,只有在明確目標的前提下,才能得到正確處理 如衛(wèi)星云圖中蘊含著氣旋信息,氣旋的位置與強度是一種客觀存在,圖像信息(3)情緒信息,依賴于觀察者,如藝術(shù)圖片的效果就與觀看者本身的生理、心理、修養(yǎng)有很大的關(guān)系,此類信息無法刻畫,1.2圖像技術(shù)及分類,,幾個學(xué)科之間的關(guān)系,圖像處理(低級,像素):圖像圖像 圖像分析(中級,目標):圖像數(shù)據(jù) 圖像理解(高級,符號):數(shù)據(jù)、符號場景 模式識別 :圖像符號 計算機圖形學(xué)(Computer Graphics):數(shù)據(jù)圖像,用計算機將由概念或數(shù)學(xué)模型表示的物體(不是實物)進行處理,并顯示成圖像 計算機視覺(Comp
12、uter Vision):圖像場景,研究模擬人眼功能的理解自然景物的系統(tǒng) 數(shù)字成像(Digital Imaging):更廣義的一個概念,涵蓋任何用計算機來操作(manipulate)與圖像有關(guān)數(shù)據(jù)的技術(shù),包括計算機圖形學(xué)、計算機視覺、數(shù)字圖像處理與分析,不斷拓展的應(yīng)用領(lǐng)域,遙感(Remote Sensing) 生物醫(yī)學(xué)(Physic) 文件處理(File Manipulation) 科學(xué)研究(Science Research) 工業(yè)檢測(Industry Check) 機器人視覺(Robot Vision) 軍事(Military Affairs) 公安(Public Security) 其他
13、,公安(Public Security),身份辨識 監(jiān)控 不開箱檢查 鑒定,身份的生物識別技術(shù),眼睛虹膜、視網(wǎng)膜 手掌 指紋 語音 面孔、臉部血管 簽名 基因 氣味,眼睛:最可靠的身份證,虹膜:纖維組織,有250 以上的特征點 每個虹膜的可識別特征可以得到512字節(jié)的資料,稱為虹膜代碼 不同人眼的虹膜的60%左右的紋路是相同的,40%是不同的 兩人同一只眼虹膜特征相同的概率是十萬分之一,兩眼相同的概率是一千億萬分之一 視網(wǎng)膜:血管構(gòu)造也具有唯一性和穩(wěn)定性的特點,可能還更為有效(可獲得400個特征點,人眼虹膜識別系統(tǒng),手掌識別,一種最為快捷方便的方法 識別手掌的幾何特征 手掌放在錄入頭表面后,由
14、紅外相機獲取圖像。然后對手掌的整體形狀、手指和關(guān)節(jié)的形狀和長度進行測量,從而得到手掌的特征點 準確度不是很高,不能對手掌的其它特征,比如掌紋、傷疤進行分析 可利用的特征點約2050個,指紋:最成熟的識別技術(shù),從可靠性說,人與人之間,擁有相同指紋的概率為十億分之一 每個指紋的特征點很多, “節(jié)點” ,也就是指紋紋路的分叉、終止或打圈處的坐標位置。通常,手指上有70個節(jié)點,他們同時具有7種以上的唯一的特征。根據(jù)美國聯(lián)邦調(diào)查局的研究,在可以用軟件識別的節(jié)點中,最多有7個或8個相同點 進行指紋識別時,首先用指紋讀取設(shè)備獲得指紋的圖像,然后對原始圖像進行初步處理,使得更清晰。指紋識別軟件在指紋上找到節(jié)點
15、,并轉(zhuǎn)換成特定的數(shù)據(jù)。最后,通過模糊比較的方法,把這些數(shù)據(jù)與數(shù)據(jù)庫中的指紋數(shù)據(jù)進行比較,得到匹配結(jié)果 最新進展,與指紋的深度信息融合,進一步提高了識別的可靠性和數(shù)據(jù)的獨特性,人臉識別 :最友好、直接的系統(tǒng),人臉檢測(Face Detection) 人臉表征(Face Representation) 人臉鑒別(Face Identification):即人臉識別 表情分析(Facial Expression Analysis) 物理分類(Physical Classification),筆跡識別 :友善的生物識別技術(shù),專用簽名輸入板,用戶在板上留下自己的簽名,識別過程幾乎瞬間完成 簽名力學(xué)辨識,
16、建立在其簽名時的力度上的。關(guān)鍵在于區(qū)分出不同的簽名部分,那些是習(xí)慣性的,那些是每次簽名是都不同的。這個系統(tǒng)主要對每個人簽名時筆的移動進行動態(tài)分析,如速度的變化、運筆的壓力、方向和筆劃的長度等,而不是簽名的圖像本身 簽名識別的可靠性不是很高,1.3圖像表示,一、圖像的連續(xù)模型,1、基本的連續(xù)模型,圖像可以用灰度級G在x,y二維空間的連續(xù)變換來描述,即g(x,y)。時間序列圖像的描述為: g1(x,y),g2(x,y),,gt(x,y)或 g(x,y,t) 圖像處理 f(x,y)=Sg(x,y)(1) 式(1)中S可以是有意施加的某種處理方法,也可以是圖像系統(tǒng)中導(dǎo)致圖像退化的原因。 G(
17、x,y)=S-1f(x,y) (2) 式(2)是圖像復(fù)原的基本模型,2、照明反射模型,f(x,y)= i(x,y)r(x,y) 其中 0 i(x,y) Bm, 0 r(x,y) 1 i(x,y)照射分量,r(x,y)反射分量, Bm最大光照強度 gmin g gmax, gmin=imin rmin, gmax=imax rmax gmin,gmax是圖像灰度范圍 該模型常用于同態(tài)濾波,計算機圖形:真實感模型,噪聲的模型,噪聲的特征 噪聲的來源 噪聲模型,(1)噪聲的特征,圖像信號f(x,y) 噪聲n(x,y),隨機性的,可以用隨機過程來描述。一般常用統(tǒng)計特征來描述,如均值、方差、相關(guān)函數(shù)等
18、均值En(x,y)反映噪聲的直流分量 均方值En2(x,y)反映噪聲的總功率 均方差E(n(x,y)-En(x,y))2描述噪聲的交流功率 均值的平方En(x,y)2,表示噪聲的直流功率,(2)噪聲的來源,外部噪聲 從處理系統(tǒng)外來的影響,如電磁波干擾 內(nèi)部噪聲 (1)由光和電的基本性質(zhì)引起的噪聲 (2)機械運動產(chǎn)生的噪聲 (3)元器件材料本身的缺陷帶來的噪聲 (4)系統(tǒng)內(nèi)部電路噪聲,噪聲分類,從統(tǒng)計觀點看 平穩(wěn)噪聲 凡是統(tǒng)計特征不隨時間變化的; 非平穩(wěn)噪聲 統(tǒng)計特征隨時間變化的。 從噪聲幅度分布的統(tǒng)計來看 其密度函數(shù)有高斯型、瑞利型等,分別稱為高斯噪聲和瑞利噪聲。 按噪聲頻譜形狀命名的,如頻譜
19、均勻分布的噪聲稱為白噪聲,頻譜與頻率成反比的稱為1/f噪聲,頻譜與頻率平方成正比的稱為三角噪聲,(3)噪聲的模型,加法性噪聲 g(x,y)=f(x,y)+n(x,y) 乘法噪聲 g(x,y)=f(x,y)1+n(x,y)=f(x,y)+f(x,y)n(x,y),二、離散模型,數(shù)字圖像處理的幾個基本術(shù)語,數(shù)字化(digitizing) 將一幅圖像從其原來的形式轉(zhuǎn)換為數(shù)字形式的處理過程,包括“掃描”、“采樣”與“量化”三個步驟 通常將“掃描”合并到“采樣”階段,合并為兩個過程,掃描(scanning),將一個數(shù)學(xué)虛擬網(wǎng)格覆蓋在一幅圖像上,圖像的平面空間被離散化成一個個的有序的格子(格子的形式可以有
20、多種形式,通常易于物理實現(xiàn)的是矩形,且每個格子完全相同),然后按照格子的排列順序依次讀取圖像的信息,此讀取過程稱為“掃描”。在掃描過程中被讀取的小塊圖像稱為圖像元素(picture element),簡稱像素(pixel),它的描述包括空間坐標以及圖像信息兩個部分。不太嚴格的情況下,掃描也可以用作數(shù)字化的等價詞。矩形掃描網(wǎng)格常稱為光柵(raster),采樣(sampling),在一幅圖像的每個像素位置上測量灰度值。 采樣通常是由一個圖像傳感元件完成,它將每個像素處的亮度轉(zhuǎn)換成與其成正比的電壓值。采樣完成圖像空間的數(shù)字化,在CCD攝像機中,是由一個個感光單元實現(xiàn)的。 圖像數(shù)字化時必須遵守“采樣定
21、理”,才能保證圖像可恢復(fù) 奈奎斯準則:采樣頻率必須需大于等于被采樣信號的最大頻率的2倍,量化(quantization),將采樣時測量的灰度值轉(zhuǎn)化成整數(shù)表示 由于數(shù)字計算機只能處理數(shù)字,因此必須將連續(xù)的測量值轉(zhuǎn)化為離散的整數(shù)。因此在圖像傳感器后面,經(jīng)常跟隨一個電子線路的模數(shù)轉(zhuǎn)換器(ADC),將電壓值轉(zhuǎn)化成一個整數(shù) 經(jīng)過數(shù)字化得到一幅圖像的數(shù)字表示,即數(shù)字圖像f(x,y), f(x,y)以及x、y都是整數(shù),幾個重要概念,1、處理:讓某個事物受到一個過程的作用 2、過程( process ):指能導(dǎo)致某個所期望目標的一系列的動作或操作 3、數(shù)字圖像處理:對一個物體的數(shù)字表示施加一系列的操作,以得到
22、所期望的結(jié)果 4、數(shù)字圖像的限制性定義:一個被采樣和量化后的二維函數(shù)(該二維函數(shù)由光學(xué)方法產(chǎn)生),采用等距離矩形網(wǎng)格采樣,對幅度進行等間隔量化 一幅數(shù)字圖像是一個被量化的采樣數(shù)值的二維矩陣,,6、顯示(display):由一幅數(shù)字圖像生成一可見的、直觀的圖像 “回放”、“圖像重建”、“硬拷貝”、“圖像記錄” 顯示設(shè)備有暫時的、永久的兩類 10、對比度(contrast):一幅圖像中灰度反差的大小 11、噪聲(noise):加性的或乘法性的污染 12、采樣密度(sampling density):圖像上單位長度包含的采樣點數(shù) 像素間距(pixel spacing)=1/采樣密度,,13、放大率
23、(magnification):圖像中物體與其所對應(yīng)的景物中物體的比例關(guān)系 14、運算(operation):注意運算前后圖像之間的對應(yīng)關(guān)系 (1)全局運算:對整幅圖像同時處理 (2)點運算:由對應(yīng)點決定 (3)局部運算:由中心像素周圍的有關(guān)像素決定,數(shù)字圖像,數(shù)字化,(1)連續(xù)畫面空間坐標離散化采樣 方形、三角形、正六角形點陣等 (2)采樣點(像素)幅值(實數(shù))取整量化 均勻、非均勻/矢量、標量,1、圖像的均勻采樣,y,,,|x|,,,,二維采樣定理Nyquist采樣定理,對于二維有限帶寬信號fc(x,y),如果其二維傅立葉變換只在 |u|Uc, |v|Vc 的范圍內(nèi)不為零,那么
24、采樣間隔必須滿足 x 1/2Uc, y 1/2Vc 這樣才能保證信號可以重構(gòu),2、圖像的量化,量化的準則是:若 fi f < fi+1 則g=gi,量化誤差,量化誤差 量化失真 由量化誤差產(chǎn)生的圖像失真 最優(yōu)量化器量化均方誤差最小 非線性,非均勻采樣和量化,非均勻采樣 灰度級變化大區(qū)域精確采樣,平滑區(qū)域粗采樣 非均勻量化 灰度級變化劇烈處,人眼分辨力差,邊界附近較少灰度級; 平緩區(qū)域較多灰度級,避免假輪廓,3、數(shù)字圖像的表示,數(shù)字圖像,矩陣元素:像元 圖像元素:像素 電視圖像:512512 128 一般圖像:256256 64,數(shù)字圖像舉例,矩陣,上圖中g(shù)(x,y)既可以表示整幅
25、圖像,也可以表示x行y列交點處的圖像的像素值,g(x,y)的值都是整數(shù) 圖像的數(shù)據(jù)量(bit)b=MNk 圖像清晰度(可分辨的細節(jié)的程度)取決于N和 k。N小,檢測板效應(yīng); k小,假輪廓,只改變灰度級:8、16、32、64、128、256,只改變空間分辨率512、256、128、64、32、16,鄰域,四鄰域 對角鄰域 八鄰域,四鄰域與八鄰域,從數(shù)字圖像中抽取對稱鄰域,連通性,4-連通 8-連通 m-連通 近鄰與通路 連通域 4-連通域 8-連通域,,像素間距離 歐氏距離(DE):(x-s)2+(y-t)21/2 城區(qū)距離(D4):|x-s|+|y-t| 棋盤距離(D8):max(|x-s|,
26、|y-t|),1.4圖像顯示,圖像顯示 圖像顯示設(shè)備:顯示器,打印設(shè)備等 半調(diào)輸出 半調(diào)輸出示例 抖動技術(shù),1.5圖像存儲與格式,圖像存儲 存儲量單位:比特(bit) 字節(jié)B(8bit) 千字節(jié)KB(103B) 兆MB(106B) 吉GB(109B) 太TB(1012B),,存儲器示例 快速存儲器 聯(lián)機存儲器 數(shù)據(jù)庫存儲器 圖像數(shù)據(jù)存儲格式 矢量形式 光柵形式,,圖像文件格式 BMP格式 GIF格式 TIFF格式 JPEG格式,常見圖像存儲格式,1.6*視覺基礎(chǔ),視覺生理/視覺特性/視覺模型 視覺基礎(chǔ)/視覺應(yīng)用 它們與圖像研究的關(guān)系見下圖,視覺研究與圖像的關(guān)系,1、圖像質(zhì)量評價與視覺心
27、理,對圖像質(zhì)量的最終評價是由人的感覺器官和心理狀態(tài)來決定的。與圖像內(nèi)容以及觀察者的心理因素有關(guān) 從圖像信息傳輸角度出發(fā),圖像系統(tǒng)評價的真正尺度應(yīng)該是發(fā)出信息者的意圖為接收信息者所理解的程度,而不是對發(fā)出信息者發(fā)出的圖像象素信息集合的簡單接收,2、畫面組成和視覺心理,視野指眼球不動時所能見到的范圍 如果把注視點作為中心,可見的范圍上方約65,下方約75,左右視角約為104 (現(xiàn)在的電視畫面約占78),但視力好的部位僅限于中央23左右 為了適應(yīng)大的畫面和立體景象的機理,眼球必須轉(zhuǎn)動使視線移動 中心視力分辨率強,可以進行圖像細節(jié)的認識 周邊視力分辨率差,可以將視目標特征部分檢出,利用檢出的目標圖像特
28、征去控制眼球運動 另外周邊視可以認識圖像的全貌,而中心視只能認識圖像的一小部分 要產(chǎn)生充分的臨場感,畫面尺寸應(yīng)該產(chǎn)生30以上視野,如寬銀幕電影,3、視覺的時空頻率分析,影響圖像銳度的主要因素。視覺神經(jīng)具有的Mach效應(yīng)和RocaSulzer微分效應(yīng),中樞神經(jīng)的Craik-Obrien積分效應(yīng)等是視覺信息處理的基礎(chǔ),因此可以將視覺特性和圖像處理結(jié)合起來研究 空間分辨力 人眼對空間景物細節(jié)的分辨能力有限,對黑白圖像約為一度 時間分辨力 對亮度的響應(yīng)有時延和殘留,因而對景物亮度的變化也有分辨力,過快的變化無法分辨 視覺惰性。當(dāng)離散畫面的重復(fù)頻率不低于24Hz時,可形成連續(xù)畫面的感覺,即人眼不能分辨相
29、鄰兩幅畫面間的差別,而低于24Hz時,有閃爍感,4、視覺的時空頻率分析,人眼對畫面靜止部分的分辨率高于活動部分 對靜止部分減少時間分辨率,而對活動部分減少空間分辨率,可以達到數(shù)據(jù)壓縮的效果。 幅度分辨力 人眼對景物亮度層次的分辨力也有限,過小的亮度差別無法分辨。 對彩色圖像的色調(diào)和飽和度的分辨力 人的視覺對彩色細節(jié)的分辨力要比亮度細節(jié)差,在國際無線電咨詢委員會(ITU-R,原CCIR)601標準中,就利用了這種特性,將色差信號的空間分辨率減半,仍可以得到非常好的圖像質(zhì)量。 對立體圖像的景深分辨力等,5、視覺生理和模型的研究,視覺生理 指視覺信息的產(chǎn)生部分視細胞(圖像信息感受器)和其它神經(jīng)細胞以
30、及大腦高級中樞的神經(jīng)系統(tǒng)的信息產(chǎn)生、傳輸和處理的機理 插入單個細胞的微小電極 側(cè)抑制現(xiàn)象、馬赫效應(yīng)等 對大腦高級神經(jīng)中樞的“思考過程”才剛起步,人類視覺機制今后的研究方向,從基礎(chǔ)研究逐步轉(zhuǎn)到和圖像相關(guān)的視覺綜合化、體系化的研究 搞清決定圖像質(zhì)量的主觀因素,做出其總的結(jié)構(gòu)模型 找出人腦真正接收信息的容量,大腦有效接收圖像的顯示方式 弄清圖像信源和信宿的結(jié)構(gòu),建立起包括人的因素在內(nèi)的信息論 研究視覺和其它感覺的相乘作用,即視覺和其它感覺的互相影響 開發(fā)自組織作用的綜合研究,進一步建立發(fā)展“思考過程” 研究視覺和行為的關(guān)系,人類視覺感知過程,人眼結(jié)構(gòu) 眼睛中圖像的形成 視覺特性,人眼的結(jié)構(gòu),,視覺生
31、理特點對圖像 處理方法的影響很大,,錐狀(cone)視覺:白晝視覺,色彩 桿狀(rod)視覺:夜視覺,低照度敏感 視錐細胞和視桿細胞在視網(wǎng)膜上的分布,眼睛中圖像的形成,成像的幾何原理 視覺信息的產(chǎn)生 視覺信息的傳遞 視覺信息的加工處理,(1)成像的幾何原理,當(dāng)晶狀體的折射能力由最小變到最大時,晶狀體的聚焦中心與視網(wǎng)膜之間的距離由17mm縮小到14mm。當(dāng)眼睛聚焦到遠于3m的物體時,晶狀體的折射能力最弱,當(dāng)聚焦到非常近的物體時,其折射能力最強,用眼睛觀察樹的光學(xué)表示法,C點為晶狀體的光學(xué)中心,成像尺寸計算,觀測者看一個距離100m,高15m的樹:設(shè)x表示視網(wǎng)膜上形成的圖像
32、的大小,單位mm,則有 15/100=x/17, x=2.55mm,(2)視覺信息的產(chǎn)生,光化電過程 色覺理論主要有兩種 三色學(xué) 三種視色素,對光的影響峰值分別在紅、綠、藍區(qū),綜合后形成色覺信息 四色學(xué)說 三對視色素(白-黑,紅-綠,黃-藍),它們的組合響應(yīng)產(chǎn)生色覺信息,人類感光細胞的敏感曲線,三種不同頻率響應(yīng)的錐,各對紅、綠、藍具有最強的響應(yīng),彩色的識別功能,(3)視覺信息的傳遞,眼球內(nèi) 眼球外,(4)視覺信息的加工處理,簡單型細胞 檢測圖像的明暗邊界和線條的位置和方向, 復(fù)雜型細胞 對直線和邊界的運動方向敏感, 低級超復(fù)雜型細胞檢測直線和邊界的長度、寬度, 而高級超復(fù)雜型細胞可以檢測曲線和
33、邊緣曲度等,視覺特性,亮度適應(yīng)與鑒別 分辨力 對比靈敏度 同時對比效應(yīng) 閾值效應(yīng)和掩蓋效應(yīng) 視覺運動特性 視覺空間頻率特性 視覺時間頻率特性,主觀亮度感受特性,,分辨力,在不同的亮度適應(yīng)級,人眼的分辨力不同,如圖所示,I是背景光強,I是光強的變化,稱log(I/I) 為韋伯比,表示光強分辨力,光強分辨力的典型韋伯比,對比靈敏度,,同時對比效應(yīng),心理學(xué)實驗表明,人眼感受到的亮度不是光強的簡單函數(shù),如馬赫帶效應(yīng)和同時對比效應(yīng),馬赫帶效應(yīng),同時對比效應(yīng),視覺閾值效應(yīng)和掩蓋效應(yīng),視覺閾值 正好可以被看到的刺激(干擾或失真)值,它是一個統(tǒng)計值,在圖像質(zhì)量的主觀評價中有廣泛的應(yīng)用 掩蓋效應(yīng) 視覺閾值隨圖像
34、內(nèi)容的變化而變化,在平坦區(qū)閾值低,對失真也敏感;在邊緣和紋理區(qū),視覺存在掩蓋效應(yīng),對失真不敏感,視覺運動特性,周邊視力對圖像中運動變化部分很靈敏,有特征抽取作用,從而控制眼肌轉(zhuǎn)動視軸,使視力集中對準這些部位,以便看清其細節(jié) 電視眼球標記攝像機(television eye-marker camera)試驗,視覺空間頻率特性,亮暗在空間上作正弦變化的條紋圖案,物理對比度和感覺對比度之比隨空間頻率變化而變化的曲線,稱為調(diào)制傳遞函數(shù)MTF( Modulation Transfer Function),閃爍對MTF的影響,閃爍頻率為1HZ 閃爍頻率為6HZ 閃爍頻率為16HZ 閃爍頻率為20HZ,對
35、比 靈 敏 度,300 100 30 10 3,0.3 1 3 10 30,,,,,,,,空間頻率/cdeg-1,,,,,,,,,,,,,,,視覺時間頻率特性,,視覺的簡單數(shù)學(xué)模型,亮度視覺模型 彩色視覺模型,1、亮度視覺模型,,線性光學(xué)系統(tǒng),光學(xué)系統(tǒng)的調(diào)制傳遞函數(shù)MTF,黑白視覺對數(shù)模型,,簡單的黑白視覺對數(shù)模型,視覺信息的融合,,|H3(Wx,Wy)|,黑白視覺擴展模型,ThomasYoung三色假說,2、彩色視覺模型,彩色響應(yīng),在上圖模型中,e1、e2、e3代表視網(wǎng)膜三個具有S1()、S2()、S3()譜靈敏度的感受器,其輸出分別為 C()為入射光譜的能量分布函數(shù),彩色信息融合,
36、e1、e2、e3經(jīng)對數(shù)傳遞后合并為d1、d2、d3并輸出:,色譜靈敏度曲線,彩色視覺擴展型模型,1.7*顏色視覺和色度學(xué),3個基本顏色紅(R, red)、綠(G, green)和藍( B, blue) 國際照明委員會(CIE),1931年規(guī)定3種基本色的波長為R:700nm, G:546.1nm, B:435.8nm,三色系統(tǒng),利用3基色疊加可產(chǎn)生光的3補色:品紅(M, magenta,即紅加藍)、藍綠(C, cyan,即綠加藍)、黃(Y, yellow,即紅加綠)。按一定的比例混合3基色或?qū)?個補色與相對的基色混合就可以產(chǎn)生白色。光的混合滿足加色定理,顏色特征,區(qū)分顏色通常用3種基本特性:
37、輝度(又常用亮度、明度) 色調(diào) 飽和度 色調(diào)和飽和度合起來稱為色度。顏色可以用輝度和色度共同表示,坐標系,顏色還可以用色品值r、g、b(相對色系數(shù))表示,定義如下,為組成某種顏色所需的紅、綠、藍的量稱為3個刺激量,分別用R、G、B表示: C=rR+gG+bB 其中,彩色匹配規(guī)則,任何彩色可以用不多于三個基色配成 混合色的光亮度等于各分量亮度之和 人眼不能分解混合彩色的各個分量 在某一亮度等級上的彩色匹配可適用于較寬的亮度范圍 彩色相加定律:若一彩色C1與彩色C2相匹配(同樣彩色感覺),而彩色C1與彩色C2相混合的彩色匹配,可以如下表示 C1=C2,即C1彩色與C2彩色相匹配 1C1+2 C2,
38、即一混合色包含1份的C1和2份的C2 彩色相加定律表示為 若 C1=C2, C1=C2 則1C1+2 C2= 1C1+2 C2,彩色匹配,彩色相減:當(dāng)C1、C2混合色與C1、C2混合色相匹配時,若C2與C2相匹配,則C1和C1也匹配,即已知 C1+ C2= C1+C2,若 C2=C2,則 C1=C1 轉(zhuǎn)移定律:若C1與C2 匹配, C2 又與C3匹配,則C1與C3匹配,即已知C2= C1, C2= C3,則 C1= C3 匹配定律(Grassman定理):在亮度既不太高,也不太低的條件下,有三種配色方案 C=1C1+2 C2+3C3 C+1C1=2 C2+3C3 C+1C1+2 C
39、2=3C3,色度圖,色品坐標系,xyz相對三色系數(shù) (色品坐標) x+y+z=1,(x,y) CIE色度圖 對應(yīng)于 x=y=0.33的 E點,稱等能量點,為CIE標準白光,通用的彩色模型,RGB模型 HSI模型,RGB模型,(1)RGB模型,視覺生理模型 色調(diào)(H,Hue)、色飽和度(S,Saturation)以及明度(I,Intensity)(Museum,孟塞爾顏色系統(tǒng)) 在特定應(yīng)用環(huán)境中,用于圖像分析有特殊的優(yōu)勢 在只有光照亮度發(fā)生變化的應(yīng)用中,不考慮明度,只使用色度進行區(qū)域分割,(2)HSI模型,,,,RGB到HSI,HSI到RGB,顏色特征豐富了圖像處理的方法,色彩的識別,色彩分解,
40、提取特征。 濾色鏡,遙感、著色后細胞,4、其他顏色空間(模型),(1)YUV模型:適用于PAL和SECAM彩色電視制式,Y:亮度,U,V表示色差,,()YCbCr:以演播室質(zhì)量標準為目標的CCIR601編碼方案采用的顏色模型,Y:亮度,Cb和Cr表示色度,,(3)YIQ:適用于NTSC彩色電視制式,Y:亮度,I和Q表示色度,,(4)L*u*v*:CIE1976發(fā)布,L*:米制明度,u*和v*表示米制色度(色度和飽和度),,X,Y,Z是所考察顏色對應(yīng)的三基色的三個刺激量,X0,Y0,Z0是該顏色在完全漫反色時的三個刺激值 兩種顏色的色差為,,(5)L*a*b*:也是CIE1976發(fā)布,L*:米制明度,a*和b*表示米制色度(色度和飽和度) ,分別表示該顏色中紅色和黃色所占的比重,,兩種顏色的色差為 a*和b*表示該顏色中紅色和黃色的補色所占的比重,本章要點,1.1有關(guān)圖像和像素的基本概念 1.2圖像技術(shù)的三個層次:圖像處理、圖像分析和圖像理解 1.3圖像表示方法和鄰域的概念 1.4圖像顯示設(shè)備和技術(shù) 1.5圖像存儲器和圖像文件格式 1.6視覺基礎(chǔ)和亮度知覺 1.7顏色視覺和色度學(xué),
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 國際人力資源管理研討從明棋電腦探討課件
- 國文詩歌多媒體教學(xué)課件
- 古詩詞中愁的意象課件
- 十依財政經(jīng)費所產(chǎn)生的弱勢族群課件
- 六條法律的新解釋發(fā)怒奸淫休妻課件
- 六書理論-大學(xué)古代漢語復(fù)習(xí)資料課件
- 7足太陽膀胱經(jīng)2課件
- 莫內(nèi)和他的朋友們一劇描寫印象派畫家的故事課件
- 海上貨物運輸保險講義ppt課件
- 資訊技術(shù)革命課件
- 北師大版必修二§213兩條直線的位置關(guān)系
- 專案采購計劃之準則建立課件
- 常見惡性腫瘤的早期診斷和治療對策課件
- 干部管理職責(zé)與執(zhí)行技巧課件
- 將地方圖案插入此投影片課件