圖數字圖象處理的基本概念.ppt
《圖數字圖象處理的基本概念.ppt》由會員分享,可在線閱讀,更多相關《圖數字圖象處理的基本概念.ppt(76頁珍藏版)》請在裝配圖網上搜索。
第2章數字圖象的基本概念,本章包含內容,人眼的視覺原理連續(xù)圖象的描述圖象數字化圖象灰度直方圖圖象的數據結構與圖象文件圖象的特征與噪聲,2.1人眼的視覺原理,2.1.1人眼構造三層結構:最外層:蛋白質膜(角膜、鞏膜)、中間層:虹膜和脈絡膜,最內層:視網膜,有大量的光敏細胞,按形狀分為錐狀和桿狀細胞兩類。其中白天視覺過程主要由錐狀細胞完成,夜晚的視覺主要有桿狀細胞完成。,2.1.2圖象形成人觀察景物,光線通過角膜,前室水狀液體,水晶體,后室玻璃體,在視網膜的黃斑區(qū)成像.視網膜的光敏細胞感受到強弱不同光的刺激,產生強度不同的電脈沖,通過神經纖維傳送到視神經中樞.不同位置的光敏細胞產生了和該處光的強弱成比例的電脈沖,于是大腦中形成景物的感覺.,2.1.3視覺范圍與分辨力視覺范圍:指人眼能感受到的亮度范圍視敏角:人眼對被觀察物體剛能分辨出它最緊鄰的兩黑點或兩白點的視角,如公式所表示:視覺銳度:又叫人眼的分辨力,是指人眼在一定距離內能夠區(qū)分出相鄰兩點的能力,一般用視敏角的倒數描述.,人眼分辨力決定因素環(huán)境照度觀察對象的相對對比度個人因素,2.1.4視覺適應性和對比靈敏度暗視覺適應性:人眼適應暗環(huán)境的能力,這種適應過程大概需要30s。明視覺適應性:圖像對比度:圖像中最大亮度值與最小亮度值之比,描述圖像總體描述亮度差異相對對比度:圖像中最大亮度值與最小亮度值之差與最小亮度值之比,2.1.5亮度感覺與色覺人眼對亮度差別的感覺取決于相對亮度的變化,可用相對亮度變化描述.積分得亮度感覺:于是可得亮度感覺與亮度B成自然對數關系.人眼的亮度范圍很寬.可是當適應某一平均亮度時,其感覺的亮度范圍很窄.,亮度感覺的相對性給圖象傳輸帶來的好處:圖象重現的亮度不必等于實際圖象的亮度,只要保持兩者對比度不變人眼不能感覺出來的亮度差別在重現圖象時不必精確復制出來,人眼還可以分辨不同的顏色色覺:人眼分辨不同顏色的能力,指的是視網膜對不同波長光的感受特性,即在一般自然光線下分辨各種不同顏色的能力.色覺:色調,亮度,飽和度.物體的色取決于物體對各種波長光線的吸收,反射,透射能力,可分為消色物體和有色物體.消色物體顯示黑,白,灰色物體,對光線的吸收不具有選擇性,各種波長的光吸收能量一樣有色物體:,2.1.6馬赫帶當亮度發(fā)生躍變時,會有一種邊緣增強的感覺,視覺上會感到亮側更亮,暗側更暗,這種現象稱為馬赫帶效應.它是一種主觀的邊緣效應.,2.2連續(xù)圖像的數學描述,一幅圖像可以被看作是空間各點光強度的集合。對于二維圖像,可以把光強度g看作是隨空間坐標(x,y)、光線波長和時間t變化的連續(xù)函數:,如果只考慮光的能量而不考慮其波長圖像在視覺上表現為灰色影像--灰度圖像:靜止灰度圖像:,,,人眼看到的圖象是由物體的反射光組成的.可以看成所見場景的照射分量和反射光量組成,圖象在(x,y)處的強度圖象該點的灰度.灰度l范圍[Lmin,Lmax],其中要求Lmin為正,Lmax有限.,2.3圖像數字化,圖象數字化是將畫面轉化為數字圖象的過程,主要包括采樣和量化兩個過程.,2.3.1采樣采樣:將連續(xù)的圖象換成離散點的操作關鍵要素:采樣間隔,采樣孔徑,采樣方式采樣間隔的確定采樣孔徑的類型采樣方式,2.3.2量化量化:將采樣后離散象素的灰度轉換成離散數值的過程.灰度級數(G):一幅圖象中不同灰度值的個數灰度級數一般是2的整數冪,即是,從視覺效果來看只要灰度級數大于或等于26.對于一幅行數為M,列數為N的圖象,如果采用gbit量化,則該圖象占用的存儲空間為M*N*g(bit).,(a)連續(xù)圖像(b)數字化結果,(c)像素(d)灰度級,2.3.3數字圖象的表示一幅連續(xù)圖像f(x,y)被取樣,則產生的數字圖像有M行和N列。坐標(x,y)的值變成離散值,通常對這些離散坐標采用整數表示:,4行5列,圖像的坐標,一幅行數為M、列數為N的圖像大小為MN的矩陣形式為:,,,其中矩陣中的每個元素代表一個像素,2.3.4采樣,量化和數字化圖象數字化方式分為均勻采樣,量化和非均勻采樣,量化.一般采用前者采樣間隔越大,采樣象素越少,圖象空間分辨率低,質量差;采樣間隔越小,采樣象素越多,圖象空間分辨率高,質量好,數據量大.,圖2-4不同采樣點數對圖像質量的影響(a)原始圖像(256256);(b)采樣圖像1(128128);(c)采樣圖像2(6464);(d)采樣圖像3(3232);(e)采樣圖像4(1616);(f)采樣圖像5(88),量化與數字化圖象間的關系量化的等級越多,所得圖象層次越豐富,灰度分辨率越高,質量越好,但是數據量大;量化的等級越少,所得圖象欠層次,灰度分辨率變低,質量變差,會出現假輪廓現在,但是數據量小.,圖2-5不同量化級別對圖像質量的影響(a)原始圖像(256色);(b)量化圖像1(64色);(c)量化圖像2(32色);(d)量化圖像3(16色);(e)量化圖像4(4色);(f)量化圖像5(2色),對一幅圖像,當量化級數Q一定時,采樣點數MN對圖像質量有著顯著的影響.采樣點數越多,圖像質量越好;當采樣點數減少時,圖上的塊狀效應就逐漸明顯.同理,當圖像的采樣點數一定時,采用不同量化級數的圖像質量也不一樣.量化級數越多,圖像質量越好,當量化級數越少時,圖像質量越差,量化級數最小的極端情況就是二值圖像,圖像出現假輪廓.,一般,當限定數字圖像的大小時,為了得到質量較好的圖像可采用如下原則:(1)對緩變的圖像,應該細量化,粗采樣,以避免假輪廓。(2)對細節(jié)豐富的圖像,應細采樣,粗量化,以避免模糊(混疊)。對于彩色圖像,是按照顏色成分——紅(R)、綠(G)、藍(B)分別采樣和量化的.若各種顏色成分均按8bit量化,即每種顏色量級別是256,則可以處理256256256=16777216種顏色。,2.3.5數字化設備組成及性能數字化器是將模擬圖像轉換成數字圖像的數字化輸入裝置。組成:數字化器必須能夠把圖像劃分為若干圖像象素并給出他們的地址,量度每一個像素的灰度,把連續(xù)的度量結果化為整數,并把相關信息寫入存儲設備。因此必須包含:采樣孔,圖像掃描機構,光傳感器,量化器,輸出存儲體。常用的數字化器掃描儀,數碼相機,數碼電視攝像機等,,原稿,,,線陣CCD,A/D及圖像處理,,,,,控制部分,步進電機驅動,,,,,去計算機,長光管光源,光學鏡頭,CCD掃描儀的系統(tǒng)框圖,掃描儀,采用半導體隔離CCD,采用硅氧化物隔離CCD,手持式掃描儀饋紙式掃描儀鼓式掃描儀平臺式掃描儀:采用CCD/CIS技術大幅面掃描儀底片掃描儀(膠片掃描儀)筆式掃描儀條碼掃描儀實物掃描儀3D掃描儀,Canon656U采用CIS技術,掃描儀主要類型,掃描儀的應用灰度掃描儀最主要的應用是OCR(光學字元識別)、黑白印刷、排版及文件檔案管理。彩色掃描儀主要應用于辦公室簡報、彩色排版、廣告設計等。,鏡頭、感光器件(CCD或CMOS)、MPU(微處理器)、內置存儲器、LCD(液晶顯示器)、PC卡(可移動存儲器)和接口(計算機接口、電視機接口)等部分組成,數碼相機的立體剖面圖,數字照相機,CompactFlash存儲卡CompactFlashMemoryCard,MemoryStick,PCMCIA存儲設備,數碼相機及存儲器,“電視制式攝像頭”把景物光像轉變?yōu)殡娦盘柕难b置。其結構大致可分為三部分:光學系統(tǒng)(主要指鏡頭)光電轉換系統(tǒng)(主要指攝像管或固體攝像器件)電路系統(tǒng)(主要指視頻處理電路)光學系統(tǒng)的主要部件是光學鏡頭,它由透鏡系統(tǒng)組合而成。,,攝像機,三種常用的圖像輸入設備的比較,圖象數字化器性能評價圖像數字化器的性能評價,2.4圖象灰度直方圖,2.4.1概念1)反映一幅圖象中各灰度級與各灰度級象素出現的頻率之間的關系.其中ni表示灰度為i的象素數,n為象素總數2)是灰度級的函數,描述的是圖像中每種灰度級像素的個數,反映圖像中每種灰度出現的頻率。橫坐標是灰度級,縱坐標是灰度級出現的頻率。,圖像及其灰度直方圖的例(512像素*512像素),2.4.2直方圖的性質1)表征了圖像的一維信息。只反映圖像中像素不同灰度值出現的次數(或頻數)而未反映像素所在位置。2)與圖像之間的關系是多對一的映射關系。一幅圖像唯一確定出與之對應的直方圖,但不同圖像可能有相同的直方圖。3)子圖直方圖之和為整圖的直方圖,2.4.3直方圖的應用用于判斷圖象量化是否恰當一般一幅數字圖像應該利用全部或幾乎全部可能的灰度級;對直方圖做快速檢查確定圖象二值化的域值使用輪廓線確定簡單物體的邊界的方法,稱為閾值化對物體與背景有較強對比的景物的分割特別有用;,利用直方圖統(tǒng)計圖象中物體的面積計算圖象的信息量(熵),2.5數字圖象處理算法形式,2.5.1基本功能形式圖象處理的基本功能:單幅圖象->單幅圖象多幅圖象->單幅圖象單(或多)幅圖象->數字或者符號,2.5.2幾種具體算法形式局部處理象素鄰域:對于任一象素(i,j),把其周圍象素構成的集合{(i+p,j+q),p,q取適當整數}叫做象素(i,j)的鄰域.常用的去心鄰域有4鄰域,8鄰域.局部處理:在對輸入圖象進行處理時,計算某一輸出象素JP(i,j)值由IP(i,j)小鄰域N(IP(i,j))中的象素值確定.局部處理應用:移動平均平滑法,空間銳化點處理:在局部處理中如果輸出值JP(i,j)僅和IP(i,j)象素灰度有關的處理稱為點處理點處理:圖象對比度增強,圖象二值化大局部處理:輸出象素JP(i,j)的值取決于輸入圖象較大范圍或者整幅圖象象素的值.,迭代處理反復對圖象進行某種運算直至滿足給定的條件,從而得出輸出圖象的處理形式.應用:圖象的細化跟蹤處理選擇滿足適當條件的象素作為起始象素,檢查輸入的圖象和已得到的輸出結果,求出下一步應該處理的象素,進行規(guī)定的處理,然后在繼續(xù)處理下面的象素,還是決定終止處理.特點:跟蹤結果與起始位置有關利用處理結果限定處理范圍可利用邊界線,等高線的跟蹤方面,窗口處理和模板處理對圖象特定的部分進行處理的方式包括窗口處理和模班處理.窗口處理:單獨對圖象中選定的矩形區(qū)域進行處理,用于從圖象中單獨取出對象物所在的窗口而進行處理的場合.模板處理:單獨處理任意形狀時,必須先設一個模板平面.,串行處理串行處理:后一象素的輸出結果依賴于前面的象素處理結果,并且只能依次處理各象素而不能同時對各個象素進行相同的處理方式.特點:處理算法按照一定順序進行;用輸入圖象(i,j)的鄰域象素值和輸出圖象(i,j)以前象素的處理結果計算輸出圖象(i,j)象素的值,并行處理并行處理:對圖象內各個象素同時進行相同形式的運算.特點:處理算法按照一定順序進行;輸出圖象(i,j)的值只用輸入圖象(i,j)以及其鄰域象素值進行計算相對于不同(i,j)的輸出值可以進行獨立的運算,2.6圖象數據結構與文件格式,2.6.1圖象的數據結構數組組合方式一般是一個象素的灰度占用一個字.組合方式是一個字長存放多個象素灰度值.比特面方式將各個象素灰度按比特位存取的方式,即將所有象素灰度相同的比特位用一個二維數組表示,形成比特面.分層方式由原始圖象開始依次構成象素愈來愈少的系列圖象,就能使圖象數據表示具有分層性,金字塔結構,樹結構對圖象的行,列接連不斷二等分,直到圖象被分割部分全體象素變成具有相同特征時不在分割,主要是用四叉樹表示,,用于特征提取和信息壓縮.多重圖象數據結構多光譜圖象逐波段儲存逐行存儲逐象素存儲,2.6.2圖象文件格式圖象文件格式有BMP,PCX,GIF,TIFF等格式任何一個文件格式包含以下內容:描述圖象的高度,寬度以及各種物理特征:彩色定義:描述圖象位圖數據體:數字圖像有多種存儲格式,每種格式一般由不同的開發(fā)商支持。隨著信息技術的發(fā)展和圖像應用領域的不斷拓寬,還會出現新的圖像格式。因此,要進行圖像處理,必須了解圖像文件的格式,即圖像文件的數據構成。每一種圖像文件均有一個文件頭,在文件頭之后才是圖像數據。文件頭的內容一般包括文件類型、文件制作者、制作時間、版本號、文件大小等內容。各種圖像文件的制作還涉及到圖像文件的壓縮方式和存儲效率等。,BMP圖像文件格式,第一部分為位圖文件頭BITMAPFILEHEADER,它是一個結構體,其定義如下:typedefstructtagBITMAPFILEHEADER{WORDbfType;DWORDbfSize;WORDbfReserved1;WORDbfReserved2;DWORDbfOffBits;}BITMAPFILEHEADER;這個結構的長度是固定的,為14個字節(jié)(WORD為無符號16位二進制整數,DWORD為無符號32位二進制整數)。,第二部分為位圖信息頭BITMAPINFOHEADER,也是一個結構,其定義如下:typedefstructtagBITMAPINFOHEADER{DWORDbiSize;LONGbiWidth;LONGbiHeight;WORDbiPlanes;WORDbiBitCount;DWORDbiCompression;DWORDbiSizeImage;LONGbiXPelsPerMeter;LONGbiYPelsPerMeter;DWORDbiClrUsed;DWORDbiClrImportant;}BITMAPINFOHEADER;,這個結構的長度是固定的,為40個字節(jié)(LONG為32位二進制整數)。其中,biCompression的有效值為BI_RGB、BI_RLE8、BI_RLE4、BI_BITFIELDS,這都是一些Windows定義好的常量。由于RLE4和RLE8的壓縮格式用的不多,今后僅討論biCompression的有效值為BI_RGB,即不壓縮的情況。,第三部分為調色板(Palette),當然,這里是對那些需要調色板的位圖文件而言的。真彩色圖像是不需要調色板的,BITMAPINFOHEADER后直接是位圖數據。調色板實際上是一個數組,共有biClrUsed個元素(如果該值為零,則有2的biBitCount次方個元素)。數組中每個元素的類型是一個RGBQUAD結構,占4個字節(jié),其定義如下:typedefstructtagRGBQUAD{BYTErgbBlue;//該顏色的藍色分量BYTErgbGreen;//該顏色的綠色分量BYTErgbRed;//該顏色的紅色分量BYTErgbReserved;//保留值}RGBQUAD;,第四部分就是實際的圖像數據。對于用到調色板的位圖,圖像數據就是該像素顏色在調色板中的索引值,對于真彩色圖像,圖像數據就是實際的R、G、B值。下面就2色、16色、256色和真彩色位圖分別介紹。對于2色位圖,用1位就可以表示該像素的顏色(一般0表示黑,1表示白),所以一個字節(jié)可以表示8個像素。對于16色位圖,用4位可以表示一個像素的顏色,所以一個字節(jié)可以表示2個像素。對于256色位圖,一個字節(jié)剛好可以表示1個像素。,每一行的字節(jié)數必須是4的整數倍,如果不是,則需要補齊。這在前面介紹biSizeImage時已經提到過。BMP文件的數據存放是從下到上,從左到右的。也就是說,從文件中最先讀到的是圖像最下面一行的左邊第一個像素,然后是左邊第二個像素,接下來是倒數第二行左邊第一個像素,左邊第二個像素。依次類推,最后得到的是最上面一行的最右邊的一個像素。,其他文件格式1.TIF圖像文件格式標記圖像文件格式TIF(TagImageFileFormat),它是現存圖像文件格式中最復雜的一種,它提供存儲各種信息完備的手段,可以存儲專門的信息而不違反格式宗旨,是目前流行的圖像文件交換標準之一。TIF格式文件的設計考慮了擴展性、方便性和可修改性,因此非常復雜,要求用更多的代碼來控制它,結果導致文件讀寫速度慢,TIF代碼也很長。TIF文件由文件頭、參數指針表與參數域、參數數據表和圖像數據4部分組成。如表2-2~表2-4所示。,1)文件頭,表2-2TIF文件文件頭結構,2)參數指針,表2-3TIF文件參數指針表,由一個2字節(jié)的整數和其后的一系列12字節(jié)參數域構成,最后以一個長整型數結束。若最后的長整型數為0,表示文件的參數指針表到此為至,否則該長整數為指向下一個參數指針表的偏移。,3)參數塊結構,表2-4TIF文件參數塊結構,2.GIF圖像文件格式CompuServe開發(fā)的圖形交換文件格式GIF(GraphicsInterchangeFormat),目的是在不同的系統(tǒng)平臺上交流和傳輸圖像。它是在Web及其他聯機服務上常用的一種文件格式,用于HTML文檔中的索引顏色圖像,但圖像最大不能超過64M,顏色最多為256色。GIF圖像文件采取LZW壓縮算法,存儲效率高,支持多幅圖像定序或覆蓋,交錯多屏幕繪圖以及文本覆蓋。GIF主要是為數據流而設計的一種傳輸格式,而不是作為文件的存儲格式。換句話說,它具有順序的組織形式。GIF有五個主要部分以固定順序出現,所有部分均由一個或多個塊(block)組成。每個塊第一個字節(jié)中存放標識碼或特征碼標識。這些部分的順序為:文件標志塊、邏輯屏幕描述塊、可選的“全局”色彩表塊(調色板)、各圖像數據塊(或專用的塊)以及尾塊(結束碼)。GIF圖像文件格式如表2-5所示。,3.PCX文件PCX文件格式由ZSoft公司設計,最早使用的圖像文件格式之一,由各種掃描儀掃描得到的圖像幾乎都能保存成PCX格式。PCX支持256種顏色,不如TARGA或TIF等格式功能強,但結構較簡單,存取速度快,壓縮比適中,適合于一般軟件的使用。PCX格式常用于IBMPC兼容計算機。大多數PC軟件支持PCX格式的第5版。第3版文件使用標準的VGA調色板,不支持自定義調色板。PCX格式支持RGB、索引顏色、灰度和位圖顏色模式,但不支持alpha通道。PCX支持RLE壓縮方法,圖像顏色的位數可以是1、4、8或24。,PCX圖像文件由三個部分組成:文件頭、圖像數據和256色調色板。PCX的文件頭有128個字節(jié),它包括版本號,被打印或掃描的圖像的分辨率(dpi)及大小(單位為像素),每掃描行的字節(jié)數,每像素包含的位數據和彩色平面數。位圖數據用行程長度壓縮算法記錄數據。,4.JPEG圖像格式JPEG(JointPhotographer’sExpertsGroup)格式即聯合圖像專家組,是由ISO和CCITT為靜態(tài)圖像所建立的第一個國際數字圖像壓縮標準,主要是為了解決專業(yè)攝影師所遇到的圖像信息過于龐大的問題。由于JPEG的高壓縮比和良好的圖像質量,使得它廣泛應用于多媒體和網絡程序中。JPEG和GIF成為HTML語法選用的圖像格式。,JPEG格式支持24位顏色,并保留照片和其他連續(xù)色調圖像中存在的亮度和色相的顯著和細微的變化。JPEG一般基于DCT變換的順序型模式壓縮圖像。JPEG通過有選擇地減少數據來壓縮文件大小,因為它會棄用數據,故JPEG壓縮為有損壓縮。較高品質設置導致棄用的數據較少,但是JPEG壓縮方法會降低圖像中細節(jié)的清晰度,尤其是包含文字或矢量圖形的圖像。,2.7圖象的特征與噪聲,2.7.1圖象的特征類別自然特征光譜特征:幾何特征:空間分辨率,圖象紋理結構,圖象變形時相特征:不同時間獲取同一區(qū)域圖象之間的差異,人工特征直方圖特征:根據直方圖獲取灰度與灰度級象素出現的頻率的關系灰度邊緣特征:反映圖象中目標或對象面積以及形狀線和角點特征:紋理特征:某種結構在比它更大范圍內呈現重復排列,結構稱為紋理基元.,重視何種特征依賴于對象及處理目的.按照特征提取的范圍點特征:由象素就能決定的性質局部特征:區(qū)域特征:整體特征:統(tǒng)計性質和結構特征,2.7.2特征提取與特征空間特征提取:獲取圖象特征信息的操作,它是模式識別,圖象理解等的基礎.通過特征提取獲得特征圖象以及特征參數.,2.7.3圖象噪聲噪聲:妨礙人的視覺器官或系統(tǒng)傳感器對所接收的圖象信息進行理解或者分析的各種因素.噪聲具有隨機性,目前只能用概率統(tǒng)計的方法認識噪聲的分類:外部噪聲:內部噪聲:平穩(wěn)噪聲:非平穩(wěn)噪聲:,噪聲特征噪聲具有隨機性,需用隨機過程描述.一般用統(tǒng)計特征描述噪聲:均值,方差噪聲模型加性噪聲模型,乘性噪聲模型圖象系統(tǒng)常見的噪聲光電管噪聲,攝相管噪聲,前置放大器噪聲,光學噪聲.,- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 數字圖象處理 基本概念
裝配圖網所有資源均是用戶自行上傳分享,僅供網友學習交流,未經上傳用戶書面授權,請勿作他用。
鏈接地址:http://weibangfood.com.cn/p-13208021.html