引論:我們?yōu)槟砹?3篇數(shù)字圖像處理綜述范文,供您借鑒以豐富您的創(chuàng)作。它們是您寫作時的寶貴資源,期望它們能夠激發(fā)您的創(chuàng)作靈感,讓您的文章更具深度。
篇1
數(shù)字圖像處理技術(shù)發(fā)展是十分迅速的,從早期的電報打印機打印的粗糙圖片,到圖像信號可以遠距離傳輸并清晰顯示出來,到現(xiàn)在數(shù)字圖像處理技術(shù)可以觀看到人體內(nèi)部組織結(jié)構(gòu)等等,在技術(shù)發(fā)展的同時,在人們生活中的作用也越來越顯著。
1 數(shù)字圖像處理技術(shù)的主要分類
數(shù)字圖像處理的技術(shù)基本可以分為兩大類:分別是模擬圖像處理和數(shù)字圖像處理.模擬圖像處理內(nèi)容主要包括光學圖像處理和電子圖像處理。如人們平常拍照、攝像頭監(jiān)控和電視信號處理等都屬于模擬圖像處理。模擬圖像處理的優(yōu)點是處理速度快,系統(tǒng)占用運行內(nèi)存小,圖像實時性強, 能夠在處理的同時進行其他圖像的處理,其缺點是處理精度較差,處理功能比較單一,沒什么智能判斷能力和非線性處理的能力。
數(shù)字圖像處理技術(shù)是目前主流的處理技術(shù),其功能的實現(xiàn)一般需要計算機軟件的支持,所以一般也稱之為計算機圖像處理。數(shù)字圖像處理有很多優(yōu)勢,如處理內(nèi)容方面,處理精度方面,處理靈活性等等都是模擬圖像處理所比不上的,而且可以進行復雜的非線性處理,改變處理功能只需要進行不同功能模塊的重新編碼和參數(shù)變換,但其處理速度慢,尤其是在進行復雜的圖像處理時更要占用更高的內(nèi)存。
2 數(shù)字圖像處理技術(shù)的主要內(nèi)容
2.1 圖像的顯示
圖像顯示是數(shù)字圖像處理技術(shù)中最基本也是最重要的一門技術(shù),對于計算機來說,獲取信息的最直觀的方式就是圖像的觀看,任何其他圖像處理技術(shù)都需要先顯示圖像,然后在圖像做后續(xù)操作,如對圖像進行特效顯示,包括圖像的掃描,圖像的移動,分條柵欄,馬賽克效果,百葉窗效果等,所以圖像顯示的原理和基本方法是數(shù)字圖像處理技術(shù)中所必須掌握的[1]。
計算機顯示圖像并不是直接打開圖像并顯示在電腦熒幕上,當大家想要打開一幅圖像時,計算機首先得調(diào)用電腦自帶的調(diào)色板,一幅位圖里面包含了圖像顏色信息表,當載入位圖,并且準備打開位圖的時候,系統(tǒng)會先將位圖自身的顏色信息表即調(diào)色板載入系統(tǒng)調(diào)色板,然后顯示硬件調(diào)用系統(tǒng)調(diào)色板就可以顯示位圖原來的顏色了。
2.2 圖像的幾何處理
為了滿足視覺的不同需要,人們需要對圖像的顯示進行不同的處理,以求給人帶來最適合的視覺效果,其方法包括坐標變換,圖像的放大,縮小,旋轉(zhuǎn)、移動等。
2.3 圖像的變換域處理
數(shù)字圖像處理經(jīng)常要用到線性系統(tǒng),在圖像處理中使用空間作為參數(shù)來描述,通常用二維系統(tǒng)進行表示,輸入函數(shù)f(x,y)表示原始圖像,輸出函數(shù)g(x,y)表示經(jīng)處理后的圖像,線性系統(tǒng)可以看作是輸入函數(shù)和輸出函數(shù)之間的一種映射w,反映了各種線性圖像的處理方法,關(guān)系公式如下:
當將圖像有空間域變換到頻域時,一般要用到線性正交變換,線性正交變換算法主要包括傅立葉變換離散小波變換,離散余弦變換等。
2.4 圖像的銳化處理
許多圖像里面的有用信息比較不顯眼,這時需要對圖像進行增強顯示,抑制其中不重要的信息,突出顯示其中重要的信息,讓兩個部分有鮮明的對比,能讓用戶有更加直觀的視覺信息,可以提高有用信息的接收率。
而圖像復原的目的也是為了增強圖像的顯示效果,它跟圖像增強的區(qū)別在于:圖像增強是采用各種技術(shù)來增強圖像的視覺效果,不去考慮之前的圖像是因為什么原因需要增強。因此,圖像增強是以圖像符合人們的視覺觀為主,不用管增強之后和原圖是不是有比較大的區(qū)別。圖像復原處理跟圖像增強處理完全不同,它需要知道圖像復原前的算法,并且根據(jù)已經(jīng)退化的圖像得到逆算法將圖像復原,然后才能對圖像進行增強處理。
2.5 JPEG圖像的壓縮編碼
其核心思想就是在滿足一定質(zhì)量的情況下減少圖像占用的內(nèi)存,因為圖像中有許多與大家想要信息無關(guān)的區(qū)域或冗余信息,這些信息不僅占用內(nèi)存,而且傳輸過程中需要更多的帶寬,所以,對圖像進行編碼壓縮能盡可能節(jié)約帶寬資源,提高傳輸速度,給圖像顯示帶來更好的體驗。圖像壓縮編碼方法很多,從信息論方面看主要可以分為兩大類:冗余度壓縮方法和信息度壓縮方法。
2.6 圖像的灰度變換
圖像的灰度變換處理是圖像增強處理技術(shù)中單個一種非常基礎、直接的空間域處理方法,灰度處理是指根據(jù)某種目標條件按一定變換關(guān)系逐點改變原圖中每個像素灰度值的方法,目的是為了改變圖像質(zhì)量,讓圖像顯示效果更加清晰,如攝像頭在室內(nèi)光照不強時會導致圖像顯示不清晰,灰度過于集中。灰度變換處理方法主要包括線性變換和非線性變換。
圖像處理內(nèi)容包括很多方面,以上所舉只是一部分,專業(yè)的數(shù)字圖像處理技術(shù)是遠遠不止這些方面的,隨著計算機技術(shù)發(fā)展越來越快,數(shù)字圖像處理技術(shù)的復雜程度只會越來越深,所以,在數(shù)字圖像處理技術(shù)這一門博大精深的課程中,擇一而精也是一個很好學習態(tài)度[2]。
3 數(shù)字圖像處理的應用
數(shù)字圖像處理技術(shù)在各行各業(yè)應用都不可或缺,它已經(jīng)從剛開始的高科技領(lǐng)域逐步滲透到人們的日常生活中,例如天氣預報信息收集、醫(yī)院身體各方面檢測、銀行自助提款機、全國各地的大小超市商品編碼、道路交通監(jiān)控、重要部門的監(jiān)控報警系統(tǒng)、可視電話視頻傳輸技術(shù)、互聯(lián)網(wǎng)媒體信息傳輸?shù)鹊取?/p>
3.1 遙感航天中的應用
天文、太空星體的探測及分析,數(shù)字圖像處理可以根據(jù)拍攝到的星體輪廓等進行智能分析。軍事偵察、定位、指揮等,如現(xiàn)在的衛(wèi)星地圖,手機定位系統(tǒng);地質(zhì)、地形、地圖的普查及繪制,如網(wǎng)上和手機上和司機普遍使用的電子地圖和導航儀;地下礦藏的偵察,地質(zhì)勘查儀等通過超聲波檢測地質(zhì)層,然后用數(shù)字圖像處理的方法把地質(zhì)層構(gòu)成顯示出來;環(huán)境污染的監(jiān)控,有物理監(jiān)控和自動化智能監(jiān)控等;氣象、天氣預報的合成分析。
3.2 生物醫(yī)學中的應用
顯示圖像處理,平常我們所使用的CT照,B超等技術(shù);DNA顯示分析;生物進化的圖像分析;專家系統(tǒng)如手術(shù)規(guī)劃;內(nèi)臟大小、形狀、活動及異常檢出分析;癌細胞的識別。
3.3 工業(yè)應用
產(chǎn)品無損檢測、焊縫及內(nèi)部缺陷檢測;流水線零件自動檢測識別;生產(chǎn)過程的監(jiān)控;交通管理、機場監(jiān)控;支票、簽名辨?zhèn)渭白R別;機器人視覺系統(tǒng)的應用。
3.4 軍事公安領(lǐng)域中的應用
罪犯臉型的合成;指紋自動識別;巡航導彈主動識別;手跡、印章的鑒定識別;遙控飛行器的引導;雷達的目標偵察。
數(shù)字圖像處理短短幾十年得到了飛躍式的發(fā)展,技術(shù)的精進帶來的是我們生活中、科技中。教育中、醫(yī)學中的各種技術(shù)的發(fā)展,人們的生活質(zhì)量在一天天提高,工廠和生產(chǎn)等的工作效率也是突飛猛進,這些都離不開智能化,自動化的數(shù)字圖像處理技術(shù),在未來的不久,數(shù)字技術(shù)將給我們帶來更為巨大的改變。
篇2
1 引言
膠帶的縱向撕裂問題是一個在國內(nèi)國際都普遍存在的問題[1]。如何設計一種能對膠帶實行實時監(jiān)控的、并且在縱向撕裂發(fā)生后快速可靠的膠帶保護裝置,在國內(nèi)外都是一個正在努力攻克的難題。相比較而言,由于我國煤礦的數(shù)量和膠帶輸送機的數(shù)量遠遠超過國外任何一個國家,而國內(nèi)的膠帶質(zhì)質(zhì)量與國外相比有很大的差距,縱向撕裂識別和保護問題在我國煤礦生產(chǎn)中更加受到重視,其中亟待解決的問題之一是進行有效的實時識別縱向裂縫。
國內(nèi)外從70年代就開始縱向裂縫的識別研究,己從接觸式發(fā)展到非接觸式,從單一化到智能化,除嵌入法、光電傳感技術(shù)、超聲波掃描技術(shù)之外,現(xiàn)在又有了改進后的嵌入法、超聲波技術(shù)和最新研究探討的原子物理方法等等。由于煤礦生產(chǎn)環(huán)境的惡劣,每種方法都有其不成熟和不穩(wěn)定的地方。因此,本文利用數(shù)字圖像處理技術(shù)靈活性高、再現(xiàn)性好、處理精度高、適用面寬以及處理算法和圖像特點相關(guān)性高的優(yōu)點,根據(jù)礦用膠帶圖像的特點,選取結(jié)構(gòu)識別方法,利用裂縫處灰度跳變的特性,使用了符合其特點連通域檢測,通過圖像預處理,圖像切割,以及連通域檢測三個步驟實現(xiàn)了礦用膠帶的縱向裂縫的識別。
2 圖像的分析及其預處理
當大多數(shù)縱向撕裂發(fā)生后,膠帶表面會有變化,用肉眼能辨別的出來,我們可以在膠帶下安裝若干個攝象頭,然后用計算機進行圖象識別,利用膠帶撕裂前后的圖象特征變化來進行即時的監(jiān)控。即可以進行預防以及及早的對發(fā)生的撕裂進行處理。由于膠帶下面的環(huán)境比較惡劣,我們可以使用低照長壽命ccd攝象機。攝象機的安裝地點要兼顧實用性和經(jīng)濟性,基于以上兩個原則,要安裝在最容易發(fā)生膠帶撕裂的部位,在膠帶的機頭、機尾以及轉(zhuǎn)折點各安裝一個,以一個適合的高度盡可能照顧大的范圍。
本實驗系統(tǒng)由CCD攝像頭、數(shù)據(jù)采集卡及識別軟件系統(tǒng)和電腦組成。其中硬件包括CCD采集卡、視頻采集卡和電腦主機;識別系統(tǒng)模塊包括圖像采集模塊,預處理模塊,邊緣檢測模塊以及識別模塊。
首先對裂縫圖像進行了整體、灰度、噪聲三個方面進行了分析,得到其幾何、數(shù)學、灰度分布上的特點,針對這些特點選擇合適的圖像處理算法。由于彩色圖像其信息容量比灰度圖像大,因此處理難度大、速度慢,而且在識別裂縫的過程中,灰度圖像所含的信息量已經(jīng)足夠,因此先將彩色圖像轉(zhuǎn)換成為灰度圖像。然后根據(jù)圖像的灰度直方圖進行像素分析,根據(jù)分析的結(jié)果進行自適應閾值分割,通過計算或設定一個概率值,根據(jù)總像素值和灰度分布來確定分割的閾值,然后調(diào)用閾值分割程序來進行閾值分割。圖像預處理還包括最重要的一個部分:圖像濾波,分析了圖像噪聲來源,選擇了合適的濾波器,對濾波效果進行了分析,并對不同形狀的裂縫選擇了不同的濾波模板。
其次對圖像進行形態(tài)學處理。由于在一幅裂縫圖像中,在圖像預處理的過程中或多或少的會對原始圖像中的裂縫區(qū)域帶來影響,例如:將屬于裂縫區(qū)域的點去除,可能導致連續(xù)的一條裂縫被分割為幾條或裂縫的區(qū)域減小,因此要對預處理后的圖像進行形態(tài)學處理,使裂縫區(qū)域得到恢復和加強。圖1(b)是使用中值濾波進行平滑處理的效果。
3 圖像邊緣分割
圖像分割是實現(xiàn)圖像識別膠帶是否撕裂的重要步驟,分割效果的好壞直接影響這系統(tǒng)的識別率,是特征提取、裂縫識別的前提準備步驟,在系統(tǒng)視線中占有不可忽視的地位,因此如何提高分割效果,減輕識別難度也就成了我們的首要任務,也是課題實現(xiàn)的難點之一。主要體現(xiàn)在以下兩個方面:首先,目前不存在適合所有類型圖像的通用分割算法,現(xiàn)有的分割算法都是針對具體應用而設計的,因此我們必須根據(jù)膠帶撕裂裂縫圖像的特征,即直方圖沒有明顯雙峰,裂縫與背景的比例像素懸殊等特點,來設計適合本系統(tǒng)的分割算法,其次,由于本文中盡心分割的裂縫圖像是從實際環(huán)境中獲取的,受到的干擾很大,煤礦膠帶下的情況惡劣,造成我們獲得的原始圖像質(zhì)量較差,為進行有效分割帶來困難,因此選擇一個分割算法,使其能夠最大程度去除噪聲、邊界、偽缺陷等非裂縫區(qū)域,保留裂縫區(qū)域,減輕后續(xù)處理的復雜度,是本步驟的關(guān)鍵。
常用的算子可以分為一階微分算子和二階微分算子。一階微分算子通過梯度值來進行邊緣檢測,用此方法可以忽略細節(jié),得到的邊緣也較粗,如圖2所示為一階算子Sobel算子對膠帶裂縫輪廓的提取圖;二階微分算子是通過尋找二階微分中的零穿越來檢測邊緣。用此方法得到的邊緣較細,在細節(jié)方面較好,但物體的整體輪廓不如一階微分算子明顯。由于縱向裂縫識別是以裂縫輪廓作為基礎,而對其它細節(jié)可以不予考慮,從上面提取的裂縫輪廓圖像可以看出Sobel算子符合識別的要求,所以選擇Sobel算子。
4 縱向裂縫的提取和識別
對于二值圖像的連通域標記處理操作就是從白色像素(通常用“1”來表示)和黑色像素(通常用“0”表示)組成的一幅點陣圖像中,將互相鄰接(一般研究的是4鄰域連接)的目標“1”值像素集合提取出來,并為圖像中不同的連通域填入不等的數(shù)學標記。該處理過程是圖像處理和分析中一個非常重要的基礎操作,有著廣泛的應用領(lǐng)域。
為了對圖像的連通域進行標記,需要對一幅圖像作從左到右,從上到下的水平掃描。需檢測當前被掃描到的點是不是和周圍的點連通,需要檢查當前的像素和以前標記過的鄰近像素的值是否一樣。如果當前像素的值和鄰近像素的值一樣,就表示它們連通,反之,就表示和此鄰近像素不連通,此時當前點就要給一個新的標記,同時標記保留在一個與原二值圖像像素點個數(shù)相同的二維數(shù)組中。
令S代表一幅圖像中的像素子集,如果在S中全部像素之間存在一個通路,則可以說兩個像素p和q在S中是連通的。對于S中的任何像素p,S中連接到該像素的像素集叫做S的連通分量。如果S僅有一個連通分量,則集合S叫做連通集。在很多場合,二值圖像提取連通分量是許多自動圖像分析應用的核心任務。
現(xiàn)場圖像經(jīng)過二值化處理后,形成多個互不相連的區(qū)域,而單個區(qū)域都是連通的,將連通域分開標記,就可以得到多個獨立的區(qū)域,連通域標記算法可以找到圖像中所有的連通成分,并對同一連通成分的所有點分配同一標記。
具體算法如下:
(1)將所有的白色像素(背景)賦值為0,所有黑色像素(裂縫連通域所在)賦值為-1,連通域個數(shù)置為0;
(2)尋找一個連通域開始的像素(值為-1),并將其值改為當前連通域數(shù),存儲,連通域個數(shù)增加1;
(3)所有像素搜索。找到值為-1的像素(表示沒有被搜索過),正向搜索其周圍有沒有值為當前連通域數(shù)的像素。如果有,將當前像素賦以連通域的值;
(4)如果沒有像素被搜索,表示當前所有像素已被遍歷,轉(zhuǎn)步驟2;
(5)如果步驟2中沒有找到開始像素,表示所有連通域已經(jīng)被遍歷。
5 結(jié)語
本文利用圖像處理技術(shù),針對膠帶撕裂圖像中的裂縫進行識別,分析了該圖像的特點,通過圖像預處理,圖像切割,以及連通域檢測三個步驟識別裂縫。取得了以下的成果。
(1)裂縫圖像預處理。分析裂縫圖像的像素分布,得到其分布上有相似灰度級出現(xiàn)概率不同的特點。并且分析了裂縫圖像中的噪聲來源。針對其特點選用中值濾波。這個模塊主要完成了彩色圖像的灰度化、灰度拉伸、中值濾波處理。
(2)裂縫的邊緣檢測。比較了幾種邊緣檢測的方法,得到了效果最好的Sobel邊緣檢測方法,方便下一步的裂紋檢出。
(3)裂縫檢出。經(jīng)過前期處理后,圖像中的裂縫從背景中分離出來,每個裂紋形成一個像素互相連通的區(qū)域,利用連通域檢測算法,從而將裂紋檢測出來。
[參考文獻]
[1] 黃民,李恩等.鋼繩芯輸送帶縱向撕裂監(jiān)測方法研究[J].中國礦業(yè)大學學報,2002.31.
[2] 劉英林.輸送帶縱向撕裂的檢測與監(jiān)視[J].山西礦業(yè)學報,1995(13).
[3] 吳劍鋒,張紅衛(wèi).膠帶輸送機膠帶損壞原因及運行理論分析[J].中州煤炭,2005,2.
篇3
1.數(shù)字圖像處理技術(shù)的內(nèi)容及特點
1.1 研究內(nèi)容
不管應用到哪個領(lǐng)域的圖像處理圖像數(shù)據(jù)都要輸入、加工和輸出圖像,其研究內(nèi)容:
(1)獲取、表示和表現(xiàn)圖像――把圖像信號轉(zhuǎn)化為計算機可以識別的形式,并把數(shù)字圖像顯示和表現(xiàn)出來。
(2)圖像復原――已知圖像發(fā)生退化的緣由時,對圖像進行修復,關(guān)鍵是建立退化模型。復原是以模型和數(shù)據(jù)的圖像恢復為基礎,消除退化的影響。
(3)圖像增強――對圖像質(zhì)量的常規(guī)改善。當不知道圖像退化原因時,還可用此技術(shù)比較主觀的改善圖像。
(4)圖像分割――人類視覺系統(tǒng)可以輕松地將觀察到的對象區(qū)分開來,但計算機卻很難。分割的基本問題目前是將各種方法融合使用,以此提高處理的質(zhì)量。
(5)圖像分析――檢測和測量圖像中的目標,獲取其客觀信息,是從圖像到數(shù)據(jù)的過程。
(6)圖像重建――指從數(shù)據(jù)到圖像的處理。
(7)圖像壓縮編碼――為減少數(shù)據(jù)容量、降低數(shù)據(jù)率、壓縮信息量,在不影響其效果的前提下減少圖像的數(shù)據(jù)量。
1.2 數(shù)字圖像處理技術(shù)的特點
(1)圖像再現(xiàn)性好――不會因為對圖像的變換操作而影響到圖像質(zhì)量;
(2)圖像處理精度高――可以將圖像數(shù)字處理為任意大小的數(shù)組;
(3)適用面寬――來自不同信息源的圖像被變換為數(shù)字編碼形式后,都可以用數(shù)組來體現(xiàn)灰度圖像。
(4)靈活性高――圖像處理可完成線性及非線性處理。
2.應用領(lǐng)域
數(shù)字圖像處理技術(shù)被應用到越來越多的領(lǐng)域中,如醫(yī)療保健、航空航天、交通通信、軍事、工業(yè)、農(nóng)業(yè)、林業(yè)等。下面選取幾方面進行分析:
(1)試聽資料證據(jù)――視聽資料證據(jù)是重要的訴訟證據(jù),在司法訴訟活動中發(fā)揮著越來越重要的作用,數(shù)字圖像處理技術(shù)是視聽資料證據(jù)中圖像證據(jù)資料技術(shù)性司法鑒定的常用手段,是圖片原始性、真?zhèn)涡浴⑾嚓P(guān)性認定的基本方法,如名捕監(jiān)控錄像模糊圖像處理系統(tǒng),該系統(tǒng)是手印、足跡、槍彈痕跡、工具痕跡、印章檢驗、文件檢驗以及錄像帶處理等痕檢、文檢、視頻圖像處理工作的必備工具;以及實時視頻降噪儀,能夠?qū)崟r處理現(xiàn)場錄像流,增強視頻的清晰度,該在錄像安全系統(tǒng)中加強監(jiān)視錄像的清晰度,或者在警方實地調(diào)查拍攝錄像后回到警署再進行降噪。
(2)電子商務――當前的電子商務中,圖像處理技術(shù)也大有可為,如身份認證、產(chǎn)品防偽和水印技術(shù)等。
(3)軍事公安領(lǐng)域――軍事的目標是偵察、制導和警戒系統(tǒng)和自動滅火器的控制及反偽裝;公安部門的現(xiàn)場照片、指紋、手跡、印章和人像等的處理和辨識;歷史文字和圖片檔案的修復和管理等。而數(shù)字圖像處理技術(shù)將數(shù)碼攝影和圖像處理技術(shù)結(jié)合起來以其獨特的優(yōu)勢在公安領(lǐng)域中逐步開始擔當重任,在刑事攝影、檔案管理、痕跡檢驗、文件檢驗、法醫(yī)、物證提取以及公安教學或宣傳中發(fā)揮著巨大作用,為廣大的公安人員開闊了視野、拓展了思維空間,為執(zhí)法的公正性提供了有力保證,應用提高了工作效率,減少了人、財、物的消耗,大大提高了工作效率。
(4)智能交通――圖像處理具有算法柔性大、適應能力強等特點,在智能交通系統(tǒng)中取得了廣泛的應用價值,例如車牌識別(車牌定位、車牌傾抖校正與字符分割、車牌字符識別變換等)和車輛檢測與跟蹤系統(tǒng)(包括感興趣區(qū)域提取、車輛檢測、車輛跟蹤等),智能車輛導航、車型識別、交通控制等。
(5)航空航天通信――包括圖像傳輸、電視電話和視會議等,主要是進行圖像壓縮甚至理解基礎上的壓縮。
(6)遙感技術(shù)――航空航天和衛(wèi)星搖撼圖像獲取中和獲取后都要用圖像處理技術(shù)進行加工處理,提取出有利用價值的信息。主要用來對地形地質(zhì)、礦藏資源搜索以及農(nóng)業(yè)、水利、森林和海洋等資源調(diào)查研究,對自然災害進行預測預報、檢測環(huán)境污染、處理氣象衛(wèi)星云圖以及識別地面軍事目標。
(7)生物醫(yī)學領(lǐng)域――圖像處理在醫(yī)學界的應用非常廣泛,圖像處理首先應用于細胞分類、染色體分類和放射圖像等,臨床診斷和病理研究中都大量接住了圖像處理技術(shù)。它的直觀、安全方便、無創(chuàng)傷的優(yōu)點受到醫(yī)生和患者的青睞。
(8)工業(yè)生產(chǎn)中的應用――在生產(chǎn)線中對產(chǎn)品及部件進行無損檢測
(9)機器人視覺――機器視覺相當于智能機器人的重要感覺器官,可以對三維景物進行理解,醫(yī)院、工廠、郵政以及家庭中的智能機器人,識別和定位裝配線工件,太空機器人的自動操作。
(10)視頻及多媒體系統(tǒng)――目前,電視制作系統(tǒng)中廣泛使用圖像處理、變換和合成技術(shù),使電視效果更佳。在多煤體系統(tǒng)中廣泛使用靜止圖像和動態(tài)圖像的采集、處理、存儲、傳輸和壓縮,以達到使用者的目的。
(11)科學可視化――圖像處理和計算機圖形學的緊密結(jié)合,使科學研究得各個領(lǐng)域有了更為新穎的研究工具。
(12)宇宙探測――由于探索太空的需要和太空技術(shù)的快速發(fā)展,需要用數(shù)字處理技術(shù)來處理從外太空獲取的大量星體照片。
(13)地質(zhì)勘探――近年來發(fā)展起來的以數(shù)字圖像處理技術(shù)為基礎、綜合多門學科知識的地學信息處理新技術(shù)的多源地學信息綜合圖像處理,使用一些特定的圖像處理方法,實現(xiàn)了多源地學信息綜合圖像處理,用來輔助地質(zhì)填圖,構(gòu)造地質(zhì)研究,進行寸產(chǎn)資源的預測和評估,成為當前地質(zhì)工作者正在研究和探討的一個問題。
由圖像處理技術(shù)在以上幾個領(lǐng)域中的應用可以看出,圖像處理技術(shù)在各領(lǐng)域中的重要程度:計算機圖像生成技術(shù)在航空航海中可以充當仿真訓練系統(tǒng),還可以應用到廣告和動畫制作,跟友人將其應用到網(wǎng)游中;圖像傳輸與通信還可在多媒體教學、網(wǎng)絡視頻領(lǐng)域得到廣泛應用;在醫(yī)學上,醫(yī)學圖像處理和材料分析也日益重要,如超聲成像、X光成像、Y光成像以及核磁共振成像,對醫(yī)生工作產(chǎn)生了巨大的輔助;圖像跟蹤和光學制導在戰(zhàn)略技術(shù)武器中發(fā)揮了重要作用。
3.發(fā)展方向
隨著計算機的發(fā)展,圖像處理技術(shù)將越來越成熟,對各領(lǐng)域的影響也越來越大,總的來說,圖像處理技術(shù)的發(fā)展有以下幾個趨勢:
(1) 在目前的基礎上,圖像處理速度越來越快,分辨率越來越高,多媒體應用光來月廣泛,標準化、立體化程度越來越高,并產(chǎn)生智能化的趨勢;
(2) 在目前二維基礎上將出現(xiàn)多維成像的趨勢;
(3) 芯片廣泛運用到圖像處理技術(shù)中,使用起來更加方便;
(4) 將出現(xiàn)新的算法與理論。
圖像處理技術(shù)在各個領(lǐng)域的應用與發(fā)展,大大降低了相應領(lǐng)域的工作難度,效率更高,質(zhì)量也無可挑剔,使人類受益匪淺。日后圖像處理技術(shù)將進一步根據(jù)人類需求,在相關(guān)科研人員的努力奮斗下而實現(xiàn)新的突破,在更為廣闊的領(lǐng)域造福人類事業(yè)。
參考文獻
[1] 李紅俊,韓冀皖.數(shù)字圖像處理技術(shù)及其應用. 計算機測量與控制,2009.
[2]W.K.Pratt.DIGITAL IMAGE PROCESSING.Johnwiley & Sons,inc, 2008.
[3]楊枝靈,王開.Visual C++數(shù)字圖像獲取、處理及實踐應用.人民郵電出版社,2003
篇4
1巖土力學的研究現(xiàn)狀
巖土力學是近展起來的一門新興學科,也是力學和地學相結(jié)合的一個基礎學科。過去,工程中遇到的巖土工程問題,往往多憑經(jīng)驗解決,但工程實踐表明,單憑經(jīng)驗越來越難以適應日益發(fā)展的工程規(guī)模和工程的復雜性,從而在工程設計中預測巖土工程的可靠性和穩(wěn)定性,并使工程具有盡可能的經(jīng)濟性,這些巨大的工程建設問題,大大促進了巖土力學的發(fā)展。
巖土力學試驗是巖土力學發(fā)展的基礎,它包括實驗室?guī)r土力學參數(shù)的測定、現(xiàn)場巖體的原位試驗及監(jiān)測技術(shù)、巖體構(gòu)造的測定等。隨著試驗設備和技術(shù)手段的提高,巖土力學的試驗水平有了較大的發(fā)展,如常規(guī)的單軸拉伸、巖體弱面直剪試驗、巖土應力應變破壞全過程試驗和巖土流變等.
巖土損傷力學研究的重點是建立損傷變量和損傷擴展之間的本構(gòu)關(guān)系,自從掃描電鏡技術(shù)引入巖土損傷研究以來,我國學者在這方面進行了大量的研究工作。許江[1]等采用帶有加載裝置的光學顯微鏡進行了砂巖在不同加載階段的損傷裂紋分析;孫鈞等[2]采用帶有微型加載裝置的掃描電鏡對巖土的微損傷擴展進行研究。這些研究有力地推動了巖體損傷力學的發(fā)展。另外,楊更社等[3]在巖土損傷CT識別方面進行了嘗試性的研究。
分形幾何由于可以很好地描述巖土力學中的不規(guī)則性和不確定性,在巖土力學領(lǐng)域得到了不同程度的應用。
2數(shù)字圖像技術(shù)在巖土力學研究中的應用
2.1傳統(tǒng)研究趨勢的轉(zhuǎn)變
隨著巖石力學的發(fā)展,研究工作的重點已經(jīng)從建立在均勻介質(zhì)假設基礎上的巖石宏觀力學行為研究轉(zhuǎn)向巖石內(nèi)部細觀和微觀結(jié)構(gòu)對其宏觀力學性質(zhì)影響的研究。巖石斷面的數(shù)字圖像包含了我們所關(guān)注的大量巖石細觀信息,其處理技術(shù)也正隨著計算機的發(fā)展日新月異。
近20 年來,數(shù)字圖像處理(digital image processing ,簡稱 DIP)作為一種材料細觀空間結(jié)構(gòu)及幾何形態(tài)的精確量測和數(shù)字表述手段快速地被應用于瀝青混凝土、土和巖體的細觀結(jié)構(gòu)定量分析中[4]。特別是其在巖石工程中的應用為人們?nèi)嬲J識巖石的非均勻性、內(nèi)部結(jié)構(gòu)特征、各組分的形態(tài)特征及相應的細觀力學特性開辟了新的道路
2.2數(shù)字圖像技術(shù)在研究巖土力學方面的優(yōu)越性
數(shù)字圖像處理技術(shù)作為一種材料細觀尺度上的空間結(jié)構(gòu)精確測量和數(shù)字表述手段,已廣泛應用于土、巖石及混凝土的細觀結(jié)構(gòu)定量分析中。應用數(shù)字圖像處理進行的巖石細觀力學研究是對巖石力學研究方法的革新數(shù)字圖像量測技術(shù)是一種非接觸無損量測技術(shù),克服了接觸量測容易對測量體造成擾動、破壞以及測量誤差大、工作效率低等缺點,并且可以進行局部變形量測以及動態(tài)量測。
3 結(jié)論
隨著巖石力學的發(fā)展,研究工作的重點已經(jīng)從建立在均勻介質(zhì)假設基礎上的巖石宏觀力學行為研究轉(zhuǎn)向巖石內(nèi)部細觀和微觀結(jié)構(gòu)對其宏觀力學性質(zhì)影響的研究。巖石斷面的數(shù)字圖像包含了我們所關(guān)注的大量巖石細觀信息,其處理技術(shù)也正隨著計算機的發(fā)展日新月異。國內(nèi)外發(fā)表的有關(guān)DIP 應用于巖石內(nèi)部結(jié)構(gòu)定量分析及細觀力學計算的研究成果表明,DIP 具有傳統(tǒng)測量和分析手段無可比擬的優(yōu)越性:
(1)數(shù)字圖像量測技術(shù)是一種非接觸無損量測技術(shù),克服了接觸量測容易對測量體造成擾動、破壞以及測量誤差大、工作效率低等缺點,并且可以進行局部變形量測以及動態(tài)量測,這些都是傳統(tǒng)測量方法無法完成的。
(2)DIP 成功地表征了巖石的非均勻性,使我們可以方便、直觀地研究巖石的不同礦物及結(jié)構(gòu)對其宏觀力學性質(zhì)的影響,可以將巖石的巖性劃分得更為具體,這將在巖土工程建設中發(fā)揮重要作用。
綜上所述,數(shù)字圖像處理為巖石內(nèi)部細觀介質(zhì)的空間分布及變形進行精確測量和數(shù)值表述提供了可行途徑,這意味著在理論上可以突破將巖石當作均勻介質(zhì)的傳統(tǒng)假設,從而深化對巖石宏觀力學行為的本質(zhì)認識。巖土工程的建設給巖土力學研究提出了許多挑戰(zhàn)性的課題,為解決重大巖土工程面臨的問題提供強有力的理論工具。
參考文獻
[1] 許江,劉婧,程立朝等.壓剪應力條件下砂巖雙面剪切細觀開裂擴展演化特性試驗研究[J]. 巖石力學與工程學報, 2014, (4):649-657.
[2] 孫鈞.巖土力學在我國的若干進展[J].西部探礦工程,1999,11(1):1-5.
[3] 楊更社.巖土損傷特性的CT識別[J].巖土力學與工程學報,1996,15(1):48-54.
篇5
1 研究背景
2003年4月,中國教育部了《關(guān)于啟動高等學校教學質(zhì)量與教學改革工程精品課程建設工作的通知》,提出精品課程是具有一流教師隊伍、一流教學內(nèi)容、一流教學方法、一流教學管理等特質(zhì)的示范性課程。經(jīng)過幾年的推行實施,國家精品課程在數(shù)量上已具有一定規(guī)模,質(zhì)量上也在逐年提高,但是在課程資源等方面仍然存在不足之處:(1)課程資源庫建設。在《國家精品課程評價指標體系》中,課程資源主要是通過教學內(nèi)容和教學條件兩大項來評價,他們是課程的核心部分,是教學信息設計、組織與呈現(xiàn)等教學設計思想的具體化表現(xiàn)。經(jīng)過這幾年的努力,課程資源建設模塊逐漸約定俗成,絕大多數(shù)課程均有課程介紹、教學大綱、教學安排、授課錄像和試卷習題等,而實驗/實踐稍差,學習/教學指導、電子教材和素材庫等最為薄弱;(2)課程資源類型。精品課程充分發(fā)揮現(xiàn)代教育技術(shù)強大功能,采用各種多媒體技術(shù)來呈現(xiàn)教學信息,如音/視頻、PowerPoint、Word、Flash等,課程資源類型可以分為演示型、過程型、交互型、管理型和評價型5種,但是現(xiàn)在絕大多數(shù)課程都不重視過程型和交互型資源的建設,更是忽略知識管理型和評價型資源的建設[1]。
2 需求分析
精品課程網(wǎng)站的設計與開發(fā),充分發(fā)揮計算機在呈現(xiàn)信息、提供聯(lián)系、激發(fā)動機、學習評價方面等方面優(yōu)勢,彌補了教師、課本、視聽媒體的不足;計算機作為使用者收集和組織信息、探究與批判性思考、合作與交流的工具,能很好的激發(fā)學習者的學習動機,促進有意義學習的發(fā)生;另外,精品課程的設計與開發(fā),突破了時空限制,具有傳播范圍廣的特點,任何人、任何時間、任何地點都可以按各自的興趣選擇任何課程進行學習。總之,精品課程網(wǎng)站的設計很好的適應了當今世界國際化、信息化、知識化等特征的要求,學習者能更好的實現(xiàn)自主學習。《遙感數(shù)字圖像處理》是一門專業(yè)基礎課,是以理論聯(lián)系實踐為主,注重運用,重視上機實踐的一門課程。對于這樣一門操作性較強的課程,設計與開發(fā)它的精品課程網(wǎng)站是非常有必要的。《遙感數(shù)字圖像處理》精品課程網(wǎng)站的設計與開發(fā)依托了校級《遙感數(shù)字圖像處理》精品課程的建設,面向遙感數(shù)字圖像處理專業(yè)的學生,旨在輔助學生完成對本門課程的自主學習,實現(xiàn)學習效果的最優(yōu)化,其目的是為了讓學生通過學習,打牢遙感數(shù)字圖像處理的基礎知識,進而可以運用到實踐中。通過該課程的學習,使學生樹立正確的遙感數(shù)字圖像處理的概念,培養(yǎng)學生良好的計算機實踐習慣,實事求是的科學態(tài)度和嚴謹細致的工作作風,為后繼課程的學習和將來參加社會生產(chǎn)實踐打下基礎。
3 主要技術(shù)簡介
3.1 ASP技術(shù)簡介
ASP是Microsoft Active Server Pages的簡稱,是服務器端腳本編寫的環(huán)境,可以創(chuàng)建和運行動態(tài)、交互的Web服務器應用程序,即可以組合HTML頁、腳本命令和Web頁和基于Web的功能強大的應用程序。ASP不是一種語言,它所使用的語言是Javascript或VBScript,或者是這兩種語言的結(jié)合體。總的來說,ASP具有以下的特點:(1)使用簡單易懂的腳本語言(Javascript或VBScript等),結(jié)合HTML就可以快速開發(fā)出各種各樣的應用程序;(2)不需要編譯,容易編寫,而且代碼在服務器端直接執(zhí)行;(3)ASP源程序在服務器端被執(zhí)行后,將執(zhí)行結(jié)果返回給客戶端,從而提高了源程序的安全性;(4)可使用服務器端腳本來產(chǎn)生客戶端腳本;(5)由于ASP程序在服務器端執(zhí)行,因此只要客戶端使用的瀏覽器可以執(zhí)行HTML代碼即可。這樣便最高限度地保證了ASP程序的通用性;(6)可以使用VB等多種編程語言來開發(fā)ActiveX服務器組件來擴充服務器端程序的功能;(7)使用普通的文本編輯器即可對ASP程序進行設計、修改;(8)ASP提供了幾種內(nèi)置對象使得腳本功能更強大,在其他方面,這些對象完成從瀏覽器中檢索或向瀏覽器發(fā)送信息的功能。總之,ASP是目前網(wǎng)頁制作技術(shù)中最容易學習、靈活性也最大的工具之一。更重要的是它擁有非常好的可擴充性。像標準的HTML文件一樣,ASP包含可以被Web瀏覽器顯示并解釋的HTML標簽。通常放入HTML文件的Java小程序、閃爍文本、用戶端腳本、用戶端ActiveX控件都可以放入Active Server Pages中[4]。
3.2 ACCESS技術(shù)簡介
Microsoft Office Access(前名 Microsoft Access)是由微軟的關(guān)聯(lián)式數(shù)據(jù)庫管理系統(tǒng),是 Microsoft Office的主要成員之一。Access能夠存取 Access/Jet、Microsoft SQL Server、或者任何ODBC兼容數(shù)據(jù)庫內(nèi)的資料。Access 數(shù)據(jù)庫由七種對象組成,它們是表、查詢、窗體、報表、宏、頁和模塊。
表(Table)―是數(shù)據(jù)庫的基本對象之一,是創(chuàng)建其他對象的基礎。表由記錄組成,記錄由字段組成,表用來存貯數(shù)據(jù)庫的數(shù)據(jù),因此又稱數(shù)據(jù)表。
查詢(Query)―查詢可以按索引查找到需要的記錄,按要求篩選記錄并能連接若干個表的字段從而組成新表。
窗體(Form)―窗體提供了一種方便的瀏覽、輸入及更改數(shù)據(jù)的窗口。還可以創(chuàng)建子窗體顯示相關(guān)聯(lián)的表的內(nèi)容。窗體也稱表單。
報表(Report)―報表的功能是將數(shù)據(jù)庫中的數(shù)據(jù)匯總,然后打印,以便
分析。
宏(Macro)―宏相當于DOS中的批處理,用來自動執(zhí)行一系列操作流程。Access列出了一些常用的操作以方便用戶選擇,使用起來十分便捷。
模塊(Module)―模塊的功能和宏相似,但其操作比宏更加精細和復雜,用戶可根據(jù)自己的需求編寫程序。
頁―是特殊的直接連接到數(shù)據(jù)庫中數(shù)據(jù)的一種WEB頁。通過數(shù)據(jù)訪問頁可將數(shù)據(jù)到Internet 或Intranet上,而且可以適用瀏覽器進行數(shù)據(jù)的維護和操作。
參考文獻
[1] 許坦,石.精品課程發(fā)展現(xiàn)狀綜述[J].中國電化教育,2007(5):244.
篇6
Abstract:DSP hardware based license plate recognition system characteristics, analyzes plate region improved positioning algorithm, character segmentation algorithm to improve the efficiency of the license plate recognition.
Key Words:license plate identification;DSP;algorrithm
1 引言
據(jù)公安部相關(guān)數(shù)據(jù)統(tǒng)計,現(xiàn)如今我國汽車保有量已達2.4億輛,且每年的增長率都在15%以上,應用智能交通系統(tǒng)來解決隨之產(chǎn)生的交通問題已是大勢所趨。基于DSP的車牌識別方法是智能化車牌識別的有效方法。現(xiàn)如今,自動車牌識別技術(shù)已被廣泛應用,但由于算法的復雜性與效率的矛盾,及算法于系統(tǒng)上的應用的困難性,對車牌識別的關(guān)鍵算法還有待于更深入的研究。
2 硬件系統(tǒng)結(jié)構(gòu)
通用可編程的DSP芯片的硬件技術(shù)的發(fā)展給數(shù)字圖像處理帶來了飛躍性的進步。要實現(xiàn)車牌識別,需要數(shù)字圖像處理技術(shù)中的很多復雜的算法,基于DSP的車牌識別系統(tǒng)也因此得到了廣泛的研究與應用。為了提高整個系統(tǒng)的可操作性及性價比,當前應用最多的是分布式的處理模式,即聯(lián)合PC機與DSP的優(yōu)勢共同完成車牌識別系統(tǒng),其總體結(jié)構(gòu)及具體結(jié)構(gòu)如(圖1)所示:
3 車牌識別關(guān)鍵算法
算法流程為圖像預處理、車牌定位、車牌分割,最后字符識別。圖像預處理為提高攝像機攝取的圖像質(zhì)量,便于后續(xù)處理。利用DSP技術(shù)在處理車牌識別關(guān)鍵算法中的車牌的定位與字符分割方面優(yōu)勢顯著。
3.1 車牌定位
基于灰度圖像的定位技術(shù)日趨成熟,但彩色圖像包含了圖像的更多信息特征,加之車牌的底色是有規(guī)律可循的,所以基于彩色圖像的定位技術(shù)越來越成為在發(fā)展定位技術(shù)上的突破點。本文定位的思路為:
(1)圖像從RGB空間轉(zhuǎn)換到HSI空間,其算法為(以藍底白色車牌為例):
(3)對二值圖像進行水平投影[1],從車牌固有的矩形特征中的高度特征提取車牌圖像,如圖3所示。再使用特征顏色邊緣檢測法,檢測車牌正確位置,如圖4所示。
(4)根據(jù)車牌固有的矩形特征中的寬度特征,使用垂直投影法提取車牌圖像,如(圖5)所示:
3.2 字符分割
字符分割是字符識別的關(guān)鍵前提。在2013年新交通法規(guī)中規(guī)定,對故意遮擋、污損、不安規(guī)定安裝車牌的扣12分的處罰,這項規(guī)定的出臺,也間接降低了算法的復雜性。本文采用車牌字符間隔的特征在垂直投影中的規(guī)律來進行字符分割。
其算法原理為:
(1)設垂直投影值為T,閾值為V,在確定前還要充分考慮字符粘連、斷裂及“1”字符的特殊性。當時,T=0。
(2)設數(shù)組為從左向右掃描的投影值,當掃描的數(shù)組的值時,字符的寬度設為。根據(jù)規(guī)律[2],單個字符的寬度約為45mm,除第2、3字符的間隔為34mm,其它字符的間隔均為12mm。由此,得出以下3中情況:
(1)時,為字符粘連,取為單個字符的寬度;
(2)且后面的字符也如此時,為字符斷裂,合并這兩個字符;
(3)且不滿足字符斷裂,此字符為數(shù)字“1”。
實驗結(jié)果如(圖6)所示:
4 結(jié)語
本文在以DSP處理器TMS320DM6437嵌入式系統(tǒng)上對以上兩大關(guān)鍵算法進行實驗研究,在150張不同類型的車牌進行識別后,測試結(jié)果的正確率92.3%,且處理的速度達到實時處理的需求。為以后在智能交通控制系統(tǒng)中的車牌識別技術(shù)的提高和發(fā)展提供了參考基礎。
參考文獻
篇7
中圖分類號:TP319
文獻標識碼:A文章編號文章編號:16727800(2017)005004704
0引言
圖像識別是一項利用計算機對圖像進行處理、分析和理解,以識別各種不同模式目標和對象的技術(shù)[1]。圖像識別技術(shù)目前還不能達到人類的認知水平,但在特定應用環(huán)境中,可以通過模式識別或者神經(jīng)網(wǎng)絡的方法來對圖像中的事物進行分類判斷。一般而言,一個數(shù)字字符識別系統(tǒng)主要由3個部分組成,如圖1所示。
圖1系統(tǒng)組成
其中,預處理模塊將圖片格式(例如JPG格式)轉(zhuǎn)換為計算機能識別的二進制數(shù)據(jù)流;圖像處理模塊則實現(xiàn)圖像采集與轉(zhuǎn)換、邊緣提取、歸一化等功能;字符識別模塊可以由兩種方法實現(xiàn):模式識別或者神經(jīng)網(wǎng)絡方式,本文系統(tǒng)采用神經(jīng)網(wǎng)絡方式。
1識別目標及預期結(jié)果
此系統(tǒng)識別目標是在沒有強干擾下,系統(tǒng)能夠準確識別出圖片中的0~9這10個數(shù)字。示例圖片如圖2所示。
系統(tǒng)識別中所用到的含單個數(shù)字的圖片取自圖2,均為純色背景(不一定必須為白色背景)圖片,且圖片中數(shù)字圖像無較大噪聲干擾。系統(tǒng)經(jīng)過一系列處理后,能成功識別,給出識別結(jié)果,并且給出處理過程中各個階段的圖片,以便更好地理解圖像處理過程。
2預處理
預處理是將圖片二值化的過程。預處理的目的簡單來說就是把彩色圖片處理為計算機更好處理的二進制數(shù)據(jù)流。預處理的過程主要分兩部分:彩色圖轉(zhuǎn)灰白圖,灰白圖轉(zhuǎn)二進制矩陣形式數(shù)據(jù)。
目前用于彩色圖轉(zhuǎn)換為灰度圖的基本算法主要有:最大值法、平均值法、加權(quán)法,本文采用加權(quán)法。加權(quán)法的主要思想是設當前像素的三分量分別為R,G,B,然后利用公式(1)得到轉(zhuǎn)換后的像素分量值:
GRAY=0.3*R+0.59*G+0.11*B(1)
在MATLAB中,函數(shù)img2gray就是采用加權(quán)法實現(xiàn)的。圖像二值化就是將圖像像素點的灰度值設置為0或255,也就是將整個圖像呈現(xiàn)出明顯的黑白效果。二值化的處理過程是將圖像中有意義的特征和需要應用的特征進行分割,利用前景和背景灰度特性的差異,低于閾值的像素設定為一個灰度值,高于閾值的像素設定為另一個灰度值。這樣可將前景色與背景色以明顯差異的灰度級區(qū)分開來[2]。閾值選取有手動選取和自適應選取兩種方法。MATLAB中圖像二值化的實現(xiàn)主要依靠im2bw函數(shù)來實現(xiàn)。圖像二值化過程中,最重要的是閾值變換。比如數(shù)組a=[120,254,0,200,99],設定一個閾值125,并對a進行閾值變換,那么a中凡是大于125的,則變?yōu)?55,小于等于125的則變?yōu)?。具體對臨界情況處理可能不同,不過MATLAB中im2bw函數(shù)是按照上述方法處理的。a經(jīng)過閾值變換后變?yōu)閇0,255,0,255,0]。在MATLAB中使用im2bw函數(shù)進行圖像二值化處理時(將圖像轉(zhuǎn)換為二值圖像),人為設定閾值并不總是十分有效。MATLAB工具箱提供了graythresh函數(shù)[3]。該函數(shù)使用最大類間方差法得到一個閾值,利用這個閾值進行圖像二值化通常有效。
經(jīng)過預處理后得到的二值化圖像,還要經(jīng)過一系列圖像處理過程,才能用于神經(jīng)網(wǎng)絡訓練。
3圖像處理
圖像處理的目的是將圖片變?yōu)樯窠?jīng)網(wǎng)絡能處理的數(shù)據(jù)流。圖像處理流程如下:
(1)利用梯度銳化。使得圖像更加突出,以便分析。算法:當前點像素值與其下一個像素值之差的絕對值,加上當前點像素值與其下一行當前像素值之差的絕對值,如果結(jié)果大于閾值,則當前像素值置為此結(jié)果。
(2)去除離散噪聲。利用遞歸方法查找當前像素8個方向是否存在黑色像素,這里設置連續(xù)長度為15,如果用遞歸方法得到連續(xù)像素值大于15,則認為不是噪聲;相反,則認為是噪聲,則置為白色像素。
(3)字符傾斜度調(diào)整。盡量保存每個字符的位置一致。
(4)分割字符。找出每個字符的區(qū)域,用矩形記錄,記錄每個字符矩形數(shù)據(jù)。
(5)字符歸一化。根據(jù)圖像預處理準備階段設置的歸一化標準,把每個字符的區(qū)域進行歸一化,使得所有字符區(qū)域矩形一樣大,只是位置不一樣。
(6)字符緊密排列。把所有字符緊密排列,以備識別使用。
本文示例樣本圖片中只有單個數(shù)字,且無較大干擾,所以不需要去除離散噪聲、字符傾斜度調(diào)整、分割字符和字符緊密排列等步驟。經(jīng)過預處理的圖像數(shù)據(jù),只需要進行銳化和歸一化處理,就可以用于神經(jīng)網(wǎng)絡訓練。
圖像梯度銳化的目的是使原來的模糊圖像變得清晰。MATLAB中使用的梯度函數(shù)為gradient函數(shù)。Gradient(F)函數(shù)求的是數(shù)值上的梯度,計算規(guī)則:[Fx,F(xiàn)y]=gradient(F),其中Fx為其水平方向上的梯度,F(xiàn)y為其垂直方向上的梯度,F(xiàn)x的第一列元素為原矩陣第二列與第一列元素之差,F(xiàn)x的第二列元素為原矩陣第三列與第一列元素之差除以2,以此類推,如公式(2)。
最后一列則為最后兩列之差。同理,可以得到Fy。
歸一化就是把需要處理的數(shù)據(jù)經(jīng)過處理后(通過某種算法)限制在要求范圍內(nèi)。對于圖像處理中的w一化而言,就是將所有數(shù)字圖像中的字符歸化成為一個具有同一高度、同一寬度的圖像,也即讓其中的字符具有同樣規(guī)格。MATLAB中用于實現(xiàn)圖像矩陣歸一化功能的函數(shù)是mat2gray函數(shù)[5]。該函數(shù)在數(shù)字圖像處理中經(jīng)常用到,歸一化的具體流程如圖4所示。
經(jīng)過歸一化處理之后的圖片數(shù)據(jù),將其存儲在一個矩陣中,用于神經(jīng)網(wǎng)絡的訓練。
4神經(jīng)網(wǎng)絡訓練
人工神經(jīng)網(wǎng)絡算法主要有兩種:一種是先對待識別字符進行特征提取,然后用所獲得的特征來訓練神經(jīng)網(wǎng)絡分類器[6];另一種方法是直接把待處理圖像輸入網(wǎng)絡,由網(wǎng)絡自動實現(xiàn)特征提取直至識別出結(jié)果。前一種方法識別結(jié)果與特征提取有關(guān),而特征提取比較耗時。因此,特征提取是關(guān)鍵。后一種方法無需特征提取和模板匹配,隨著相關(guān)技術(shù)的進步,這種方法更實用。
神經(jīng)網(wǎng)絡有許多種,在MATLAB中已經(jīng)有集成神經(jīng)網(wǎng)絡工具箱。本文系統(tǒng)中,對數(shù)字圖像的識別采用BP神經(jīng)網(wǎng)絡來進行訓練。BP神經(jīng)網(wǎng)絡為前饋神經(jīng)網(wǎng)絡,網(wǎng)絡的學習狀態(tài)為有導師學習狀態(tài)。它是一種具有學習能力和記憶能力的神經(jīng)網(wǎng)絡,主要由輸入層、中間層、輸出層3個部分組成。輸入層、中間層和輸出層可以具有不同數(shù)量的節(jié)點,具體數(shù)量隨需求而定,沒有具體的標準。單層神經(jīng)網(wǎng)絡結(jié)構(gòu)如圖6所示。
BP神經(jīng)網(wǎng)絡是誤差反傳誤差反向傳播算法的學習過程,由誤差的反向傳播和信息的正向傳播兩個過程組成[7]。輸入層各神經(jīng)元首先接收來自外界的輸入信息,然后傳遞給中間層各神經(jīng)元;輸入信息經(jīng)過中間層內(nèi)部信息處理,實現(xiàn)信息變換,按照信息變化能力需要,中間層可以布局成多隱層或者單隱層結(jié)構(gòu);最后,一個隱層傳遞把信息傳遞給輸出層,通過進一步處理,實現(xiàn)一次學習的正向傳播處理過程,輸出層把信息處理結(jié)果輸向外界。當輸出結(jié)果和預先期望效果不符時,就進行誤差反向傳播。誤差通過輸出層,根據(jù)誤差梯度下降的方式改變各層權(quán)值,由隱層向輸入層依次反傳。多次交替的信息正向傳播和誤差反向傳播過程,是各層連續(xù)修正的過程,也是神經(jīng)網(wǎng)絡學習訓練的過程,這個步驟一直執(zhí)行到最終輸出的誤差降低到能夠接受的范圍,或者預先輸入的學習次數(shù)為止。
此系統(tǒng)中所使用的神經(jīng)網(wǎng)絡在中間層設置25個節(jié)點,1個輸出節(jié)點。此系統(tǒng)采用三層神經(jīng)網(wǎng)絡來實現(xiàn)。采用s型對數(shù)函數(shù)logsig作為隱含層各神經(jīng)元的傳遞函數(shù),并采用純線性函數(shù)purelin作為輸出層各神經(jīng)元的傳遞函數(shù)。此神經(jīng)網(wǎng)絡的訓練函數(shù)采用traingdx,學習模式函數(shù)為learngdm。訓練步數(shù)最長設為5 000,性能目標設為0.001。
神經(jīng)網(wǎng)絡模塊的部分代碼如下:
net=newff(pr,[25 1],{'logsig' 'purelin'},'traingdx','learngdm');
net.trainParam.epochs=5000;
net.trainParam.goal=0.001;
pr為前面圖像處理所獲得的矩陣數(shù)據(jù)。
神經(jīng)網(wǎng)絡的訓練結(jié)果如圖7所示。神經(jīng)網(wǎng)絡的性能曲線如圖8所示。
5用艚換
考慮到該系統(tǒng)具有一定交互功能,讓用戶能自主選擇需要識別的圖片,向系統(tǒng)中添加如下代碼段:
test=input('請輸入用于測試的圖片編號:','s');
x=imread(test,'jpg');
開始運行時,會提醒用戶選擇需要識別的圖片編號,效果如圖9所示。
用戶輸入需要識別的圖片序號后,系統(tǒng)給出識別結(jié)果和圖像處理各階段中的圖片,此處用subplot函數(shù)來實現(xiàn)一個窗口中顯示多張圖片的效果,部分代碼如下:
6結(jié)語
通過樣本識別驗證,本文數(shù)字識別系統(tǒng)具有一定識別精度。本系統(tǒng)基本做到樣本圖片的100%識別,對于其它只有單數(shù)字的圖片,經(jīng)過訓練之后,也能準確識別。本系統(tǒng)實現(xiàn)了部分人機交互功能,能讓用戶自主選擇需要識別的圖片,并輸出識別結(jié)果和各個處理過程中的圖片。
參考文獻參考文獻:
[1]岡薩雷斯.數(shù)字圖像處理(MATLAB版)[M].阮秋琦,譯.北京:電子工業(yè)出版社,2006.
[2]梁路宏,艾海舟,徐光佑,人臉檢測研究綜述[J].計算機學報,2002,25(5):449458.
[3]羅華飛.MATLAB GUI設計學習手記[M].北京:北京航空航天大學出版社,2009.
[4]聶影.MATLAB軟件應用研究[J].軟件導刊,2014,13(7):102104.
篇8
近年來,機器人視覺導航技術(shù)有了很大的發(fā)展。移動機器人的工作環(huán)境可能比較復雜,因此,提高圖像識別的準確性以實現(xiàn)移動機器人的準確定位是移動機器人完成其導航任務的首要前提;同時,由于移動機器人在導航過程中需要實時的采集并分析圖像信息,從而實現(xiàn)對作業(yè)環(huán)境的識別以進行準確的路徑跟蹤。因此,如何在提高圖像識別的準確性的同時達到較好的實時性是移動機器人視覺技術(shù)的一個發(fā)展方向
1.圖像處理
數(shù)字圖像處理,是對數(shù)字圖像信息進行加工以滿足人的視覺心理或應用需求的行為,數(shù)字圖像處理的英文名稱是"Digital Image Processing'',通常所說的數(shù)字圖像處理是指用計算機對圖像進行的處理,因此也稱為計算機圖像處理。圖像處理就是用一系列的特定操作來改變圖像的像素,以達到特定的目標,比如使圖像更清晰,或者從圖像中提取某些特定的信息等。
CCD攝像頭的主要工作原理具體而言,就是攝像頭連續(xù)地掃描圖像上的一行,輸出就是一段連續(xù)的電壓視頻信號,該電壓信號的高低起伏正反映了該行圖像的灰度變化情況。當掃描完一行,視頻信號端就輸出低于最低視頻信號電壓的電平(如0.3v),并保持一段時間。這樣相當于,緊接著每行圖像對應的電壓信號之后會有一個電壓"凹槽",此"凹槽"叫做行同步脈沖,它是掃描換行的標志。然后就需要跳行,跳過一行后(因為攝像頭是隔行掃描的方式),開始掃描新的一行,如此下去,直到掃描完該行的視頻信號,接著就會出現(xiàn)一段場消隱區(qū)。此區(qū)中有若干個復合消隱脈沖,其中會有個脈沖遠寬于(即持續(xù)時間長于)其它的消隱脈沖,該消隱脈沖又稱為場同步脈沖,它是掃描換行的標志。場同步脈沖標志著新的一場的到來,不過,場消隱區(qū)恰好跨在上一場的結(jié)尾部分和下一場的開始部分,要等到場消隱區(qū)過去,下一場的視頻信號才真正到來。攝像頭每秒掃描25幅圖像,每幅又分奇、偶兩場,先奇場后偶場,故每秒掃描50場圖像。奇場時只掃描圖像中的奇數(shù)行,偶場時則只掃描偶數(shù)行。
選擇一款具有全電視信號輸出的黑白CCD圖像傳感器,用LMl881進行信號分離,結(jié)合A/D采樣,實現(xiàn)了視頻信號的采集。在總線周期為400M的情況下,每行采集72個有效數(shù)據(jù),攝像頭每場信號有320行,其中第23到310行為視頻信號。我們從中均勻采集了24行,最后得到一個24×72的二維數(shù)組。
CCD采集的原始數(shù)據(jù)包含了黑線的位置信息,為了穩(wěn)定可靠地提取這一信息,有一下幾種方法:
(1)二值化算法
算法的思路是:設定一個閾值value,對于視頻信號矩陣中每一行,從左至右比較各像素值和閾值的大小。若像素值大于等于閾值,則判定該像素對應的是白色道路;反之,則判定對應的是目標指引線。記下第一次和最后一次出現(xiàn)像素值小于閾值時的像素點的列號,算出兩者的平均值,以此作為該行上目標指引線的位置。該算法的思想簡單,具體實現(xiàn)時還可以一旦檢測到左邊緣后就退出該行掃描,這樣上面的流程圖將變得更加簡潔。但是這種提取算法魯棒性較差,當拍攝圖像中只有目標指引線一條黑線時,還能準確提取出目標指引線。但當光強有大幅度的變化,或圖像中出現(xiàn)其它黑色圖像的干擾時,并且離機器人比較近的黑線比較的明顯,離機器人越來越遠時黑線越來越淡,該算法提取的位置有可能與目標指引線的實際位置偏離較大。
(2)直接邊緣檢測算法
算法的思路是:設定一個閾值,對于視頻信號矩陣中每一行,從左至右求出相鄰兩像素值的差值(左減右)。若差值大于等于閾值,則判定下一個的像素點對應的是目標指引線的左邊緣,以此像點作為該列的特征點,記錄下此像素點的列號,作為該行上目標指引線的位置。當然,可能出現(xiàn)差值始終小于閾值的情況,此時一種方法是令該行上目標指引線位置為0,通過進一步濾波或擬合來修正;另一種方法是讓該行上目標指引線位置和通過上一場視頻數(shù)據(jù)求得的位置一樣。
該算法較二值化方法而言,抗環(huán)境光強變化干擾的能力更強.同時還能削弱或消除垂直交叉黑色指引線的干擾。因為該算法在視頻信號矩陣中是由左至右來尋找目標指引線的左邊緣的,所以當黑色圖像出現(xiàn)在目標指引線左方時,該算法無法排除干擾,而當其出現(xiàn)在右方時,則可以排除干擾。
(3)跟蹤邊緣檢測法
這種算法跟直接邊緣榆測算法一樣,也是尋找出目標指引線的左邊緣,仍然用左邊緣的位置代表目標指引線的位置。但跟蹤邊緣檢測從視頻信號矩陣每行中尋找左邊緣的方法與直接邊緣檢測法不同。
因為目標指引線是連續(xù)曲線,所以相鄰兩行的左邊緣點比較靠近。跟蹤邊緣檢測正是利用了這一特性,對直接邊緣檢測進行了簡化。其思路是:若已尋找到某行的左邊緣,則下一次就在上一個左邊緣附近進行搜尋。這種方法的特點是始終跟蹤每行左邊緣的附近,去尋找下一列的左邊緣,所以稱為"跟蹤"邊緣檢測算法。
在首行邊緣檢測正確的前提下,該算法具有較強的抗干擾性,能更有效地消除垂直交叉黑色指引線的干擾,以及指引線外黑色圖像的影響,始終跟蹤目標指引線。
另外,較之前兩種算法,跟蹤邊緣檢測算法的時間復雜度更低,因此效率更高。但值得注意的是第一行的左邊緣位置對整個目標指引線的搜尋影響 很大,一旦它的位置和實際導引線偏差較大,就會產(chǎn)生一連串的錯誤,這是不可容忍的。
通過比較本系統(tǒng)選擇了效率更高,更可靠的跟蹤邊緣檢測法。流程圖如圖所示:
2.結(jié)論
本文中圖像處理和路徑信息識別的方法,并對不同時刻不同位置采集到的圖像的處理效果進行比較研究,結(jié)合實際環(huán)境中的圖像特點,確定出適合于本研究的圖像處理算法。提出了改善路徑信息辨識速度和精度的方法。
參考文獻:
[1]張文志,呂恬生.基于改進的遺傳算法和模糊邏輯控制的移動機器人導航[J].機器人.2003,
25(1):1
[2]邱茂林,馬頌德,李毅.計算機視覺中攝像機定標綜述[J].自動化學報.2000,26(1):44-45
篇9
近年來,人們提出了許多方法用于檢測和跟蹤序列圖像中的運動目標,但是由于受到計算機速度和算法復雜度的限制,使得在檢測和跟蹤運動目標的實時性和魯棒性方面總是不太理想。同時在設備不斷小型化、集成化、網(wǎng)絡化的今天,F(xiàn)PGA由于其可編程的特點成為嵌入式開發(fā)的最佳平臺。因此,本設計核心模塊為Altera公司的Cyclone系列FPGA EP4CGX150DF3117N核心處理器,以提高系統(tǒng)的整體的性能。[1]
2 系統(tǒng)工作流程和原理
系統(tǒng)主要由一體化攝像機、高速數(shù)字云臺、視頻解碼器SAA7113H、圖像存儲器SRAM,F(xiàn)PGA控制器、以太網(wǎng)模塊、監(jiān)視器、報警模塊等部分構(gòu)成。
該跟蹤系統(tǒng)的工作過程為:系統(tǒng)開機后FPGA加載程序,然后根據(jù)算法對采集到的圖像進行處理,獲得控制云臺的參數(shù)并傳遞給云臺控制器,從而跟蹤目標運動。具體實現(xiàn)過程:攝像頭安裝在跟蹤轉(zhuǎn)臺上,攝像頭輸出的電視制式的信號(含有圖像和同步、行場消隱信號)一路送到監(jiān)視器上進行實時監(jiān)視,另一路經(jīng)過視頻預處理,經(jīng)過SAA7113變換后送入圖像處理單元FPGA進行圖像處理,圖像處理單元首先形成一個檢測(波門)窗口,然后在窗口中檢測、識別、提取出目標圖像信號,確定出目標在當前幀觀測圖像中的精確坐標,經(jīng)計算得到相對于攝像頭瞄準線的偏差量,送至伺服機構(gòu),云臺輸出控制信號控制步進電機轉(zhuǎn)動,帶動云臺上的攝像頭轉(zhuǎn)動,使目標始終處于視場中心,從而達到跟蹤的目的[2]。通過以太網(wǎng)上傳目標坐標數(shù)據(jù),用于進一步分析。
3 裝置硬件的具體實現(xiàn)
本裝置對核心處理器、視頻解碼芯片,以太網(wǎng)模塊等器件的選擇關(guān)系到整個裝置的性能和價格,即選擇性能價格比高且能滿足設計需要的器件。
3.1核心處理器選擇
處理器需要根據(jù)算法及實際被測目標對處理能力的要求來選擇。目前的處理器主要有單片機、ARM、DSP、FPGA等等。本裝置核心模塊主要是Altera公司的Cyclone系列FPGA EP4CGX150DF3117N,該芯片有149760個邏輯單元,RAM 635520 bit, 8個鎖相環(huán),用戶I/O 508個,芯片具有很高的性價比,還支持SOPC ,從而完成各模塊功能,并協(xié)調(diào)整個系統(tǒng)工做。芯片功能很強大,為以后系統(tǒng)升級,算法改進,數(shù)據(jù)量增大提供很大空間。
3.2 視頻解碼芯片SAA7113 和以太網(wǎng)W5100配置
為了使視頻解碼芯片SAA7113H可以按照預想的方式工作,需要對其進行初始化,視頻解碼芯片為I2C串行總線,在上電后首先修改SAA7113H的內(nèi)部寄存器的數(shù)值,進行正確初始化[3]。
W5100是一款多功能的單片網(wǎng)絡接口芯片,內(nèi)部集成10/100以太網(wǎng)控制器,內(nèi)部集成為全硬件形式,且具有經(jīng)過多年市場驗證的TCP/ IP協(xié)議棧,太網(wǎng)介質(zhì)傳輸層MAC和物理層PHY 硬件,TCP/IP等協(xié)議已經(jīng)在很多領(lǐng)域經(jīng)過多年驗證[4]~[5]。
W5100內(nèi)部集成有16KB的存儲器用于數(shù)據(jù)傳輸,使用W5100不需要考慮以太網(wǎng)的控制,只要進行簡單的端口SOCKET編程。此外,其接口非常簡單,可選擇SPI接口。
對上述兩個模塊的設計采用SOPC方法,SOPC是一種用于嵌入式開發(fā)的片上可編程系統(tǒng),設計靈活,可剪裁,可升級軟硬件在系統(tǒng)可編程的功能,運用FPGA 的NIOS II 對 I2C,對SPI口配置過程為:運行QUARTUS II 軟件中的SOPC BUILDER 添加I2C,SPI 模塊,從而構(gòu)成功能強大的32位NIOS嵌入式系統(tǒng)。
4 目標的跟蹤定位
確定目標位置的方法分兩類,即波門跟蹤和相關(guān)跟蹤算法。本文采用形心跟蹤算法,該算法對跟蹤窗內(nèi)的數(shù)字圖像處理得到一閾值,再從跟蹤窗內(nèi)的數(shù)字圖像中分割出目標像元,然后根據(jù)分割出的全體目標像元位置數(shù)據(jù)和目標像元的點數(shù),計算出目標的形心,目標的形心相對于視場中心的位置數(shù)據(jù)則作為目標偏差數(shù)據(jù)[6]。
5 結(jié)論
本文介紹了一種移動目標跟蹤裝置。該裝置是以ALTERA公司的FPGA芯片EP4CGX150DF3117N為核心處理器。通過以太網(wǎng)上傳的跟蹤信息來看,看該系統(tǒng)取得了較好的跟蹤效果,實驗結(jié)果證明該裝置能夠很好的適應目標檢測和跟蹤算法,該裝置對運動目標監(jiān)視和跟蹤產(chǎn)品有一定的參考意義。
參考文獻
[1]楊宜禾,周維真.成像跟蹤技術(shù)導論[M].西安電子科技大學出版社,1992.
[2]王栓,艾海舟,何克忠.基于差分圖像的多運動目標檢測與跟蹤[J].中國圖形圖像學報,1994(6).
[3]郝迎吉,劉青,徐凌志.基于EPP和FPGA的CMOS圖像傳感器的數(shù)據(jù)采集[J].電子設計應用,2002(01).
[4]黃釘勁,阮照軍,王剛,郭小莉.基于FPGA的圖像采集與遠程傳輸系統(tǒng)設計[J].西安工業(yè)大學學報,2008.
[5]放璐,楊天怡,牟萬軍.數(shù)字圖像遠程監(jiān)控系統(tǒng)的組網(wǎng)方式[J].電子產(chǎn)品世界,2002(21).
篇10
1993年Mallat和Zhang提出了信號的稀疏表示,在信號逼近上取得了出色的表現(xiàn),迅速引起了廣大學者的普遍關(guān)注,信號稀疏表示研究很快被從一維信號推廣到二維信號圖像的研究上。
稀疏表示的模型可以表示為:
式中為向量的l0范數(shù),表示向量x中非零元素的個數(shù),x即為信號y的稀疏表示。
在數(shù)字圖像處理中,由于圖像的數(shù)據(jù)信息具有冗余性,為冗余字典,因此可以在冗余字典上進行稀疏表示,y則為圖像子塊的列向量表示。如何構(gòu)造表達能力強、訓練簡單的冗余字典是圖像處理中的關(guān)鍵一步,自稀疏表示理論的提出,在圖像去噪、去模糊、超分辨率、圖像修復等方面得到了廣泛的應用,取得了比傳統(tǒng)方法更好的處理結(jié)果。
1 稀疏表示理論在提高數(shù)字圖像質(zhì)量中的應用
Michael Elad是較早將稀疏表示理論應用于圖像去噪與超分辨率的代表人物[1],他將K均值聚類方法引入字典訓練過程中。在K均值算法中,求解一個包括K個代碼的碼本,使得在此碼本上,根據(jù)最鄰近分配法則,對包含N個信號的集合進行分類,得到最佳分類。在稀疏表示中,稀疏表示的過程可以看做廣義矢量量化過程,其中的每個信號用多個代碼的線性組合表示。當要求K-SVD中的每個信號只能用一個原子來近似時,K-SVD算法就退化為K均值算法。K-SVD在稀疏編碼與字典更新之間交替迭代,保證總誤差單調(diào)下降,因此可保證能收斂到局部(或全局)最小值,從而得到性能優(yōu)良的過完備字典。K-SVD訓練字典方法廣泛的應用在圖像復原問題上。基于K-SVD訓練得到的過完備字典,取得了較好的圖像去噪與超分辨率結(jié)果。
統(tǒng)計學中的主成分分析(PCA)的概念,也被引入到字典訓練當中。在統(tǒng)計學當中,變量個數(shù)太多會增加問題的復雜性主成分分析作為一種統(tǒng)計分析方法,它可以從多元事物中解析出主要影響因素,簡化復雜問題。PCA的核心思想,就是將高維數(shù)據(jù)投影到低維空間。尋找 r 個新變量,使其反映事物的主要特征,每個新變量是原有變量的線性組合,體現(xiàn)原有變量的綜合效果,則這 r 個新變量稱之為“主成分”,它們兩兩正交不相關(guān)。這 r 個主成分可以在很大程度上反映原來變量的信息。Hui Zou引入了SPCA(Sparse PCA)的概念,他修改了傳統(tǒng)的PCA方法,利用主成分負載的稀疏性,使算法變得更加易懂,且得到更為稀疏的結(jié)果。
形態(tài)學成分分析(MCA)作為一種新興的信號分解方法,吸引了很多人的注意。MCA根據(jù)圖像信號組成成分的形態(tài)差異性,將圖像內(nèi)容分割為紋理區(qū)域和卡通區(qū)域。不同區(qū)域其擬合字典類型不同。小波變換可以很好的表示圖像光滑區(qū)域的特征,curvelet變換通過帶方向的局部傅里葉基,可以有效的處理邊緣特征。離散余弦變換(DCT)以及Gabor變換是紋理區(qū)經(jīng)常采用的兩種處理方式。MCA充分的考慮了圖像的結(jié)構(gòu)組成部分以及內(nèi)部特征,廣泛用于盲源分離、圖像分解、圖像修補等。
Julien Mairal將自然圖像的自相似性引入到圖像恢復模型中。圖像的自相似性,其根本是自然圖像的統(tǒng)計特征。Julien Mairal非局部模型與稀疏編碼結(jié)合成一個框架,將噪聲在相似塊之間進行平均,取得了較好的去噪、去馬賽克結(jié)果。同樣,自相似性在圖像去模糊、圖像修補方面也展示了其良好的性能。
Weisheng Dong提出了一種新的圖像復原模型CSR,利用減小退化圖像分解系數(shù)與原圖分解系數(shù)之間的差異來達到復原圖像的目的,其本質(zhì)是自相似性的應用。在超分辨率方面,他提出了自適應稀疏域選擇超分辨率算法,認為超分辨率重建結(jié)果的優(yōu)劣很大部分取決于稀疏域的選擇,對輸入的樣本先采用K-均值聚類,采用PCA算法進行詞典訓練,將非局部相似性(NL)和圖像去噪中的自回歸(AR)模型與超分辨率重建模型有效結(jié)合,提高了超分辨率重建質(zhì)量。
Nebojsa創(chuàng)造性的提出了圖像摘要的概念。他將圖像的特征提取為一幅摘要圖,在圖像處理過程中,對該摘要圖進行分解處理,這是合理并且有效的。Louise 利用該思想,在圖像去噪方面取得了較好的去噪結(jié)果。
Kostadin在變換域,通過一組協(xié)作濾波器,將一幅圖像中結(jié)構(gòu)相似的二位塊聚合成一組,形成一個三維模型,以增強其表示的稀疏性。Aram利用該3D理論,建立了一個新的圖像模型―BM3D。BM3D在圖像復原方面表現(xiàn)了其卓越的性能。
最近,保持圖像幾何結(jié)構(gòu)的思想吸引了很多人的注意。Samy Bengio將圖像分割成相互重疊的塊,結(jié)構(gòu)相似的塊組成一個群組,分別對每個組進行分解訓練,這就是群組編碼的思想,其基本思想類似于非局部思想,也是利用了自然圖像的自相似性。關(guān)于結(jié)構(gòu)稀疏方面的研究展示了結(jié)構(gòu)分組比簡單不重疊的分組更一般的特性。例如,樹狀分組或是重疊分組。結(jié)構(gòu)稀疏正則化具有十分廣闊的應用前景。結(jié)構(gòu)稀疏PCA作為一種新型的有效的非凸稀疏方法,在字典訓練方面,可以取得較為理想的結(jié)果。
縱觀稀疏表示理論出現(xiàn)以后的圖像處理論文,廣大研究者著重于研究如何獲得表示能力強的冗余字典,以及通過結(jié)合多重約束,如平滑約束,相似性約束,幾何結(jié)構(gòu)不變性約束等來得到高質(zhì)量的圖像,近年來取得了很大的進展。但是稀疏表示屬于一種優(yōu)化問題,涉及到字典學習和稀疏求解的計算過程比較復雜,因而對于該理論在圖像的實時處理上受到了限制,因此如何縮短計算時間也是這個模型急需解決的問題。
2 結(jié)語
篇11
Image Stitching Technology Overview
Cai Jian
(Nanjing University of Aeronautics and Astronautics,Nanjing210016,China)
Abstract:Today,more and more high-resolution digital images for domestic,industrial,medical and defense technology applied.With computer vision,image processing technology,using an ordinary camera computer digital image composition as a large high-resolution images of the image stitching technology came into being.
Keywords:Image;Stitching technology;Overreview
而在人們的實際生活應用中,所需要的目標場景往往超出普通數(shù)碼相機、監(jiān)控攝像機等的視角范圍。這些相機,往往在增大視角會降低采集圖像的精度,而提高精度又只能窺豹一斑。因此,為了得到應用所需的高分辨、大視角的圖像,人們不得不使用廣角鏡頭和全景拍攝相機,這加大了生產(chǎn)、生活的成本,且使用技術(shù)不為一般人所能熟悉。所謂圖像拼接技術(shù),就是將數(shù)張有重疊部分的圖像(可能是不同時間、不同視角或者不同傳感器獲得的)拼成一幅大型的無縫高分辨率圖像的技術(shù)。圖像拼接的流程大致分為:獲取待拼接的圖像,進行圖像預處理,圖像重疊區(qū)域配準,圖像的無縫融合,輸出所得拼接圖像。其中,圖像配準和圖像融合是圖像拼接成功的關(guān)機,是拼接的關(guān)鍵技術(shù)。因此,國內(nèi)外學者多圍繞此兩項技術(shù)展開研究和討論。
圖像配準是圖像融合的基礎,而且圖像配準算法的計算量一般非常大,因此圖像拼接技術(shù)的發(fā)展很大程度上取決于圖像配準技術(shù)的效率。
一、圖像拼接的應用價值
目前,圖像拼接技術(shù)已經(jīng)數(shù)據(jù)圖像處理研究的熱門方向之一,被廣泛地應用在文物保護(古跡、古文字資料的拼接)、工業(yè)監(jiān)控、刑事案件偵破、醫(yī)學圖像分析、攝影測量學、機器視覺、虛擬現(xiàn)實技術(shù)、超分辨率重構(gòu)、軍事地形圖像生成等領(lǐng)域,有著實際的應用意義和研究價值。主要表現(xiàn)為:
(一)全景圖和超寬視角圖像的合成。將普通圖像或視頻圖像進行無縫拼接,得到超寬視角甚至360°的全景圖,這樣就可以用普通相機實現(xiàn)場面宏大的景物拍攝;
(二)碎片圖像的組合。將醫(yī)學和科研的顯微碎片圖像或者空間、海底探測得到的局部圖像合成大幅的整體圖像;
(三)虛擬現(xiàn)實。圖像拼接是虛擬現(xiàn)實領(lǐng)域里場景繪制(Image-based Rendering,IBR)方法中的一項基本技術(shù),利用圖像拼接技術(shù)可以生成全方位圖像,用全景圖表示實景可代替3D場景建模和繪制。
例如2003年,美國“勇氣號”和“機遇號”火星探測器發(fā)回了大量的火星地面照片,科學家們就是運用圖像拼接技術(shù)合成了火星表面的寬視角全景圖像。
二、圖像拼接的方法
圖像拼接的方法很多,不同的算法步驟會有一定差異,但大致的過程是相同的。一般來說,圖像拼接主要包括以下步驟:
(一)圖像預處理。包括數(shù)字圖像處理的基本操作(如去噪、邊緣提取、直方圖處理等)、建立圖像的匹配模板以及對圖像進行某種變換(如傅里葉變換、小波變換等)等操作。
(二)圖像配準。就是采用一定的匹配策略,找出待拼接圖像中的模板或特征點在參考圖像中對應的位置,進而確定兩幅圖像之間的變換關(guān)系。
(三)建立變換模型。根據(jù)模板或者圖像特征之間的對應關(guān)系,計算出數(shù)學模型中的各參數(shù)值,從而建立兩幅圖像的數(shù)學變換模型。
(四)統(tǒng)一坐標變換。根據(jù)建立的數(shù)學轉(zhuǎn)換模型,將待拼接圖像轉(zhuǎn)換到參考圖像的坐標系中,完成統(tǒng)一坐標變換。
(五)融合重構(gòu)。將帶拼接圖像的重合區(qū)域進行融合得到拼接重構(gòu)的平滑無縫全景圖像。
三、國內(nèi)外研究現(xiàn)狀
1975年,Kuglin和Hines提出了相位相關(guān)算法,該方法具有場景無關(guān)性,能將純二維平移的圖像進行精確對齊。1987年,De Castro和Morandi等人使用傅立葉變換將具有旋轉(zhuǎn)變換的圖像做對齊,由此產(chǎn)生擴展相位相關(guān)法。1996年,Reddy和Chaterji改進了De Castro的算法,基于快速傅立葉變換,利用極坐標和互功率譜,實現(xiàn)了具有平移、旋轉(zhuǎn)和縮放變換的圖像配準。
相位相關(guān)法雖然計算簡單精確,但要求待配準圖像之間有較大的重疊比率,同時計算量和適用范圍與圖像的大小有很大的關(guān)系。因此,出現(xiàn)了基于圖像幾何特征的配準方法。
1997年,Zoghlami I.、Faugeras O.和Deriche R.提出了基于幾何角模型的圖像對齊算法。1999年,Bao P.和Xu D.利用小波變換提取保留邊(edge-preserving)的視覺模型進行圖像的對齊,Nielsen F.則提出了基于幾何點特征優(yōu)化的匹配方法。
隨著人們對圖像的分析和理解的深入,圖像拼接技術(shù)的研究也趨于成熟,圖像拼接利用的配準特征也從圖像的低級特征發(fā)展到利用高級特征。
1996年,Richard Szeliksi提出了基于運動的全景圖像拼接模型,模型通過采用Levenberg-Marquardt迭代非線性最小化方法(L-M算法)求出圖像間的幾何變換關(guān)系進行配準。此算法效果好、速度快,且能應對平移、旋轉(zhuǎn)和仿射等變換圖像的拼接,因此成為圖像拼接領(lǐng)域的經(jīng)典算法。2000年,Shmuel Peleg、Benny Rousso等在其基礎上,根據(jù)相機的不同運動,自適應的選擇拼接模型,通過把圖像分割成條進行多重投影,提出了自適應的圖像拼接模型,使自適應拼接成為拼接領(lǐng)域研究的又一方向。
國內(nèi)學者也對圖像拼接技術(shù)做了大量研究。張祖勛提出了多級影像概率松弛整體匹配技術(shù),對不同傳感器、不同空間分辨率的影像進行配準。杜威、李華二人將視頻紋理和全景圖結(jié)合起來,提出一種應用于動態(tài)場景的全景圖表示方法。趙向陽、獨立民提出了基于Harris特征點匹配的自動拼接算法。侯舒維、郭寶龍采用簡單的邊緣信息閾值法、金字塔式分層搜索策略,提出了一種灰度圖像上的快速自動拼接算法。方青、王博亮提出了一種基于比值模版匹配的彩色圖像拼接算法。
參考文獻:
篇12
Research and application of image segmentation technology
Wang Wei1, Zeng Xiaoneng2
(1. Changsha Information technology School, Changsha, Hunan 410116, China; 2. Central South University)
Abstract: Image segmentation is about decomposing an image into a number of mutually non-overlapping region while having the same attribute. It is a key technology of digital image processing, which directly affects the effectiveness of segmentation accuracy of subsequent tasks, hence having important significance. The existing segmentation algorithm achieved success to some extent, but the image segmentation problem is far from being solved, research in this area still faces many challenges. The existing problems of image segmentation methods are analyzed. The classical algorithm for image segmentation is improved. A new segmentation method is given and applied to the machine vision-related products which achieve good results.
Key words: digital image processing; image segmentation; segmentation algorithm; machine vision
0 引言
圖像分割是數(shù)字圖像處理中的一項關(guān)鍵技術(shù),它通常用于對圖像進行分析、識別、編碼等處理之前的預處理環(huán)節(jié),其分割的準確性直接影響后續(xù)任務的有效性,因此具有十分重要的意義。自上世紀70年代以來,已經(jīng)出現(xiàn)了多種圖像分割方法,而每一種圖像分割方法都是為了解決一些特定的應用問題。該技術(shù)成功地應用于許多領(lǐng)域,例如:交通路口的電子警察、光學字符識別(OCR)、指紋識別、機動車牌號識別等等。
圖像分割是指將一副圖像分解為若干互不交疊的有意義且具有相同屬性的區(qū)域。好的圖像分割應具備的特性:①分割出來的各區(qū)域?qū)δ撤N性質(zhì)如灰度、紋理而言具有相似性,區(qū)域內(nèi)部比較平整;②相鄰區(qū)域?qū)Ψ指钏罁?jù)的性質(zhì)有明顯的差異;③區(qū)域邊界上是明確和規(guī)整的[1]。
大多數(shù)圖像分割方法只是部分滿足上述特征。如果強調(diào)分割區(qū)域的同性質(zhì)約束,則分割區(qū)域很容易產(chǎn)生大量小孔和不規(guī)則邊緣;若強調(diào)不同區(qū)域間性質(zhì)差異的顯著性,則易造成不同區(qū)域的合并。具體處理時,不同的圖像分割方法總是在各種約束條件之間尋找一種合理的平衡。
雖然圖像分割方法已經(jīng)有了很大的發(fā)展,但由于它的復雜性,仍有很多問題沒有很好地得到解決。因此,人們至今還一直在努力發(fā)展新的、更有潛力的分割算法,以期實現(xiàn)更通用、更完美的分割結(jié)果。實踐表明,對圖像分割理論與技術(shù)的進一步研究仍然具有非常重要的意義。
本文首先對數(shù)字圖像分割的一些經(jīng)典分割方法作了概述,然后分析了現(xiàn)有項目開發(fā)中使用的圖像分割方法所存在的問題,最后基于經(jīng)典算法進行技術(shù)改進,實現(xiàn)了一種新的分割方法,并將其應用到實際的產(chǎn)品當中,取得了良好的效果。
1 圖像分割方法的現(xiàn)狀
從上世紀五十年代開始,學者一直熱衷于研究圖像分割技術(shù)。迄今為止,已提出上千種圖像分割算法,依這些算法對圖像處理的特點,主要可分為以下幾類方法[2]。
1.1 閾值分割法
閾值分割法作為一種常見的區(qū)域并行技術(shù),它通過設置閥值,把像素點按灰度級分若干類,從而實現(xiàn)圖像分割。由于是直接利用圖像的灰度特性,因此計算方便簡明、實用性強。顯然,閾值分割方法的關(guān)鍵和難點是如何取得一個合適的閾值,而實際應用中閾值設定易受噪聲和光亮度影響。近年來關(guān)于閾值分割法主要有[3]:最大相關(guān)性原則選擇閾值法、基于圖像拓撲穩(wěn)定狀態(tài)法、灰度共生矩陣法、熵法、峰值和谷值分析法等。其中,自適應閾值法、最大熵法、模糊閾值法、類間閾值法是對傳統(tǒng)閾值法改進較成功的幾種算法。更多的情況下,閾值的選擇會綜合運用兩種或兩種以上的方法,這也是圖像分割發(fā)展的一個趨勢。例如,將圖像的灰度直方圖看作是高斯分布的選擇法與自適應定向正交投影高斯分解法的結(jié)合,較好地擬合了直方圖的多峰特性,從而得到了更為準確的分割效果。閾值法的缺陷主要在于它僅僅考慮了圖像的灰度信息,而忽略了圖像的空間信息。對于非此即彼的簡單圖像處理(如一些二值圖像的處理)是有效的,但是對于圖像中不存在明顯的灰度差異或各物體的灰度值范圍有較大重疊的圖像分割問題則難以得到準確的分割效果。
1.2 基于邊緣的圖像分割法
邊緣總是以強度突變的形式出現(xiàn),可以定義為圖像局部特征的不連續(xù)性,如灰度的突變、紋理結(jié)構(gòu)的突變等。邊緣常常意味著一個區(qū)域的終結(jié)和另一個區(qū)域的開始,圖像的邊緣包含了物體形狀的重要信息,它不僅在分析圖像時大幅度地減少了要處理的信息量,還保護了目標的邊界結(jié)構(gòu)。對于邊緣的檢測常常借助空間微分算子進行,通過將其模板與圖像卷積完成。兩個具有不同灰度值的相鄰區(qū)域之間總存在灰度邊緣,而這正是灰度值不連續(xù)的結(jié)果,這種不連續(xù)可以利用求一階和二階導數(shù)檢測到。
當今的局部技術(shù)邊緣檢測方法中,主要有一次微分(Sobel算子、Roberts算子)、二次微分(拉普拉斯算子等)和模板操作(Prewitt算子、Kirsch算子和Robinson算子)等。這些邊緣檢測器對邊緣灰度值過渡比較尖銳且噪聲較小等不太復雜的圖像可以取得較好的效果,但對于邊緣復雜(如邊緣模糊、邊緣丟失、邊緣不連續(xù)等)的圖像效果不太理想。此外,噪聲的存在使基于導數(shù)的邊緣檢測方法效果明顯降低,在噪聲較大的情況下所用的邊緣檢測算子通常都是先對圖像進行適當?shù)钠交种圃肼暎缓笄髮?shù),或者對圖像進行局部擬合,然后再用擬合光滑函數(shù)的導數(shù)來代替直接的數(shù)值導數(shù),如Marr算子、Canny算子等。有關(guān)學者曾給出了一種基于彩色邊緣的圖像分割方法,這是對傳統(tǒng)邊緣分割方法只適用于灰度圖像狀況的一個突破。
在未來的研究中,用于提取初始邊緣點的自適應閾值選取、用于圖像層次分割的更大區(qū)域的選取,以及如何確認重要邊緣去除假邊緣將變得非常重要。
1.3 基于聚類的分割法
對灰度圖像和彩色圖像中相似灰度或色度合并的方法稱之為聚類,通過聚類將圖像表示為不同區(qū)域即所謂的聚類分割方法。此方法的實質(zhì)是將圖像分割問題轉(zhuǎn)化為模式識別的聚類分析,如k均值、參數(shù)密度估計、非參數(shù)密度估計等方法都能用于圖像分割。常用的聚類分割有顏色聚類分、灰度聚類分割和像素空間聚類分割。
顏色聚類分割實際上是將相似的幾種顏色合并為一色,描述顏色近似程度的指標是色差,在標準CIE勻色空間中,色差是用兩個顏色的距離來表示的。但是顯示器采用的RGB空間是顯示器的設備空間,與CIE系統(tǒng)的真實三原色不同,為簡單起見,一般采用RGB色空間中的距離來表示。
灰度聚類分割就是只把圖像分成目標和背景兩類,而且僅考慮像素的灰度,這就是一個在一維空間中把數(shù)據(jù)分成兩類的問題。通過在灰度空間完成聚類,得到兩個聚類中心(用灰度值表征),聚類中心連線的中點便是閾值。顯然這個概念也可以輕松地延擴至多閾值和動態(tài)閾值的情況。
像素空間聚類分割在某些特定的尺度上觀察圖像,比如說把圖像信號通過一個帶通濾波器,濾波的結(jié)果將使圖像的局部信息更好地被表達。通過一個多尺度分解,輪廓信息可以在大尺度圖像上保留下來,細節(jié)或者突變信息可以在中小尺度上體現(xiàn),基于多尺度圖像特征聚類的分割方法漸漸得到了人們的關(guān)注。
1.4 函數(shù)優(yōu)化法
基于函數(shù)優(yōu)化的分割方法是圖像分割中另一大類常用的方法,其基本思路是給出一個目標函數(shù),通過該目標函數(shù)的極大化或極小化來分割圖像,G.A.Hewer等人提出了一個具有廣泛意義的目標函數(shù)。統(tǒng)計學分割法、結(jié)合區(qū)域與邊緣信息法、最小描述長度(MDL)法、基于貝葉斯公式的分割法等是目前幾種活躍的函數(shù)優(yōu)化法。
統(tǒng)計學分割法就是把圖像中各個像素點的灰度值看作是具有一定概率分布的隨機變量,且觀察到的實際物體是作了某種變換并加入噪聲的結(jié)果。統(tǒng)計學分割方法包括基于馬爾科夫隨機場法(MRF)、標號法(Labeling)和混合分布法(Mixture)等。
結(jié)合區(qū)域與邊緣信息法是基于區(qū)域信息的圖像分割的主要方法。區(qū)域增長有兩種方式:一種是先將圖像分割成很多一致性較強的小區(qū)域,再按一定的規(guī)則將小區(qū)域融合成大區(qū)域,達到分割圖像的目的;另一種是事先給定圖像中要分割目標的一個種子區(qū)域,再在種子區(qū)域基礎上將周圍的像素點以一定的規(guī)則加入其中,最終達到目標與背景分離的目的。分裂合并法對圖像的分割是按區(qū)域生長法沿相反方向進行的,無需設置種子點,其基本思想是給定相似測度和同質(zhì)測度,從整幅圖像開始,如果區(qū)域不滿足同質(zhì)測度,則分裂成任意大小的不重疊子區(qū)域;如果兩個鄰域的子區(qū)域滿足相似測度則合并。
最小長度描述法(MDL)的基本思路是用一種計算機語言來描述圖像的區(qū)域和邊界信息,得到一個描述長度函數(shù),以此作為目標函數(shù),根據(jù)圖像極小化描述長度從而得到分割結(jié)果。MDL準則主要應用于區(qū)域競爭中,即通過這種規(guī)則對比若干個種子區(qū)域,找出其中的壞種子。它常常與其他方法結(jié)合使用。
2 圖像分割技術(shù)的研究與應用
2.1 圖像掃描分割
根據(jù)實際產(chǎn)品的需要,要根據(jù)分割的特殊要求,采用簡單的圖像掃描分割。
2.1.1 算法思想
獲取二值化要分割的圖像,然后轉(zhuǎn)換為圖像指針并獲取圖像的左右邊界、上下邊界,然后再分割圖像[4]。
2.1.2 分割過程實現(xiàn)
下面介紹基于FrameWork4.0,采用C#實現(xiàn)對圖像進行分割處理的主要步驟。
⑴ 二值化要分割的圖像
BaseFilterHandler.ImgConvertToFormat8(c_Bitmap);
BaseFilterHandler.ImgBradleyLocalThresholding(c_Bitmap);
⑵ 轉(zhuǎn)換為圖像指針并獲取圖像中的左右邊界
BitmapData bmData=c_Bitmap.LockBits(new Rectangle
(0,0,c_Bitmap.Width,c_Bitmap.Height),ImageLockMode
.ReadWrite, c_Bitmap.PixelFormat);
List<int[]> widthLeftRight=GetImgLeftRight(bmData,
c_Bitmap, throldValue);
⑶ 獲取圖像的上下邊界
int[] yValues=img.GetPicTopBottom(sourceMap, 1, sourceMap
.Height-2, widthLeft[widthLeftIndex],
widthRight[widthLeftIndex]);
top=yValues[0]; bottom=yValues[1];
⑷ 分割圖像
Rectangle sourceRectangle0=new Rectangle
(widthLeft[widthLeftIndex],tempTop, widthRight
[widthLeftIndex]-widthLeft[widthLeftIndex], tempHeight);
Bitmap tempMap=sourceMap.Clone(sourceRectangle0,
sourceMap.PixelFormat);
2.1.3 實際效果
存在干擾情況下的分割效果,如圖1所示。
<E:\方正創(chuàng)藝5.1\Fit201501\圖\ww圖1.tif>
圖1 圖像掃描分割
圖像掃描分割的結(jié)果存在多干擾點,一些字符不能完整地被分割出來,多個字符連接在一起,分割效果不是很好。
2.2 findContours分割
2.2.1 算法思想
該算法是提取圖像的輪廓信息,一個輪廓一般對應一系列的點,也就是圖像中的一條線[5]。在算法中用序列cvSeq來保存提取到的序列集,序列中的每一個元素就是曲線中的一個點的位置。
2.2.2 分割過程實現(xiàn)
下面介紹采用C++實現(xiàn)對圖像分割處理的主要步驟。
⑴ 圖像的預處理(二值化、平滑處理等)
threshold(input,img_threshold,60,255,
CV_THRESH_BINARY_INV);
IplImage* input_image=&IplImage(img_threshold);
IplImage* dst_image=cvCreateImage(cvGetSize
(input_image),IPL_DEPTH_8U,0);
cvSmooth(input_image,dst_image,CV_GAUSSIAN,3,0,0,0);
⑵ 查找圖像的聯(lián)通區(qū)域及輪廓
Mat img_contours;
img_threshold.copyTo(img_contours);
vector<vector<Point>> contours;
findContours(img_contours, contours,
CV_RETR_EXTERNAL,CV_CHAIN_APPROX_NONE);
⑶ 對輪廓進行轉(zhuǎn)換得到內(nèi)容區(qū)域
vector<vector<Point>>::iterator itc=contours.begin();
IplImage* temp=&(IplImage)input;
vector<Rect> validRect;
while(itc!=contours.end()) {
Rect mr=boundingRect(Mat(*itc));
rectangle(result,mr,Scalar(0,255,0));
if(!checkSplitRect(mr,temp->height,temp->width))
{ ++itc;continue; }
validRect.push_back(mr);
++itc;
}
⑷ 圖像分割
CvSize size=cvSize(rect.width,rect.height);
cvSetImageROI(source,cvRect(rect.x,rect.y,size.width,size.height));
IplImage* pDest=cvCreateImage(size,source->depth,
source->nChannels);
cvCopy(source,pDest);
cvResetImageROI(pDest);
2.2.3 實際效果
從分割結(jié)果看,該分割算法能把所有的單個圖片聯(lián)通區(qū)域分割出來,但是分割出的區(qū)域存在很多干擾區(qū)域,增加了實際區(qū)域提取的復雜度(見圖2)。
<E:\方正創(chuàng)藝5.1\Fit201501\圖\ww圖2.tif>
圖2 連通區(qū)域分割
下面將在此基礎上進行改進。
2.3 改進后的算法
增加連通區(qū)域的有效性判斷及過濾;
checkSplitRect(Rect rect,int height,int width)
同時對一些單字符被分割成多個字符的區(qū)域按照一定的算法及規(guī)則進行有效組合和合并;
vector<Rect> MergeImage(vector<Rect> validRect)
最后形成的分割效果如圖3所示,將所有字符正確的分割出來,去除了干擾,達到了理想的效果。
<E:\方正創(chuàng)藝5.1\Fit201501\圖\ww圖3.tif>
圖3 改進后的分割效果
3 實驗結(jié)果
為了驗證本方案的可行性和可操作性,本文使用10000張測試圖像作為實驗測試庫,對此方案進行測試。測試結(jié)果:正確分割達到99%以上。如圖4,改進后的分割正確率比改進前的分割正確率提高了將近20倍。
<E:\方正創(chuàng)藝5.1\Fit201501\圖\ww圖4.tif>
圖4 分割對比
4 結(jié)束語
圖像分割沒有通用的理論,要根據(jù)具體情況采取有效的方法。利用已經(jīng)研究出的多種圖像分割方法,將多種方法綜合運用,發(fā)揮各自的優(yōu)勢進行圖像分割將成為這一領(lǐng)域的發(fā)展趨勢。同時,由于現(xiàn)在所處理的圖像的復雜度和固有的模糊性,傳統(tǒng)的單一的處理方法已不能適用需要,與新理論、新工具和新技術(shù)結(jié)合起來才能有所突破和創(chuàng)新。
本文在原有分割技術(shù)的基礎上,結(jié)合實際的使用情況,進行了算法思想的改進和創(chuàng)新,最終達到了理想的分割效果,在一定程度上具有良好的研究和實用價值。
參考文獻:
[1] R.M.Haralick,L.G.Shaprio, "Image segmentation tech2 niques",
Computer Vision, Graphics, and Image Processing,1985.29:100-132
[2] 羅希平等.圖像分割方法綜述[J].模式識別與人工智能,1999.12(3):
300-312
[3] 吳一全,朱兆達.圖像處理中閾值選取方法30年(1962-1992)的進
篇13
在獲取信息時,通常都要識別某領(lǐng)域內(nèi)的圖像。精確處理圖像,關(guān)系到設定決策的精確性。最近幾年,圖像處理日益融匯于全方位的生產(chǎn)及日常生活。判斷并且識別圖像信息,才能用來處理某一問題。航拍影像照片、層析用到的射線圖、電視的圖像等,這些都源自計算機處理得出的圖像。圖像是否精確,密切關(guān)系到圖像本身的分辨率是否優(yōu)良。由此可見,若要在短時段內(nèi)獲取完整且精準的圖像信息,就要提升分辨率,快速識別并且獲取可信的圖像信息。
1 圖像處理的根本技術(shù)
計算機協(xié)助的圖像處理采納了如下技術(shù)思路:針對于選定的圖像,借助微機用來處理并且解析。經(jīng)過全方位處理,獲得符合需求的新圖像。計算機輔助下,圖像處理即為新式的影像處理,采納了新階段的計算機手段。通常狀態(tài)下,處理各類的圖像都配備了掃描儀、數(shù)字性攝像機。具體在采樣后,可得二維性的數(shù)字數(shù)組并且構(gòu)建像素。采樣可得二維的整數(shù)數(shù)組,由此產(chǎn)生灰度值[1]。從處理流程來看,圖像處理可分成如下:對圖像的壓縮、復原以及強化、匹配各類的圖像、識別并描述圖像。
在這之中,壓縮圖像是必要步驟。數(shù)字化處理后,經(jīng)常獲得較大量的圖幅數(shù)據(jù)。典型狀態(tài)下,數(shù)字圖像都含有多個像素。某些圖像呈現(xiàn)為動態(tài)性,同時也附帶了更多量的像素數(shù)據(jù)。由此可見,妥善存儲并且壓縮圖像是尤為必要的。從算法來看,壓縮圖像包含了近似算法以及不失真的方式。常用的流程為:在時間空間上,針對于鄰近像素值予以編碼,而后求出差值。例如壓縮可得精確的游程編碼,即為典型實例。與之相比,壓縮圖像配備的近似算法可借助交換圖像,經(jīng)過余弦變換可得圖像。這種典型即為MPEG類的新式處理,此外還可選取傅里葉的快速變換。對于動靜態(tài)這樣兩類的圖像,都是很適用的。
選出了待處理的某一圖像,還需再次去復原或增強。這樣做,是為從根本上改進圖片,提升影像的質(zhì)量。復原及增強可選的方式包含了去模糊性、去除噪聲、強化對比度、減低幾何性的畸變。復原圖像則先要設定噪聲模型,估測并推斷得出原先的圖像。增強圖像的方式為空間域或頻率域,把圖像化作可識別的信號,通常為二維信號。在這種基礎上,再去強化信號。去除圖像噪聲,可選傅里葉變換的途徑,但它僅適合于頻率偏低的信號。高通濾波用來強化頻率較高的圖像信號,影像將更為清晰。典型性算法為:算出局部影像的平均值、計算出空間域、選取中值濾波的方式。經(jīng)過這些處理,都可縮減直至除掉噪聲。
2 圖像處理的必要性
在各個領(lǐng)域中,都不可缺失信息。圖像信息相比來看更具備直觀性,更易識別判斷。認知世界的過程中,就要借助直觀性的圖像信息用來獲得判斷,收獲信息來源。然而,原始影像經(jīng)常是模糊性的,很難借以估測某些必要信息。唯有經(jīng)過處理,才能顯示出隱含的某些信息,圖像更加清晰。在現(xiàn)今階段內(nèi),計算機輔助下的多樣技術(shù)都獲得了進步,尤其圖像處理。在微機協(xié)助下,人們即可更便捷且精確地處理影像,進而獲取更精準的清晰圖像[2]。這樣做,便于給出決策,或者獲取信息。
日常生產(chǎn)中、科研等領(lǐng)域中,都需接觸各類的影像。新階段內(nèi),圖像拓展了含義,包含遙感影像、醫(yī)學拍攝的光片、清晰度更高的照片等。認知客觀世界,不可缺失這些圖片。計算機擁有更大容量及更高的實效性,也提升了原先的處理速度。在這種狀態(tài)下,可處理的圖像日益變得多樣化。與此同時,攝像裝置也擁有了高精度,趨向于小型化,這就在根本上改進了畫面的總體質(zhì)量。由此可見,現(xiàn)今的圖像處理可以憑借于小型微機,提升處理的實效。
信息化時代內(nèi),圖像處理日益融匯于多行業(yè)。例如醫(yī)學影像,可用來分辨出機體內(nèi)的斷層;技術(shù)性的圖像,可用來調(diào)控并且監(jiān)管生產(chǎn)。面對于復雜的圖像,還需快速判斷可提取的信息,作為處理根據(jù)。生成數(shù)字圖像,也可借助計算機予以實現(xiàn)。最近幾年,計算機配備的軟硬件都正在改進,推進了全方位的圖像處理手段更新。在廣闊領(lǐng)域內(nèi),都用到新階段的圖像處理。計算機輔助的新式圖像處理擁有了小型化,也加入了更優(yōu)的實時性及遠程性。
3 設置圖像分辨率
從根本上看,圖像整合了多層次的信息,表現(xiàn)出全面性。在各類介質(zhì)上,還可再現(xiàn)原先的信息。作為集合體,圖像可用來集成并處理信息。對此,就有必要設置并匹配分辨率。具體而言,設置分辨率要注重如下事項:
3.1 選取分辨率
選定分辨率過程中,先要確定最適當?shù)挠跋駫呙杪省3跗谠跇?gòu)建圖像時,若設定了較低分辨率,那么掃描得出的影像也并不很精確。從這種角度看,單獨提升像素并非必然可獲得更為清晰的影像。導入掃描的過程中,針對特定圖像還需設定匹配性的分辨率,這種分辨率被看成掃描階段內(nèi)的分辨率。若分辨率設置得很高,掃描可得優(yōu)質(zhì)影像。然而,這種設置也并非完美,也是有局限的。這主要是由于,掃描儀本身就表現(xiàn)為局限性,制約了分辨率。此外,要設置掃描的分辨率,還需兼顧給出來的處理目的[3]。
3.2 具體設置方式
設置分辨率時,要把它限定于最佳范圍內(nèi),不可超越范圍。條件準許時,若有必要放大固有影像,則還需篩選更大分辨率。然而各步驟中,都需控制于最吻合的分辨率之內(nèi)。在軟件幫助下,可再次予以放大。從現(xiàn)狀來看,處理圖像可借助多款的軟件。選取了最佳軟件,對應著的處理實效也會變得更優(yōu)。同時,插值算法也密切關(guān)系到圖像處理。插值算法可用來具體放大圖像,進而判斷出某一最相符的掃描分辨程度。經(jīng)過掃描之后,要依托某種媒介用來輸出,還要視情況予以放大原圖。
在某些情況下,屏幕可用來顯示出掃描后的影像,可至網(wǎng)頁。具體顯示時,應能維持恒定的圖像規(guī)格尺寸。通常來看,可設置于70dpi的分辨率。若有必要放大,那么借助如下公式用來確定分辨率:掃描時的分辨率=72*影像的各邊長/最初的邊長。
掃描之后,需要輸出并予以打印,這樣才可獲得易辨別的影像。具體打印步驟中,要維持最初的邊長及尺寸。在這種基礎上,最便捷的方式即為篩選分辨率,輸出打印線的總數(shù)。如果需要打印,還需依照如下思路來設定分辨率:輸出線頻率*圖像處理后的各邊長/最初圖像邊長。
3.3 匹配不同的分辨率
打印的過程中,分辨率應當是可以匹配的,這種匹配是指圖像本身及打印機二者的分辨率。打印機產(chǎn)生了某種輸出,這種狀態(tài)下即可算出最精準的分辨率,然后用來計算。輸出打印之前,需要妥善匹配合適的分辨率。需要注意的是:打印設備及圖像本身并不需要設定完全同樣的分辨率,只要匹配即可。經(jīng)過詳盡的匹配,才會確保輸出得到的圖像是優(yōu)質(zhì)的。某些作品設定為較高分辨率,針對于這類作品先要妥善予以保存。預留必備的備份,依照打印機來選取分辨率。
圖像分辨率可設置為雙倍的打印機線頻率。在這時,可自主予以定義。打印的步驟中,需要舍掉冗余性的某些圖像。這是因為,打印出來的影像并不需要添加繁雜的細節(jié),這些細節(jié)也會拖延更長的打印時間。打印機設有自身的分辨率,單位為各英寸內(nèi)的圖像點數(shù)。具體打印過程中,若沒能明確某一個打印機的精確線頻率,那么還可大體予以匹配。同時,應當優(yōu)選適合的紙張用來打印。因為在不同材質(zhì)上,打印得出的分辨率其實并不相等。
4 處理中的超分辨率
從總體來看,依照輸出及輸入的不同算法,可設置組合性的不同超分辨率。重構(gòu)超分辨率的微機圖像,借助于信號處理來轉(zhuǎn)變原先較低的分辨率,變?yōu)楦叻直媛省_@種技術(shù)目前正被廣泛選用,用于打印圖像、構(gòu)建視頻監(jiān)控、解析刑偵案件、構(gòu)建衛(wèi)星成像或醫(yī)學影像等。超分辨率關(guān)系著各類處理,例如根本性的圖像處理、微機輔助的視覺性處理[4]。重構(gòu)超分辨率時,也需要先期壓縮圖像、提取圖像的特性、評價圖像質(zhì)量。需要提取獨特的圖像特征,優(yōu)化得到最佳的某類算法。
超分辨率的構(gòu)建中,重要步驟應為處理頻域。唯有經(jīng)過頻域處理,才能構(gòu)建精準的超分辨率。在頻域范圍內(nèi),可以用來卷積圖像、旋轉(zhuǎn)或平移圖像。經(jīng)過全面處理,即可轉(zhuǎn)變成更易辨認的計算方式。分辨率領(lǐng)域內(nèi),頻域方式擁有更高層次的直觀優(yōu)勢。對于此,還可選取傅里葉變換。假定某一生成模型,經(jīng)過連續(xù)性的變換即可構(gòu)建線性的頻域關(guān)系。
此外,超分辨率還會用到插值方法,這種方式針對于不均勻的圖像。在重構(gòu)超分辨率時,插值方式是更為簡易并且直觀的。對于非均勻性的處理圖像,插值方法包含了如下流程:對于輸入視頻,配準為給出來的平面圖像。經(jīng)過轉(zhuǎn)換之后,再設置對應性的圖像約束。從本質(zhì)來看,這種重構(gòu)圖像即為整合性的插值,可用于各階段內(nèi)的圖像生成或處理。
5 結(jié)語
圖像處理源自新階段內(nèi)的微機技術(shù),經(jīng)過處理以后,應能獲取最佳的圖像效果。通常來看,這類處理技術(shù)要符合設定的分辨率,易于辨別且可提供決策的參照。圖像處理包含了多樣的復雜要素,要全方位衡量并且判斷,這種基礎上得出精準的結(jié)論。從目前狀態(tài)看,圖像處理的相關(guān)性技術(shù)仍沒能達到完善,有待持久的改進。未來的實踐中,還需繼續(xù)摸索,歸納圖像處理的經(jīng)驗,服務于各領(lǐng)域內(nèi)的計算機處理。
參考文獻:
[1] 蘇衡,周杰,張志浩.超分辨率圖像重建方法綜述[J].自動化學報,2013(08):1202-1213.