引論:我們?yōu)槟砹?篇計(jì)算機(jī)視覺論文范文,供您借鑒以豐富您的創(chuàng)作。它們是您寫作時(shí)的寶貴資源,期望它們能夠激發(fā)您的創(chuàng)作靈感,讓您的文章更具深度。
計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺下食品工業(yè)論文
1計(jì)算機(jī)視覺技術(shù)概述
1.1自動(dòng)化程度高
計(jì)算機(jī)視覺可以實(shí)現(xiàn)對(duì)農(nóng)產(chǎn)品的多個(gè)外形和內(nèi)在品質(zhì)指標(biāo)進(jìn)行同時(shí)檢測(cè)分析,可以進(jìn)行整體識(shí)別、增強(qiáng)對(duì)目標(biāo)識(shí)別的性。
1.2實(shí)現(xiàn)無(wú)損檢測(cè)
由于計(jì)算機(jī)視覺技術(shù)對(duì)農(nóng)產(chǎn)品的識(shí)別是通過(guò)掃描、攝像,而不需要直接接觸,可以減少對(duì)所檢測(cè)食品的傷害。
1.3穩(wěn)定的檢測(cè)精度
設(shè)計(jì)的運(yùn)行程序確定后,計(jì)算機(jī)視覺技術(shù)的識(shí)別功能就會(huì)具有統(tǒng)一的識(shí)別標(biāo)準(zhǔn),具有穩(wěn)定的檢測(cè)精度,避免了人工識(shí)別和檢測(cè)時(shí)主觀因素所造成的差異。
2計(jì)算機(jī)視覺技術(shù)在食品檢測(cè)中的應(yīng)用
20世紀(jì)70年代初,學(xué)者開始研究計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中的應(yīng)用,近幾十年電子技術(shù)得到快速發(fā)展,計(jì)算機(jī)視覺技術(shù)也越來(lái)越成熟。國(guó)內(nèi)外學(xué)者在研究計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中的應(yīng)用方面主要集中在該技術(shù)對(duì)果蔬的外部形態(tài)(如形狀、重量、外觀損傷、色澤等)的識(shí)別、內(nèi)部無(wú)損檢測(cè)等方面。國(guó)內(nèi)有關(guān)計(jì)算機(jī)視覺技術(shù)在食品業(yè)中的應(yīng)用研究起始于90年代,比國(guó)外發(fā)達(dá)國(guó)家晚20多年,但是發(fā)展很快。
2.1計(jì)算機(jī)視覺技術(shù)在果蔬分級(jí)中的應(yīng)用研究
計(jì)算機(jī)視覺技術(shù)在食品檢測(cè)中的應(yīng)用研究相當(dāng)廣泛,從外部直徑、成熟度的檢測(cè)到內(nèi)部腐爛程度的檢測(cè)都有研究。韓偉等[4]采用分割水果的拍攝圖像和新的計(jì)算機(jī)算法計(jì)算水果的半徑,進(jìn)而得出果蔬的較大直徑。研究表明,該算法不僅降低了計(jì)算量而且提高了計(jì)算精度,此方法用于水果分級(jí)的誤差不超過(guò)2mm,高于國(guó)際水果分級(jí)標(biāo)準(zhǔn)所規(guī)定的5mm分類標(biāo)準(zhǔn)差,可在工業(yè)生產(chǎn)中很好應(yīng)用。李慶中[5]也利用圖像的缺陷分割算法研究了計(jì)算機(jī)視覺技術(shù)在蘋果檢測(cè)與分級(jí)中的應(yīng)用,結(jié)果表明此算法能快速、有效地分割出蘋果的表面缺陷。孫洪勝等[6]以蘋果色澤特征比率的變化規(guī)律為理論基礎(chǔ),結(jié)合模糊聚類知識(shí)利用計(jì)算機(jī)視覺技術(shù)來(lái)檢測(cè)蘋果缺陷域,檢測(cè)不僅快速而且結(jié)果。劉禾等[7]通過(guò)研究認(rèn)為蘋果的表面缺陷可以利用計(jì)算機(jī)視覺技術(shù)進(jìn)行檢測(cè),計(jì)算機(jī)視覺技術(shù)還可以將蘋果按照檢測(cè)結(jié)果進(jìn)行分級(jí),把檢測(cè)過(guò)的蘋果分成裂果、刺傷果、碰傷果和蟲傷果等類別。梨的果梗是否存在是梨類分級(jí)的重要特征之一,應(yīng)義斌等[8]通過(guò)計(jì)算機(jī)視覺技術(shù)、圖象處理技術(shù)、傅立葉描述子的方法來(lái)描述和識(shí)別果形以及有無(wú)果柄,其識(shí)別率達(dá)到90%。楊秀坤等[9]綜合運(yùn)用計(jì)算機(jī)視覺技術(shù)、遺傳算法、多層前饋神經(jīng)網(wǎng)絡(luò)系統(tǒng),實(shí)現(xiàn)了具有度高、靈活性強(qiáng)和速度快等優(yōu)點(diǎn)的蘋果成熟度自動(dòng)判別。陳育彥等[10]采用半導(dǎo)體激光技術(shù)、計(jì)算機(jī)視覺技術(shù)和圖像分析技術(shù)相結(jié)合的方法檢測(cè)蘋果表面的機(jī)械損傷和果實(shí)內(nèi)部的腐爛情況,初步驗(yàn)證了計(jì)算機(jī)視覺技術(shù)檢測(cè)蘋果表面的損傷和內(nèi)部腐爛是可行的。馮斌等[11]通過(guò)計(jì)算機(jī)視覺技術(shù)對(duì)水果圖像的邊緣進(jìn)行檢測(cè),然后確定水果的大小用以水果分級(jí)。試驗(yàn)表明,該方法比傳統(tǒng)的檢測(cè)方法速度快、率高,適用于計(jì)算機(jī)視覺的實(shí)時(shí)檢測(cè)。朱偉[12]在模糊顏色的基礎(chǔ)上,分析西紅柿損傷部分和完好部分模糊顏色的差別,用分割方法對(duì)西紅柿的缺陷進(jìn)行分割,結(jié)果顯示率高達(dá)96%。曹樂(lè)平等[13]人研究了溫州蜜柑的果皮顏色與果實(shí)可滴定酸含量以及糖分含量之間的相關(guān)性,然而根據(jù)相關(guān)性,樣品檢測(cè)的正確識(shí)別率分別只有約74%和67%。劉剛等[14]從垂直和水平兩個(gè)方向獲取蘋果的圖像,并通過(guò)計(jì)算機(jī)自動(dòng)分析圖像數(shù)據(jù),對(duì)蘋果的外徑、體積、以及圓形度等參數(shù)進(jìn)行處理,與人工檢測(cè)相比,計(jì)算機(jī)視覺技術(shù)具有檢測(cè)效率高,檢測(cè)標(biāo)準(zhǔn)統(tǒng)一性好等優(yōu)點(diǎn)。Blasco.J[15]通過(guò)計(jì)算機(jī)視覺技術(shù)分析柑橘果皮的缺陷,進(jìn)而對(duì)其在線分級(jí),正確率約為95%。趙廣華等[16]人綜合計(jì)算機(jī)視覺識(shí)別系統(tǒng)、輸送轉(zhuǎn)換系統(tǒng)、輸送翻轉(zhuǎn)系統(tǒng)、差速勻果系統(tǒng)和分選系統(tǒng),研制出一款適于實(shí)時(shí)監(jiān)測(cè)、品質(zhì)動(dòng)態(tài)的智能分級(jí)系統(tǒng),能夠很好地實(shí)現(xiàn)蘋果分級(jí)。王江楓等[17]建立了芒果重量與攝影圖像的相互關(guān)系,應(yīng)用計(jì)算機(jī)視覺技術(shù)檢測(cè)桂香芒果和紫花芒果的重量和果面損傷,按重量分級(jí)其率均為92%,按果面損傷分級(jí)的率分別為76%和80%。
2.2計(jì)算機(jī)視覺技術(shù)在禽蛋檢測(cè)中的應(yīng)用研究
禽蛋企業(yè)在生產(chǎn)過(guò)程中,產(chǎn)品的分級(jí)、品質(zhì)檢測(cè)主要采用人工方法,不僅需要大量的物力人力,而且存在勞動(dòng)強(qiáng)度大、人為誤差大、工作效率低等缺點(diǎn),計(jì)算機(jī)視覺技術(shù)可以很好的解決這類產(chǎn)品工業(yè)生產(chǎn)中存在的困擾。歐陽(yáng)靜怡等[18]利用計(jì)算機(jī)視覺技術(shù)來(lái)檢測(cè)雞蛋蛋殼裂紋,利用攝像機(jī)獲取雞蛋圖像后,采用fisher、同態(tài)濾波和BET算法等優(yōu)化后的圖像處理技術(shù),獲得裂紋形狀并判斷,試驗(yàn)結(jié)果表明,計(jì)算機(jī)視覺技術(shù)對(duì)雞蛋蛋殼裂紋的檢測(cè)率高達(dá)98%。汪俊德等[19]以計(jì)算機(jī)視覺技術(shù)為基礎(chǔ),設(shè)計(jì)出一套雙黃雞蛋檢測(cè)系統(tǒng)。該系統(tǒng)獲取蛋黃指數(shù)、蛋黃特征和蛋形尺寸等特征,和設(shè)計(jì)的數(shù)學(xué)模型對(duì)比來(lái)實(shí)現(xiàn)雙黃雞蛋的檢測(cè)和識(shí)別,檢測(cè)率高達(dá)95%。鄭麗敏等[20]人通過(guò)高分辨率的數(shù)字?jǐn)z像頭獲取雞蛋圖像,根據(jù)圖像特征建立數(shù)學(xué)模型來(lái)預(yù)測(cè)雞蛋的新鮮度和貯藏期,結(jié)果表明,計(jì)算機(jī)視覺技術(shù)對(duì)雞蛋的新鮮度、貯藏期進(jìn)行預(yù)測(cè)的結(jié)果率為94%。潘磊慶等[21]通過(guò)計(jì)算機(jī)視覺技術(shù)和聲學(xué)響應(yīng)信息技術(shù)相結(jié)合的方法檢測(cè)裂紋雞蛋,其檢測(cè)率達(dá)到98%。MertensK等[22]人基于計(jì)算機(jī)視覺技術(shù)研發(fā)了雞蛋的分級(jí)檢測(cè)系統(tǒng),該系統(tǒng)識(shí)別帶污漬雞蛋的正確率高達(dá)99%。
2.3計(jì)算機(jī)視覺技術(shù)在檢測(cè)食品中微生物含量的應(yīng)用研究
計(jì)算機(jī)技術(shù)和圖像處理技術(shù)在綜合學(xué)科中的應(yīng)用得到快速發(fā)展,在微生物快速檢測(cè)中的應(yīng)用也越來(lái)越多,主要是針對(duì)微生物微菌落的處理。食品工業(yè)中計(jì)算機(jī)視覺技術(shù)在微生物檢測(cè)方面的研究和應(yīng)用以研究單個(gè)細(xì)胞為主,并在個(gè)體細(xì)胞的研究上取得了一定的進(jìn)展。殷涌光等[23]以顏色特征分辨技術(shù)為基礎(chǔ),設(shè)計(jì)了一套應(yīng)用計(jì)算機(jī)視覺技術(shù)快速定量檢測(cè)食品中大腸桿菌的系統(tǒng),該系統(tǒng)檢測(cè)結(jié)果與傳統(tǒng)方法的檢測(cè)結(jié)果具有很好的相關(guān)性,但與傳統(tǒng)方法相比,可以節(jié)省5d時(shí)間,檢測(cè)時(shí)間在18h以內(nèi),并且能夠有效提高產(chǎn)品品質(zhì)。Lawless等[24]人等時(shí)間段測(cè)定培養(yǎng)基上的細(xì)胞密度,然后通過(guò)計(jì)算機(jī)技術(shù)建立時(shí)間和細(xì)胞密度之間的動(dòng)態(tài)關(guān)聯(lián),利用該關(guān)聯(lián)可以預(yù)測(cè)和自動(dòng)檢測(cè)微生物的生長(zhǎng)情況,如通過(guò)計(jì)算機(jī)控制自動(dòng)定量采集檢測(cè)對(duì)象,然后分析菌落的邊緣形態(tài),根據(jù)菌落的邊緣形態(tài)計(jì)算機(jī)可以顯示被檢測(cè)菌落的具體位置,并且根據(jù)動(dòng)態(tài)關(guān)聯(lián)計(jì)算機(jī)視覺系統(tǒng)可以同時(shí)處理多個(gè)不同的樣品。郭培源等[25]人對(duì)計(jì)算機(jī)視覺技術(shù)用于豬肉的分級(jí)進(jìn)行了研究,結(jié)果顯示計(jì)算機(jī)視覺技術(shù)在識(shí)別豬肉表面微生物數(shù)量上與國(guó)標(biāo)方法檢測(cè)的結(jié)果顯著相關(guān),該技術(shù)可以有效地計(jì)算微生物的數(shù)量。Bayraktar.B等[26]人采用計(jì)算機(jī)視覺技術(shù)、光散射技術(shù)(BARDOT)和模式識(shí)別技術(shù)相結(jié)合的方法來(lái)快速檢測(cè)李斯特菌,在獲取該菌菌落中的形態(tài)特征有,對(duì)圖像進(jìn)行分析處理達(dá)到對(duì)該菌的分類識(shí)別。殷涌光等[27]人綜合利用計(jì)算機(jī)視覺、活體染色、人工神經(jīng)網(wǎng)絡(luò)、圖像處理等技術(shù),用分辨率為520萬(wàn)像素的數(shù)字?jǐn)z像機(jī)拍攝細(xì)菌內(nèi)部的染色效果,并結(jié)合新的圖像處理算法,對(duì)細(xì)菌形態(tài)學(xué)的8個(gè)特征參數(shù)進(jìn)行檢測(cè),檢測(cè)結(jié)果與傳統(tǒng)檢測(cè)結(jié)果顯著相關(guān)(相關(guān)系數(shù)R=0.9987),和傳統(tǒng)檢測(cè)方法相比該方法具有操作簡(jiǎn)單、快速、結(jié)果、適合現(xiàn)場(chǎng)快速檢測(cè)等特點(diǎn)。魯靜[28]和劉侃[29]利用顯微鏡和圖像采集儀器,獲取乳制品的掃描圖像,然后微生物的圖像特征和微生物數(shù)量進(jìn)行識(shí)別,并以此作為衡量乳制品質(zhì)量是否達(dá)標(biāo)的依據(jù),并對(duì)產(chǎn)品進(jìn)行分級(jí)。
2.4計(jì)算機(jī)視覺技術(shù)在其他食品產(chǎn)業(yè)中的應(yīng)用研究
里紅杰等[30]通過(guò)提取貝類和蝦類等海產(chǎn)品的形狀、尺寸、紋理、顏色等外形特征,對(duì)照數(shù)學(xué)模型,采用數(shù)字圖像處理技術(shù)、計(jì)算機(jī)識(shí)別技術(shù)實(shí)現(xiàn)了對(duì)貝類和蝦類等海產(chǎn)品的無(wú)損檢測(cè)和自動(dòng)化分類、分級(jí)和質(zhì)量評(píng)估,并通過(guò)實(shí)例詳細(xì)闡述了該技術(shù)的實(shí)現(xiàn)方法,證實(shí)了此項(xiàng)技術(shù)的有效性。計(jì)算機(jī)視覺技術(shù)還可以檢驗(yàn)玉米粒形和玉米種子質(zhì)量、識(shí)別玉米品種和玉米田間雜草[31]。晁德起等[32]通過(guò)x射線照射獲取毛葉棗的透視圖像后,運(yùn)用計(jì)算機(jī)視覺技術(shù)對(duì)圖像進(jìn)行分析評(píng)估,毛葉棗可食率的評(píng)估結(jié)果與運(yùn)用物理方法測(cè)得的結(jié)果平均誤差僅為1.47%,因此得出結(jié)論:計(jì)算機(jī)視覺技術(shù)可以應(yīng)用于毛葉棗的自動(dòng)分級(jí)。GokmenV等[33-34]通過(guò)對(duì)薯片制作過(guò)程中圖像像素的變化來(lái)研究薯片的褐變率,通過(guò)分析特色參數(shù)來(lái)研究薯片中丙烯酰胺的含量和褐變率的關(guān)系,結(jié)果顯示兩項(xiàng)參數(shù)相關(guān)性為0.989,從而可以應(yīng)用計(jì)算機(jī)視覺技術(shù)來(lái)預(yù)測(cè)加熱食品中丙烯酰胺的含量,該方法可以在加熱食品行業(yè)中得到廣泛應(yīng)用。韓仲志等[35]人拍攝和掃描11類花生籽粒,每類100顆不同等級(jí)的花生籽粒的正反面圖像,利用計(jì)算機(jī)視覺技術(shù)對(duì)花生內(nèi)部和外部采集圖像,并通過(guò)圖像對(duì)其外在品質(zhì)和內(nèi)在品質(zhì)進(jìn)行分析,并建立相應(yīng)的數(shù)學(xué)模型,該技術(shù)在對(duì)待檢樣品進(jìn)行分級(jí)檢測(cè)時(shí)的正確率高達(dá)92%。另外,郭培源等[36]人以國(guó)家標(biāo)準(zhǔn)為依據(jù),通過(guò)數(shù)字?jǐn)z像技術(shù)獲取豬肉的細(xì)菌菌斑面積、脂肪細(xì)胞數(shù)、顏色特征值以及氨氣等品質(zhì)指標(biāo)來(lái)實(shí)現(xiàn)豬肉新鮮程度的分級(jí)辨認(rèn)。
3展望
新技術(shù)的研究與應(yīng)用必然伴隨著坎坷,從70年代初計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中進(jìn)行應(yīng)用開始,就遇到了很多問(wèn)題。計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中的研究及應(yīng)用主要存在以下幾方面的問(wèn)題。
3.1檢測(cè)指標(biāo)有限
計(jì)算機(jī)視覺技術(shù)在檢測(cè)食品單一指標(biāo)或者以一個(gè)指標(biāo)作為分級(jí)標(biāo)準(zhǔn)進(jìn)行分級(jí)時(shí)具有理想效果,但以同一食品的多個(gè)指標(biāo)共同作為分級(jí)標(biāo)準(zhǔn)進(jìn)行檢測(cè)分級(jí),則分級(jí)結(jié)果誤差較大[37]。例如,Davenel等[38]通過(guò)計(jì)算機(jī)視覺對(duì)蘋果的大小、重量、外觀損傷進(jìn)行分析,但研究結(jié)果顯示,系統(tǒng)會(huì)把花萼和果梗標(biāo)記為缺陷,還由于蘋果表面碰壓傷等缺陷情況復(fù)雜,造成分級(jí)誤差很大,分級(jí)正確率只有69%。Nozer[39-40]等以計(jì)算機(jī)視覺為主要技術(shù)手段,獲取水果的圖像,進(jìn)而通過(guò)分析圖像來(lái)確定水果的形狀、大小、顏色和重量,并進(jìn)行分級(jí),其正確率僅為85.1%。
3.2兼容性差
計(jì)算機(jī)視覺技術(shù)針對(duì)單一種類的果蔬分級(jí)檢測(cè)效果顯著,但是,同一套系統(tǒng)和設(shè)備很難用于其它種類的果蔬,甚至同一種類不同品種的農(nóng)產(chǎn)品也很難公用一套計(jì)算機(jī)視覺設(shè)備。Reyerzwiggelaar等[41]利用計(jì)算機(jī)視覺檢查杏和桃的損傷程度,發(fā)現(xiàn)其檢測(cè)桃子的率顯著高于杏的。Majumdar.S等[42]利用計(jì)算機(jī)視覺技術(shù)區(qū)分不同種類的麥粒,小麥、燕麥、大麥的識(shí)別正確率有明顯差異。
3.3檢測(cè)性能受環(huán)境制約
現(xiàn)階段的計(jì)算機(jī)視覺技術(shù)和配套的數(shù)學(xué)模型適用于簡(jiǎn)單的環(huán)境,在復(fù)雜環(huán)境下工作時(shí)會(huì)產(chǎn)生較大的誤差。Plebe等[43]利用計(jì)算機(jī)視覺技術(shù)對(duì)果樹上的水果進(jìn)行識(shí)別定位,但研究發(fā)現(xiàn)由于光照條件以及周邊環(huán)境的影響,水果的識(shí)別和定位精度不高,不能滿足實(shí)際生產(chǎn)的需要。綜上所述,可看出國(guó)內(nèi)外學(xué)者對(duì)計(jì)算機(jī)視覺技術(shù)在食品工業(yè)中的應(yīng)用進(jìn)行了大量的研究,有些研究從單一方面入手,有些研究綜合了多個(gè)學(xué)科,在研究和應(yīng)用的過(guò)程中,取得了較大的經(jīng)濟(jì)效益,也遇到了很多問(wèn)題,在新的形勢(shì)下,計(jì)算機(jī)視覺技術(shù)和數(shù)碼拍攝、圖像處理、人工神經(jīng)網(wǎng)絡(luò),數(shù)學(xué)模型建設(shè)、微生物快速計(jì)量等高新技術(shù)相融合的綜合技術(shù)逐漸成為了各個(gè)領(lǐng)域?qū)W者的研究熱點(diǎn),以計(jì)算機(jī)視覺為基礎(chǔ)的綜合技術(shù)也將在食品工業(yè)中發(fā)揮更加重要的作用。
作者:姚瑞玲 單位:四川工商職業(yè)技術(shù)學(xué)院
計(jì)算機(jī)視覺論文:雙目計(jì)算機(jī)視覺的自適應(yīng)識(shí)別算法及其監(jiān)控應(yīng)用
摘要:雙目計(jì)算機(jī)視覺是利用仿生學(xué)原理,通過(guò)標(biāo)定后的雙攝像頭來(lái)得到同步曝光圖像,然后計(jì)算獲取的2維圖像像素點(diǎn)的第3維深度信息。為了對(duì)不同環(huán)境場(chǎng)景進(jìn)行監(jiān)控提出了一種新的基于雙目計(jì)算機(jī)視覺的自適應(yīng)識(shí)別算法。該算法首先利用像素點(diǎn)的深度信息對(duì)場(chǎng)景進(jìn)行識(shí)別判斷,然后采用統(tǒng)計(jì)的方法為場(chǎng)景建模,并通過(guò)時(shí)間濾波克服光照漸變,以及通過(guò)深度算法特性克服光照突變。與單攝像頭監(jiān)控系統(tǒng)相比,利用該算法實(shí)現(xiàn)的視頻監(jiān)控原型系統(tǒng),可應(yīng)用于更多場(chǎng)合,并利用深度信息設(shè)置報(bào)警級(jí)別,來(lái)降低誤檢率。
關(guān)鍵詞:雙目計(jì)算機(jī)視覺 深度信息 自適應(yīng) 光照變化 視頻監(jiān)控
1、引 言
面對(duì)日益復(fù)雜的社會(huì)和政治環(huán)境,國(guó)家安全、社會(huì)安全、個(gè)人人生安全和財(cái)產(chǎn)安全等都面臨著不同程度的威脅,都需要各種安全保護(hù)措施,在眾多場(chǎng)所建立切實(shí)有效的安保措施,成為一個(gè)迫切的課題。本文提出了一種基于雙目計(jì)算機(jī)視覺的自適應(yīng)識(shí)別算法,將該算法應(yīng)用于現(xiàn)有的監(jiān)控系統(tǒng),并賦予監(jiān)控終端智能性,不僅使其脫離人而具有獨(dú)立智能、自主判斷的能力,而且使得視頻監(jiān)控系統(tǒng)在安防方面的作用大大提高。
在現(xiàn)有的背景建模方法中,大多對(duì)于背景象素點(diǎn)的亮度值,例如最小亮度值、較大亮度值和較大亮度差值[ 1 ] ,或是對(duì)顏色信息進(jìn)行建模[ 2 ] 。對(duì)于背景的更新,一般使用自適應(yīng)濾波器對(duì)像素的統(tǒng)計(jì)特性進(jìn)行遞歸更新,為了考慮到噪聲的影響,文獻(xiàn)[ 3 ]提出了Kalman濾波器的方法,該文認(rèn)為系統(tǒng)的信息可通過(guò)估計(jì)獲得。考慮到環(huán)境的動(dòng)態(tài)緩慢改變,文獻(xiàn)[ 4 ]利用統(tǒng)計(jì)模型給背景建模,即由一個(gè)時(shí)域?yàn)V波器保留著一個(gè)序列均值和一個(gè)標(biāo)準(zhǔn)偏差,并通過(guò)濾波過(guò)程統(tǒng)計(jì)值隨時(shí)間改變來(lái)反映環(huán)境的動(dòng)態(tài)特性。另外有一些方法解決了光照漸變等影響[ 5~7 ] ,但計(jì)算較復(fù)雜。
2、雙目計(jì)算機(jī)視覺深度算法
基于實(shí)際應(yīng)用考慮,攝像頭的數(shù)量關(guān)系著成本和計(jì)算量,所以選擇支持雙攝像頭(雙目視覺)的算法是最合適的。在支持雙目視覺的算法中,Princeton NEC research institute 基于較大流算法(maximum2flow)的計(jì)算機(jī)視覺算法( Stereo2MF)在深度效果平滑性上做得較好[ 8, 9 ] ,適用于監(jiān)控區(qū)域深度計(jì)算的應(yīng)用背景。但原有算法所需的計(jì)算量和計(jì)算過(guò)程中的暫存數(shù)據(jù)量是較大的,雖然支持計(jì)算量的削減,但只是機(jī)械地在一塊區(qū)域中選擇中心點(diǎn)來(lái)進(jìn)行計(jì)算,這樣計(jì)算的結(jié)果會(huì)因選擇的機(jī)械性,而出現(xiàn)大量的“偽點(diǎn)”,這些偽點(diǎn)錯(cuò)誤地表現(xiàn)了該區(qū)域的平均深度信息。本文采用統(tǒng)計(jì)平均值選取計(jì)算點(diǎn),通過(guò)距離因子的Gauss分布將塊內(nèi)其他點(diǎn)的值融合計(jì)算,從而使得計(jì)算出的值較的代表了這一塊內(nèi)的大致深度分布。
m, n分別是圖像的長(zhǎng)和寬所包含的像素點(diǎn)個(gè)數(shù),M、N 表示像素點(diǎn)的橫縱坐標(biāo), .d 是塊內(nèi)深度統(tǒng)計(jì)平均值, dM, N為計(jì)算點(diǎn)的深度值, q為距離因子, dB是計(jì)算所得的塊深度代表值。圖1為改進(jìn)后雙目視覺深度算法與原算法識(shí)別效果比較。由圖1可以明顯看出,修改后的算法效果在細(xì)節(jié)表現(xiàn)、平滑性、偽點(diǎn)減少上均有明顯改善,而且深度計(jì)算度能夠滿足視頻
圖1 改進(jìn)后雙目視覺深度算法與原算法識(shí)別效果比較Fig. 1Effect comparison after algorithm modification
度計(jì)算度能夠滿足視頻監(jiān)控應(yīng)用的需要。
3、自適應(yīng)識(shí)別算法
對(duì)于一個(gè)固定的場(chǎng)景,場(chǎng)景各像素點(diǎn)的深度值是符合一個(gè)隨機(jī)概率分布。以某一均值為基線,在其附近做不超過(guò)某一偏差的隨機(jī)振蕩,這種情況下的場(chǎng)景稱之為背景。而場(chǎng)景環(huán)境往往是動(dòng)態(tài)變化的,如環(huán)境自然光的緩變,燈光的突然熄滅或點(diǎn)亮,以及運(yùn)動(dòng)對(duì)象的出現(xiàn)、運(yùn)動(dòng)和消失等。如果能識(shí)別出場(chǎng)景中的動(dòng)態(tài)變化,就能自適應(yīng)的更新背景值,將光照的改變?nèi)诤系奖尘爸抵小1疚牟扇×擞媒y(tǒng)計(jì)模型的方式給每個(gè)像素點(diǎn)建模,而以像素點(diǎn)變化的分布情況來(lái)確定光照突變引起的深度突變,并結(jié)合深度計(jì)算本身特性,解決光照緩變突變引起的誤判問(wèn)題,以及判別場(chǎng)景中對(duì)象的主次性。
3. 1 背景象素點(diǎn)的深度值建模
由于雙目計(jì)算機(jī)視覺算法得到的深度值,已經(jīng)是塊融合的,可以根據(jù)精度要求,來(lái)加大塊面積, 減少數(shù)據(jù)量。本文獲得的數(shù)據(jù)量只有原像素點(diǎn)的( k, l分別是塊的長(zhǎng)和寬所包含的像素點(diǎn)個(gè)數(shù)) 。以統(tǒng)計(jì)的方法給每個(gè)像素點(diǎn)的深度值建模, 設(shè)為第u幀圖像的某個(gè)像素點(diǎn)的深度值, 其中u代表第u幀圖像, i, j分別代表像素點(diǎn)的橫坐標(biāo)和縱坐標(biāo)。由一個(gè)時(shí)間濾波器來(lái)保持該像素點(diǎn)深度值的序列均值和時(shí)間偏差
其中,α是一個(gè)可調(diào)增益參數(shù), 其與采樣頻率有關(guān)。通過(guò)濾波過(guò)程,來(lái)得到每個(gè)像素點(diǎn)的深度值基于時(shí)間的統(tǒng)計(jì)特性,由于這些統(tǒng)計(jì)特性反映了環(huán)境的動(dòng)態(tài)特性,據(jù)此可以了解到是環(huán)境的光照發(fā)生了突變,還是有運(yùn)動(dòng)對(duì)象的運(yùn)動(dòng)。
3. 2 背景更新與場(chǎng)景識(shí)別
通過(guò)上述濾波過(guò)程,就可以將光照緩變?nèi)谌氲奖尘爸腥?實(shí)現(xiàn)背景的自適應(yīng)更新。而對(duì)于光照突變,此時(shí)幾乎所有的象素點(diǎn)的亮度值會(huì)同時(shí)增大或減小,但根據(jù)較大流算法的特性,同方向的變化對(duì)流量差不會(huì)引起太大變化, 而對(duì)深度計(jì)算結(jié)果只會(huì)引起較小的同方向變化。這種全局的等量變化, 可以認(rèn)為是光照突變引起的。
其中, a、b和c是3個(gè)可調(diào)節(jié)系數(shù),他們的取值可依據(jù)場(chǎng)景的情況及檢測(cè)光照突變的速度與誤差來(lái)進(jìn)行選取。s, t分別是深度圖像的長(zhǎng)和寬所包含的像素點(diǎn)個(gè)數(shù)。Q是符合式( 9)的像素點(diǎn)個(gè)數(shù)。一旦檢測(cè)到環(huán)境光照發(fā)生了突變, 就把背景點(diǎn)像素的深度序列均值,全部以當(dāng)前幀像素點(diǎn)的深度值的測(cè)量
值代替,而j以0取代,從而實(shí)現(xiàn)背景的及時(shí)更新。
如果式(10)式(12)中任意一個(gè)不成立的話,則認(rèn)為像素塊深度值的變化并非由光照突變引起, 而是場(chǎng)景中有運(yùn)動(dòng)對(duì)象出現(xiàn)。
4、算法分析與實(shí)驗(yàn)
4. 1 算法復(fù)雜度
對(duì)于光照突變檢測(cè),若有突變的話,則會(huì)立即檢測(cè)出來(lái),當(dāng)有運(yùn)動(dòng)對(duì)象出現(xiàn)時(shí), 并且式( 10)式( 12)都接近滿足時(shí),處理會(huì)較慢,因?yàn)樾枰幚硗蛔儥z測(cè)和運(yùn)動(dòng)對(duì)象兩個(gè)過(guò)程。當(dāng)b取25% s ×t時(shí)的處理速度與變化點(diǎn)比例關(guān)系如圖2所示。
相對(duì)于一般的光強(qiáng)、灰度的識(shí)別檢測(cè)算法,本算法的優(yōu)勢(shì)在于不僅可以利用深度特性更容易地檢測(cè)到光照的漸變與突變, 而且可以判斷出現(xiàn)的多個(gè)運(yùn)動(dòng)對(duì)象的主次性。
4. 2 算法誤檢率
由于光照直接對(duì)于像素點(diǎn)的光強(qiáng)、灰度等產(chǎn)生影響,所以深度算法的噪聲容限更大,這樣可降低了誤檢率,多組實(shí)驗(yàn)后得到的誤檢率對(duì)比圖如圖3所示。但是由于深度算法本身對(duì)于反光或者陰暗面會(huì)產(chǎn)生偽點(diǎn),所以,某些時(shí)候由于光照突變中光源的位置變化而會(huì)誤檢為運(yùn)動(dòng)對(duì)象,為此算法還需進(jìn)一步改進(jìn)能判別偽點(diǎn)的出現(xiàn), 除去它在光照突變檢測(cè)中的影響。另外,公式中可調(diào)系數(shù)a, b, c的選取也會(huì)對(duì)不同場(chǎng)景產(chǎn)生影響。
筆者在實(shí)驗(yàn)室環(huán)境下做了不同光照角度、不同環(huán)境光強(qiáng)度、不同運(yùn)動(dòng)物體的多組實(shí)驗(yàn),發(fā)現(xiàn)在反光面或是陰暗面較多的情況下,光照突變檢測(cè)不是很靈敏,而且會(huì)出錯(cuò),但是在增加系數(shù)a, c的值后, 誤檢率有所降低(如圖3所示) 。
5、基于算法的監(jiān)控系統(tǒng)
我們利用該算法實(shí)現(xiàn)了視頻監(jiān)控原型系統(tǒng)。計(jì)算機(jī)視覺算法對(duì)于攝像頭的同步曝光要求很高,所以本系統(tǒng)終端用一塊單獨(dú)的MCU (micro control unit)控制同步曝光。核心算法用DSP處理。系統(tǒng)結(jié)構(gòu)如圖4所示。實(shí)際系統(tǒng)原型圖如圖5所示。
6、結(jié) 論
利用深度信息做智能場(chǎng)景識(shí)別,是一種新的嘗試,有其優(yōu)勢(shì)。將這種方法應(yīng)用到智能視頻監(jiān)控中,能起到很好的效果,克服了其他方法較難處理的光照漸變和突變等問(wèn)題。對(duì)比單攝像頭監(jiān)控系統(tǒng),該系統(tǒng)可應(yīng)用于更多場(chǎng)合。后續(xù)研發(fā)準(zhǔn)備在系統(tǒng)上加上更多功能,以適用于更多的環(huán)境,并與其他 保安類監(jiān)控系統(tǒng)互聯(lián),以組成一整套功能強(qiáng)大、達(dá)到國(guó)內(nèi)外水平的安防系統(tǒng)。
計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的虛實(shí)場(chǎng)景合成方法研究與應(yīng)用
論文關(guān)鍵詞:虛擬現(xiàn)實(shí) 混合現(xiàn)實(shí) 計(jì)算機(jī)視覺
論文摘要 :開發(fā)了一種虛擬場(chǎng)景與實(shí)時(shí)視頻之間的合成技術(shù),成功地將該技術(shù)應(yīng)用于虛擬規(guī) 劃系統(tǒng)中,詳細(xì)介紹了系統(tǒng)所采用的基于計(jì)算機(jī)視覺的標(biāo)識(shí)識(shí)別和實(shí)時(shí)、自動(dòng)攝像機(jī)位置、姿態(tài)跟蹤算法,并給出了系統(tǒng)運(yùn)行結(jié)果。
0 引 言
虛擬現(xiàn)實(shí)技術(shù) 的最終目的是使用戶沉浸在一個(gè) 由計(jì)算機(jī)生成的虛擬環(huán)境中,該技術(shù)已經(jīng)被成功地應(yīng)用到軍事、教育、娛樂(lè)等眾多領(lǐng)域。隨著應(yīng)用 的增多 ,虛擬現(xiàn)實(shí)技術(shù) 的缺陷也逐漸暴露出來(lái),主要表現(xiàn)在如下兩個(gè)方面:(1)虛擬現(xiàn)實(shí) 中的場(chǎng)景由計(jì)算機(jī)生成,隨著繪制場(chǎng)景真實(shí)程度的提高,對(duì)系統(tǒng)硬件配置的要求也相應(yīng)提高,從而形成了繪制效果和實(shí)時(shí)性兩個(gè)同等重要又難以同時(shí)解決 的問(wèn)題 。(2)交互方式受限.鼠標(biāo)、鍵盤等傳統(tǒng)輸入設(shè)備并沒有提供給用戶一種直觀 自然的交互方式,而數(shù)據(jù)手套等較為昂貴的外圍設(shè)備不僅使用起來(lái)不方便,而且對(duì)工作范圍也有一定的限制。
混合現(xiàn)實(shí) 技術(shù)的出現(xiàn)很大程度上解決了以上兩個(gè)問(wèn)題,它將計(jì)算機(jī)生成的虛擬場(chǎng)景、提示信息實(shí)時(shí)疊加到用戶所能觀察到的真實(shí)世界當(dāng)中,并以此來(lái)增強(qiáng)用戶視覺感受 。在混合現(xiàn)實(shí)環(huán)境中用戶所能觀察到的主體是來(lái)源于真實(shí)世界的圖像信息,虛擬場(chǎng)景只起到輔助、提示作用,因此不需要真實(shí)感圖形繪制所需的高端的硬件配置。另一方面,由于圖像信息來(lái)源于真實(shí)世界,這就使得用戶本身能夠很自然地融合到整個(gè)系統(tǒng)中,并且能夠 以一種 自然 、直觀的方式與系統(tǒng)交互,而不必添加額外的硬件設(shè)備。正是由于以上特性,混合現(xiàn)實(shí)技術(shù)已經(jīng)被應(yīng)用到眾多領(lǐng)域當(dāng)中,而且能夠比虛擬現(xiàn)實(shí)更好地完成某些任務(wù),如交互式規(guī)劃、動(dòng)態(tài)虛擬展示等。
一個(gè)實(shí)用的混合現(xiàn)實(shí)系統(tǒng)所必須具備的特性之一是幾何一致性,即系統(tǒng)必須實(shí)時(shí)地判斷攝像機(jī)相對(duì)于真實(shí)世界的位置和姿態(tài).以便將虛擬場(chǎng)景正確地疊加到真實(shí)世界的具體位置上,使得用戶從感官上認(rèn)為虛擬場(chǎng)景確實(shí)是真實(shí)世界的一部分。傳統(tǒng)的方法是利用硬件設(shè)備(電磁式、機(jī)械式跟蹤系統(tǒng))來(lái)獲取攝像頭位置信息,但這些方法不僅工作范圍受限,而且求得的結(jié)果也不夠。本文采用當(dāng)前流行的基于計(jì)算機(jī)視覺的方法來(lái)獲取位置信息,事實(shí)證明該方法是有效、可行的。
系統(tǒng)結(jié)構(gòu)及工作流程
筆者構(gòu)建 了一個(gè)如圖 1所示的混合現(xiàn)實(shí)原型系統(tǒng),主要由如下幾個(gè)部分組成:(1)平面標(biāo)識(shí)塊:一個(gè)帶有黑色邊框的正方形.尺寸、內(nèi)部圖案由用戶定義,主要功能是使系統(tǒng)能夠根據(jù)實(shí)際圖像中標(biāo)識(shí)的變形來(lái)計(jì)算虛實(shí)配準(zhǔn)所需的位置、姿態(tài)信息,同時(shí)還可以用不同的內(nèi)部圖案代表不同的虛擬場(chǎng)景,以增強(qiáng)系統(tǒng)的實(shí)用性。(2)圖像采集設(shè)備(攝像機(jī)):主要完成實(shí)時(shí)視頻采集功能。(3)圖形渲染系統(tǒng):生成與視頻合成所需的虛擬場(chǎng)景。(4)虛實(shí)合成:利用攝像機(jī)位置、姿態(tài)信息將視頻與虛擬場(chǎng)景相融合。(5)顯示設(shè)備 :包括頭盔式顯示器以及桌面臺(tái)式顯示器,用以將虛實(shí)合成的影像展現(xiàn)給使用者。
系統(tǒng)運(yùn)行過(guò)程中,首先將采集到的一幀彩色圖像轉(zhuǎn)換成一幅二值(黑 白)圖像,然后對(duì)該二值圖像進(jìn)行連通域分析,找出其中所有的四邊形區(qū)域作為候選匹配區(qū)域,將每一候選區(qū)域與模板庫(kù)中的模板進(jìn)行匹配,如果產(chǎn)生匹配,則認(rèn)為找到了一個(gè)標(biāo)識(shí),在生成與該標(biāo)識(shí)對(duì)應(yīng)的虛擬場(chǎng)景的同時(shí)利用該標(biāo)識(shí)區(qū)域的變形來(lái)計(jì)算攝像機(jī)相對(duì)于已知標(biāo)識(shí)的位置和姿態(tài),根據(jù)得到的變換矩陣實(shí)現(xiàn)虛實(shí)之間的無(wú)縫融合。
2 標(biāo)識(shí)識(shí)別與攝像機(jī)位置、姿態(tài)跟蹤算法
由上一節(jié)可知,構(gòu)建該系統(tǒng)有兩個(gè)關(guān)鍵問(wèn)題需要解決 ,即如何識(shí)別標(biāo)識(shí)內(nèi)部的不同圖案以生成與之對(duì)應(yīng)的虛擬場(chǎng)景 以及如何利用標(biāo)識(shí)的變形計(jì)算虛實(shí)配準(zhǔn)所需的坐標(biāo)變換關(guān)系。以下分別介紹以上兩個(gè)問(wèn)題的解決方法。
2.1標(biāo)識(shí)識(shí)別
本系統(tǒng) 所采用的標(biāo)識(shí)識(shí)別方法可 以分為以下幾步。
2.1.1圖像二值化
首先對(duì)采集到的彩色圖像進(jìn)行二值化,處理成黑白(0,1)圖像,如圖 2(b)。具體方法為:設(shè)定一個(gè) 閾值,對(duì)圖像進(jìn)行遍歷 ,根據(jù)該閾值,對(duì)圖像重新賦值。為了克服光照對(duì)識(shí)別結(jié)果造成的影響,同時(shí)采用 了自適應(yīng)閾值法 來(lái)提高系統(tǒng)穩(wěn)定性,設(shè)定當(dāng)前 閾值 為上一幀圖像中標(biāo)識(shí)投影區(qū)域像素灰度的平均值,實(shí)驗(yàn)證明該方法對(duì)改善系統(tǒng)性能有較為明顯的效果。
2.1.2連通域分析
連通域分析的 目的是從復(fù)雜背景中提取標(biāo)識(shí)的投影區(qū)域。分析過(guò)程為:查找所有像素值為 1的連通區(qū)域,首先根據(jù)大小約束對(duì)區(qū)域進(jìn)行預(yù)篩選,然后利用最小二乘直線擬合法篩選出所有四邊形區(qū)域 ,結(jié)果見圖 2(c)。
2.1.3 區(qū)域規(guī)則化與模板匹配
區(qū)域規(guī)則化是將圖像中經(jīng)過(guò)投影變換的標(biāo)識(shí)區(qū)域變換到標(biāo)準(zhǔn)模板空間,本文利用仿射變換 將標(biāo)識(shí)經(jīng)過(guò)投影變形后 的區(qū)域直接映射到一個(gè) 64×64大小的正方形模板,效果見圖2(d)。接下來(lái)的工作是將規(guī)則化圖像與模板庫(kù)中的模板進(jìn)行匹配,以返回代表不同虛擬場(chǎng)景的 id值。本文采用相關(guān)系數(shù)法來(lái)完成匹配工作,方法如下:
首先利用以下四式計(jì)算規(guī)則化圖像 i和標(biāo)準(zhǔn)模板圖像 p各自的均值和方差。
然后計(jì)算兩幅圖像的相關(guān)系數(shù) p,本文選擇所有模板中與規(guī)則化圖像具有較大相關(guān)系數(shù) p且 p>0.5的模板作為當(dāng)前匹配結(jié)果,并返回與之對(duì)應(yīng)的 id值
2.2攝像機(jī)位置、姿態(tài)估計(jì)
首先給出系統(tǒng)的坐標(biāo)變換關(guān)系如圖 3所示。規(guī)定平面標(biāo)識(shí)在世界坐標(biāo)系中的位置為已知,攝像機(jī)位置、姿態(tài)計(jì)算問(wèn)題轉(zhuǎn)化為攝像機(jī)坐標(biāo)系與世界坐標(biāo)系之間三維變換矩陣的求解。
世界坐標(biāo) 系與攝像機(jī)坐標(biāo)系間的變換關(guān)系可以用式(5)表示。其中 w為世界坐標(biāo)系下某點(diǎn)坐標(biāo),c為該點(diǎn)在攝像機(jī)坐標(biāo)系中的位置,t :[r r r:t] 為待求三維變換矩陣,包含三個(gè)旋轉(zhuǎn)分量和一個(gè)平移分量。
c=t w (5)
由于規(guī)定平面標(biāo)識(shí)與世界坐標(biāo)系下的z:0平面重合 ,則由式 (5)可得 ,平面標(biāo)識(shí)上的某點(diǎn)在世界坐標(biāo)系下的坐標(biāo) wi=(x ,y wi,0,1) 與其在攝像機(jī)坐標(biāo)系下坐標(biāo) c;:(x y z i,1) 之間的關(guān)系可以表示為式(6)。
有 8個(gè)待定系數(shù),由標(biāo)識(shí)的 四個(gè)角點(diǎn)可得 如下 方程組 ,則可以求取以上 8個(gè)未知數(shù)。
通過(guò)上述計(jì)算可以確定變換矩陣中的 r ,r ,t,三個(gè)分量,由變換矩陣旋轉(zhuǎn)分量的正交性可以求得r :r ×r ,需要對(duì)所求得的結(jié)果作歸一化操作以消除比例因子 t 對(duì)計(jì)算結(jié)果的影響,方法是將(1 r l+l r 1)/2去除以上各分量。
事實(shí)上由于不可能避免成像畸變以及圖像處理過(guò)程中的誤差,上述方法求得的變換矩陣 t 是不夠的。解決方法是利用上述方法求取及時(shí)幀圖像對(duì)應(yīng)的 t ,在后續(xù)計(jì)算過(guò)程中采用非線性最小二乘法求取后續(xù)幀的對(duì)應(yīng)的變換矩陣。誤差逼近計(jì)算公式見式 (1 1)。
式中(文 i)(i=0,1,2,3)為根據(jù)上一幀t 求得的標(biāo)識(shí)四個(gè)角點(diǎn)在像平面坐標(biāo)系下的位置,(x i,y ;)(i=0,1,2,3)為實(shí)時(shí)檢測(cè)到的標(biāo)識(shí)角點(diǎn)在圖像中的位置。本 文利用勒溫伯格一馬闊特方法求解式(11)。
3 應(yīng)用實(shí)例——基于混合現(xiàn)實(shí)的小區(qū)規(guī)劃系統(tǒng)
傳統(tǒng)的住宅小區(qū)規(guī)劃方法之一是制作規(guī)劃方案模型,但是制作實(shí)體模型不僅費(fèi)時(shí)費(fèi)力,而且修改起來(lái)也極為不便。近年來(lái),基于虛擬現(xiàn)實(shí)技術(shù)的小區(qū)規(guī)劃方法已經(jīng)逐漸為設(shè)計(jì)者所接受,它一定程度上解決了實(shí)體模型規(guī)劃方法的缺點(diǎn),但是由于缺乏高效、自然的人機(jī)交互方式,使得規(guī)劃效果大打折扣。混合現(xiàn)實(shí)技術(shù)的出現(xiàn)為小區(qū)規(guī)劃提供了新的契機(jī),它既繼承了虛擬現(xiàn)實(shí)技術(shù)的三維表現(xiàn)能力,又具有虛實(shí)結(jié)合的特點(diǎn),能夠在真實(shí)的規(guī)劃場(chǎng)景中整合設(shè)計(jì)要素,給設(shè)計(jì)者和方案評(píng)估者以直觀的感受。
筆者利用本文方法開發(fā)了一套基于混合現(xiàn)實(shí)技術(shù)的虛擬小區(qū)規(guī)劃系統(tǒng)。系統(tǒng)中不同的標(biāo)識(shí)對(duì)應(yīng)不同的虛擬建筑模型,用戶可以在視線范圍內(nèi)隨意移動(dòng)模型.從而實(shí)現(xiàn)不 同的規(guī)劃 方案 。運(yùn)行效果 如圖4該系統(tǒng)滿足了小區(qū)規(guī)劃對(duì)虛實(shí)交互、人機(jī)交互的要求,充分體現(xiàn)出混合現(xiàn)實(shí)技術(shù)在小區(qū)規(guī)劃應(yīng)用中的優(yōu)勢(shì)。
4 結(jié)束語(yǔ)
本文設(shè)計(jì) 了一種基于計(jì)算機(jī)視覺的虛實(shí)場(chǎng)景合成方法,具有實(shí)時(shí)性好、可用性高等特點(diǎn),當(dāng)前系統(tǒng)中存在的主要問(wèn)題是虛擬場(chǎng)景與真實(shí)場(chǎng)景之間還沒有遮擋和碰撞關(guān)系 ,從 而影響 了系統(tǒng) 的真實(shí)感 ,下一步的工作是對(duì)虛實(shí)之問(wèn)的遮擋和碰撞檢測(cè)問(wèn)題展開研究。
計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺技術(shù)在科學(xué)教育的作用
摘要近年來(lái),人們對(duì)技術(shù)科學(xué)教育問(wèn)題產(chǎn)生了很大的困擾,因?yàn)檎_的科學(xué)技術(shù)的傳承影響著祖國(guó)下一代科技的發(fā)展。正在此時(shí),一種類似研究如何使系統(tǒng)從圖像或多維數(shù)據(jù)中“感知”的科學(xué),即計(jì)算機(jī)視覺技術(shù)迅速崛起,并被廣泛地應(yīng)用于各個(gè)領(lǐng)域。其中最重要的是一個(gè)基于BSD許可(開源)發(fā)行的跨平臺(tái)計(jì)算機(jī)視覺庫(kù)OpenCV,本文主要介紹的就是通過(guò)利用OpenCV中的相關(guān)算法,能夠帶來(lái)的巨大價(jià)值以及此項(xiàng)技術(shù)在現(xiàn)代科學(xué)教育方面所發(fā)揮的重要作用。
關(guān)鍵詞OpenCV;科學(xué)教育;推廣價(jià)值
1、OpenCV庫(kù)簡(jiǎn)介
OpenCV是由Intel微處理器研究實(shí)驗(yàn)室的視覺交互組開發(fā)的一個(gè)跨平臺(tái)計(jì)算機(jī)視覺庫(kù),它的代碼都是開源的而且都經(jīng)過(guò)非常好的優(yōu)化,并且具有很好的移植性,可以根據(jù)需求導(dǎo)入到合適的環(huán)境中使用。它可以實(shí)現(xiàn)有關(guān)圖像識(shí)別與處理和計(jì)算機(jī)視覺技術(shù)方面的很多通用算法。它的優(yōu)勢(shì)是可以運(yùn)行在當(dāng)代社會(huì)使用熱門的各大操作系統(tǒng)上,適用性強(qiáng),還可以脫離外部庫(kù)而獨(dú)立運(yùn)行。OpenCV的C和C++都是經(jīng)過(guò)優(yōu)化的開源代碼,采用靈活的接口,提升計(jì)算機(jī)的運(yùn)行速度。其中包含的函數(shù)就有500多個(gè),包括的種類有C和C++等。OpenCV因?yàn)槊赓M(fèi)面向市場(chǎng),已經(jīng)被社會(huì)各界廣泛使用。現(xiàn)已應(yīng)用于人機(jī)互動(dòng)、圖像識(shí)別、圖像分割、目標(biāo)追蹤、3D重建、機(jī)器視覺、結(jié)構(gòu)分析等數(shù)個(gè)領(lǐng)域。OpenCV主要包括以下幾個(gè)部分:①cxcore:核心功能模塊,包含一些基本函數(shù),運(yùn)用于各種數(shù)據(jù)類型的計(jì)算。②cv:圖像處理和計(jì)算機(jī)視覺功能。③ml:機(jī)器學(xué)習(xí)模塊,主要內(nèi)容是分類器。④cvaux:包括大部分實(shí)驗(yàn)性的函數(shù),例如ViewMorph-ing、三維跟蹤、PCA、HMM等。⑤Highgui:圖像界面接口,支持?jǐn)z像頭的讀取和轉(zhuǎn)換。
2、OpenCV處理圖像的功能
OpenCV中有很多的函數(shù),可以實(shí)現(xiàn)很多不同的功能,其中具有學(xué)習(xí)價(jià)值的部分就是圖像處理。處理圖像主要分為三部分:加載圖像,顯示圖像,處理圖像。
2.1加載圖像
不同類型的圖像有著不同的內(nèi)部結(jié)構(gòu)。我們需要根據(jù)圖像的結(jié)構(gòu)采用合適的方法將圖像文件中的數(shù)據(jù)讀入內(nèi)存。OpenCV中的cvLoadImage()函數(shù),可以加載圖像數(shù)據(jù)。而且圖像的格式不影響加載的效果,加載后它以一個(gè)指向IplImage結(jié)構(gòu)體的指針形式返回,大大方便了后續(xù)處理的過(guò)程。2.2顯示圖像加載圖像后需要通過(guò)函數(shù)使其顯示。cvNamedWindow()函數(shù)由HighGUI庫(kù)提供,它可以在屏幕上創(chuàng)建一個(gè)窗口,將圖像顯示出來(lái)。cvShowImage()函數(shù)的作用是在這個(gè)創(chuàng)建的窗口中顯示出加載過(guò)后的圖像。觀察圖像時(shí)經(jīng)常用到的重要函數(shù)還有可以使程序暫停的函數(shù)cvWaitKey(),以及用于釋放內(nèi)存的函數(shù)cvReleaseImage()和cvDestoryWindow(),掌握并運(yùn)用這些函數(shù),就可以輕松的實(shí)現(xiàn)觀察圖像的功能。
2.3處理圖像
OpenCV中包含的多種函數(shù),可以達(dá)到圖像處理技術(shù)方面的很多效果,包括圖像灰度化函數(shù)cvtColor(),邊緣檢測(cè)函數(shù)Sobel()、Laplacian()、Canny(),其中Canny算子只能處理8位灰度圖,其余兩種8位32位都可以,合并梯度函數(shù)addWeighted(),放大縮小函數(shù)resize(),閾值化操作函數(shù)imshow()等等。適當(dāng)選用合適的函數(shù)并加以運(yùn)用即可達(dá)到目標(biāo)所需。
3、OpenCV的推廣價(jià)值體現(xiàn)
OpenCV可以應(yīng)用在社會(huì)的各個(gè)領(lǐng)域,價(jià)值就體現(xiàn)在每個(gè)科學(xué)的產(chǎn)物當(dāng)中。舉個(gè)近在身邊的例子,隨著社會(huì)的發(fā)展,生活質(zhì)量的提高,人們的居住環(huán)境也在逐漸改善,樓層越蓋越高,無(wú)數(shù)摩天大樓,商業(yè)大廈群起而立,電梯已經(jīng)成為了我們?nèi)粘I钪斜夭豢缮俚墓ぞ摺1M管現(xiàn)在電梯的功能、質(zhì)量不斷地提升,但是仍然存在些許不足,當(dāng)我們?cè)趯W(xué)校的教學(xué)樓內(nèi)等電梯時(shí)發(fā)現(xiàn)了一個(gè)問(wèn)題,那就是在電梯使用的高峰期時(shí),比如在上下課時(shí)段,有很多人都在同一樓層等電梯。但是此時(shí)只有一臺(tái)離該樓層最近的電梯會(huì)過(guò)來(lái),而其余的電梯都會(huì)自動(dòng)向其它叫梯樓層運(yùn)行或是閑置。可是此時(shí)這一臺(tái)電梯只能容納有限數(shù)量的人,時(shí)常不能使所有人坐上電梯,這樣就無(wú)法滿足全部人的需求,由此就導(dǎo)致了有部分人無(wú)法及時(shí)地坐上電梯,需要繼續(xù)等候,而閑置的電梯又不能及時(shí)地被利用。這樣不僅不能合理地利用資源,反而浪費(fèi)了許多不必要的時(shí)間。因此,我們想到可以通過(guò)利用圖像識(shí)別與處理的方法來(lái)彌補(bǔ)這個(gè)不足,首先通過(guò)硬件設(shè)備連接拍照捕獲候梯人像,后臺(tái)運(yùn)行判斷出候梯人數(shù),然后運(yùn)用語(yǔ)言編程來(lái)確定調(diào)動(dòng)電梯的個(gè)數(shù),從而來(lái)達(dá)到實(shí)現(xiàn)自動(dòng)控制每個(gè)電梯的運(yùn)行的目的,使所有人都能在及時(shí)時(shí)間乘坐電梯。而上文中提到的OpenCV就可以完成這項(xiàng)艱巨的任務(wù)。我們將OpenCV導(dǎo)入編程環(huán)境,其次修改電梯工作系統(tǒng)的運(yùn)行程序,將軟件與硬件設(shè)備相連通,這樣通過(guò)調(diào)度程序,就可以輕松高效地解決這個(gè)問(wèn)題。使用這種方法,不僅可以節(jié)約人們的候梯時(shí)間,方便學(xué)生、老師上課,而且可以合理有效地調(diào)度電梯,使電梯的價(jià)值得到較大化。見微知著,OpenCV可以應(yīng)用在每個(gè)領(lǐng)域,對(duì)各界的發(fā)展起到推動(dòng)作用,造福社會(huì)的科技發(fā)展,方便人們的生活。
4、科學(xué)教育存在的問(wèn)題
在歷年的教學(xué)模式中,老師們往往會(huì)強(qiáng)調(diào)理論知識(shí)的重要性,但卻忽略了對(duì)學(xué)生使用動(dòng)手能力的培養(yǎng),學(xué)生不能獨(dú)立完成實(shí)踐性的技術(shù)操作,也就是說(shuō)教學(xué)模式缺乏實(shí)踐性。只有將理論與實(shí)踐相結(jié)合,才能實(shí)現(xiàn)知識(shí)價(jià)值的較大化,因此,應(yīng)當(dāng)在教學(xué)中配合著實(shí)踐課程,舉一反三,讓學(xué)生們更加深刻地學(xué)習(xí)和了解所學(xué)到的知識(shí)。而如今雖然一部分學(xué)校也開設(shè)了實(shí)踐課程,但也只是淺嘗輒止,并沒有過(guò)多地講授計(jì)算機(jī)技術(shù)實(shí)踐方面的知識(shí),學(xué)生們也沒有真正擁有動(dòng)手實(shí)踐能力,這使學(xué)生們的技術(shù)知識(shí)十分受限。雖然現(xiàn)在多數(shù)學(xué)生對(duì)計(jì)算機(jī)略懂一二,但是實(shí)際上僅僅會(huì)使用類似Word等簡(jiǎn)單的軟件,而技術(shù)要求較高的一些軟件及工具卻全然不知,甚至對(duì)自己所學(xué)過(guò)的課程軟件的使用也是馬馬虎虎,這對(duì)于未來(lái)工作所需的能力來(lái)講,實(shí)在是九牛一毛。目前中學(xué)生使用電腦的重心更多放在了社交軟件和游戲上,很少有人利用計(jì)算機(jī)學(xué)習(xí)更多的技能,這對(duì)青少年的發(fā)展實(shí)在是利大于弊的,而且這樣也失去了計(jì)算機(jī)的正向價(jià)值。因此,我們應(yīng)該改變現(xiàn)有的教學(xué)模式,一邊教授理論知識(shí),一邊配合指導(dǎo)學(xué)生動(dòng)手操作,將理論與實(shí)踐相結(jié)合,也能讓學(xué)生更好地消化和吸收所學(xué)到的知識(shí),并且引導(dǎo)學(xué)生正確使用計(jì)算機(jī),發(fā)揮計(jì)算機(jī)的價(jià)值,讓學(xué)生們都能夠在計(jì)算機(jī)中獲得更多的知識(shí)。
5OpenCV開源算法庫(kù)在各個(gè)領(lǐng)域的實(shí)例化體現(xiàn)
OpenCV在醫(yī)學(xué)領(lǐng)域、軍事領(lǐng)域、安全防護(hù)領(lǐng)域等都有很大的重要意義。在醫(yī)學(xué)領(lǐng)域中,由于有了這個(gè)開源算法庫(kù),我們可以盡可能地調(diào)用它,從而來(lái)進(jìn)行圖像處理、對(duì)象檢測(cè),讓醫(yī)生更好更快速觀測(cè)人體結(jié)構(gòu),及時(shí)發(fā)現(xiàn)病癥。在軍事領(lǐng)域中,大多數(shù)無(wú)人操作的機(jī)器運(yùn)作,比如無(wú)人機(jī)飛行、水下無(wú)人駕駛儀、無(wú)人駕駛汽車等等,都需要用到OpenCV來(lái)對(duì)圖像進(jìn)行處理,并進(jìn)行分析,并且可以檢測(cè)出人眼看不到的事物,這是OpenCV能夠帶來(lái)人類的巨大的進(jìn)步。在安全防護(hù)領(lǐng)域中,我們現(xiàn)實(shí)生活中常見的汽車的安全駕駛,房屋入侵的檢測(cè)、自動(dòng)監(jiān)視報(bào)警系統(tǒng)等等,正是由于這些技術(shù),讓我們的環(huán)境更加安全,這都是我們生活中息息相關(guān)不可缺少的。現(xiàn)如今,國(guó)家的科學(xué)技術(shù)飛速發(fā)展,日益強(qiáng)盛,OpenCV的成績(jī)有目共睹,未來(lái)的發(fā)展需要科學(xué)技術(shù)的不斷推進(jìn),才能為祖國(guó)未來(lái)的其他事業(yè)提供強(qiáng)有力的后盾。
6OpenCV在科學(xué)教育中的作用
在文化改革的大背景下,文盲的概念早已從沒有文化轉(zhuǎn)變成了不會(huì)使用計(jì)算機(jī)。因?yàn)殡S著科技的進(jìn)步,計(jì)算機(jī)的使用已經(jīng)越來(lái)越廣泛,計(jì)算機(jī)已經(jīng)逐步取代了以往人工可以完成的許多工作,比如在超市生成的結(jié)賬單、用計(jì)算機(jī)控制動(dòng)力系統(tǒng)的運(yùn)行、人造衛(wèi)星軌跡的計(jì)算等等,這些都依賴于計(jì)算機(jī)強(qiáng)大的功能。計(jì)算機(jī)的推廣證明著我國(guó)科技的發(fā)展和人類文明的進(jìn)步,由此可見,計(jì)算機(jī)技術(shù)知識(shí)的掌握對(duì)現(xiàn)代人來(lái)說(shuō)是十分重要的。如果想要成為一個(gè)真正有技術(shù)、有能力的人才,就務(wù)必要熟練掌握計(jì)算機(jī)技術(shù)的使用。但是目前當(dāng)代社會(huì)的教育在計(jì)算機(jī)技術(shù)方面的內(nèi)容還不夠豐富。減壓政策開放以來(lái),教育課時(shí)被壓縮,技術(shù)知識(shí)的傳輸也相應(yīng)減少,學(xué)生們的能力也因此日益下降。而科學(xué)教育,顧名思義,是使科學(xué)技術(shù)在教育過(guò)程中得以傳承。想要科學(xué)地教育學(xué)生,就必須要多多講授科學(xué)技術(shù)方面有關(guān)的知識(shí)。說(shuō)到科學(xué)技術(shù),它的重點(diǎn)自然是計(jì)算機(jī)技術(shù),而OpenCV作為計(jì)算機(jī)視覺技術(shù)的核心,可以說(shuō)也是計(jì)算機(jī)技術(shù)甚至科學(xué)教育中的一個(gè)重要部分。在教育中普及并傳承這個(gè)技術(shù)無(wú)疑可以提高學(xué)生們的技術(shù)水平。但是,相信有大多數(shù)的人在此之前從未聽說(shuō)過(guò)計(jì)算機(jī)視覺技術(shù),也并不了解OpenCV庫(kù),更加不會(huì)學(xué)習(xí)到與之有關(guān)的技術(shù)知識(shí)。在這樣嚴(yán)峻的形勢(shì)下,我們更應(yīng)該將類似OpenCV方面技術(shù)有關(guān)的知識(shí)通過(guò)教育傳遞下去。各大高校應(yīng)積極開展有關(guān)計(jì)算機(jī)的活動(dòng),開設(shè)與計(jì)算機(jī)技術(shù)有關(guān)的課程。這樣才能根據(jù)社會(huì)的需求來(lái)培養(yǎng)更多的綜合性人才。如果可以將其投入到現(xiàn)代教育當(dāng)中,定會(huì)使現(xiàn)在的教育事業(yè)更加輝煌,也能使祖國(guó)的未來(lái)更加璀璨。
計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺藝術(shù)在數(shù)字媒體的應(yīng)用
摘要:現(xiàn)階段,隨著社會(huì)經(jīng)濟(jì)水平的快速穩(wěn)定發(fā)展,人們不能夠滿足物質(zhì)方面的一些滿足,開始追求精神層面的追求。當(dāng)生活與科技緊密的聯(lián)系時(shí),設(shè)計(jì)以及藝術(shù)應(yīng)該發(fā)展成為一個(gè)主流的趨勢(shì),屬于有效滿足精神追求的一個(gè)關(guān)鍵環(huán)節(jié)。在本文中,簡(jiǎn)單分析了計(jì)算機(jī)視覺原理,主要分析了數(shù)字媒體當(dāng)中視覺藝術(shù)的實(shí)際應(yīng)用,更好的讓人們感受到科技以及藝術(shù)所具有的魅力。
關(guān)鍵詞:視覺原理;計(jì)算機(jī)視覺藝術(shù);數(shù)字媒體;應(yīng)用
利用計(jì)算機(jī)所具有的視覺藝術(shù),大眾僅僅利用需要實(shí)施身體動(dòng)作來(lái)直接性的操作以及控制,根本就不需要學(xué)習(xí)就能夠啟動(dòng)以及進(jìn)行一定的操作,這樣更加方便老年人以及兒童的實(shí)際操作。在數(shù)字媒體當(dāng)中,應(yīng)該對(duì)計(jì)算機(jī)視覺藝術(shù)進(jìn)行充分利用,更加方便人們的實(shí)際操作,同時(shí)還能夠保障其更好的感受藝術(shù)方面所具有的魅力,讓群眾在足夠放松的時(shí)刻能夠?qū)?chuàng)作者的實(shí)際思想以及意圖進(jìn)行充分的了解以及掌握,對(duì)藝術(shù)價(jià)值進(jìn)行充分發(fā)揮,進(jìn)而來(lái)有效提升藝術(shù)人文的實(shí)際價(jià)值。
1對(duì)計(jì)算機(jī)視覺原理進(jìn)行分析
通常來(lái)講,計(jì)算機(jī)視覺還稱為機(jī)械視覺,屬于是機(jī)械來(lái)對(duì)人類視覺進(jìn)行一定的模仿的光學(xué)識(shí)別系統(tǒng),利用光學(xué)系統(tǒng)、感應(yīng)器、光源等來(lái)實(shí)現(xiàn)物體定位、動(dòng)作的追蹤以及視線的判斷等相關(guān)的功能。一般情況下,工程技術(shù)所運(yùn)用的基本都是計(jì)算機(jī)視覺,當(dāng)有著一定的環(huán)境以及模式時(shí),計(jì)算機(jī)視覺在進(jìn)行持續(xù)性的工作時(shí),能夠有效保障持續(xù)工作有著非常高的正確性以及性,還能夠?qū)θ斯げ豢梢酝瓿傻娜蝿?wù)進(jìn)行很好的完成。當(dāng)計(jì)算機(jī)視覺在進(jìn)行實(shí)際的工作過(guò)程中,最為基本的條件是先對(duì)映像進(jìn)行處理,之后輸入模擬訊號(hào),對(duì)數(shù)字影像進(jìn)行一定的處理以及分析。實(shí)際的工作流程是:影像在攝入之后,應(yīng)該對(duì)其進(jìn)行一定的強(qiáng)化,除去噪聲,之后對(duì)圖像特征進(jìn)行一定的壓縮以及獲取。在對(duì)數(shù)據(jù)庫(kù)樣本進(jìn)行一定的對(duì)比之后,對(duì)程序進(jìn)行有效的分析以及判斷,做出有效的指令。
2對(duì)數(shù)字媒體當(dāng)中計(jì)算機(jī)視覺藝術(shù)的實(shí)際應(yīng)用進(jìn)行分析
2.1藝術(shù)與計(jì)算機(jī)進(jìn)行一定的融合時(shí),應(yīng)該對(duì)動(dòng)畫、聲音以及圖像等因素進(jìn)行有效結(jié)合,在對(duì)藝術(shù)語(yǔ)言表現(xiàn)形式進(jìn)行豐富的同時(shí),應(yīng)該提高作品的感染力
在有些結(jié)合視覺藝術(shù)以及數(shù)字媒體時(shí),應(yīng)該保障在對(duì)畫面進(jìn)行觀看時(shí),應(yīng)該有效的欣賞畫面,還可以有效的感受到聲色等。利用高度仿真的聽覺、觸覺以及視覺,保障大眾在進(jìn)行玩游戲時(shí),可以對(duì)虛擬世界進(jìn)行真實(shí)的感受,還能夠利用動(dòng)作以及肢體語(yǔ)言等來(lái)和計(jì)算機(jī)實(shí)現(xiàn)有效的交流。保障大眾不是對(duì)電影單獨(dú)的進(jìn)行欣賞,還應(yīng)該更好的參與到其中,體會(huì)藝術(shù)的表演。
2.2在數(shù)字媒體當(dāng)中運(yùn)用計(jì)算機(jī)視覺藝術(shù)能夠?qū)λ囆g(shù)的實(shí)際表達(dá)形式進(jìn)行有效的豐富
隨著交互技術(shù)的逐漸成熟以及發(fā)展,讓該技術(shù)得到了有效的拓展以及廣泛的運(yùn)用。運(yùn)用交互技術(shù),應(yīng)該讓人們不受到被動(dòng)的欣賞,應(yīng)該積極的參與到視覺藝術(shù)當(dāng)中,保障大眾的積極參與以及做出判斷,同能夠利用各種選擇來(lái)呈現(xiàn)出過(guò)程以及解決,對(duì)觀眾的興趣進(jìn)行充分的調(diào)動(dòng),進(jìn)而來(lái)有效提高大眾的參與積極性。
2.3在電子游戲當(dāng)中,運(yùn)用計(jì)算機(jī)視覺藝術(shù),應(yīng)該在相對(duì)比較大型的電子游戲當(dāng)中進(jìn)行計(jì)算機(jī)視覺技術(shù)的運(yùn)用
在實(shí)際的游戲過(guò)程當(dāng)中,大部分的玩家基本上不再是僅僅運(yùn)用鍵盤以及鼠標(biāo)來(lái)實(shí)施游戲,大部分都是利用身體行動(dòng)來(lái)移動(dòng)。通常情況下,機(jī)器利用攝像機(jī)部來(lái)對(duì)玩家的具體身體動(dòng)作進(jìn)行一定的捕捉,玩家能夠與機(jī)器相連接的手槍進(jìn)行有效的操作,射中屏幕當(dāng)中的對(duì)象。同時(shí),手機(jī)上的相對(duì)比較小型的電子游戲,僅僅需要手指來(lái)滑動(dòng)屏幕,就能夠?qū)崿F(xiàn)實(shí)物的運(yùn)動(dòng)以及跳躍等,進(jìn)而來(lái)躲避障礙。除此之外,僅僅需要稍微的傾斜一些收集,就能夠?qū)崿F(xiàn)人物兩側(cè)的奔跑,同時(shí)還能夠保障聲光效果,實(shí)現(xiàn)互動(dòng),具有非常大的震撼力,會(huì)在很大程度上促進(jìn)大眾參與的積極性。
2.4分析數(shù)字媒體中計(jì)算機(jī)視覺技術(shù)的應(yīng)用,保障數(shù)字媒體技術(shù)有效表現(xiàn)藝術(shù)
同時(shí)在實(shí)用藝術(shù)以及純藝術(shù)當(dāng)中,也會(huì)運(yùn)用到數(shù)字媒體,該技術(shù)能夠讓相對(duì)比較單純的個(gè)人視覺實(shí)現(xiàn)有效的創(chuàng)造,同時(shí)還能夠把藝術(shù)箱社會(huì)性視覺產(chǎn)品進(jìn)行轉(zhuǎn)化,并得到一定的經(jīng)濟(jì)效益。同時(shí),大眾能夠通過(guò)剪切以及拷貝等相關(guān)的方式來(lái)有效獲取視覺技術(shù),之后有效的轉(zhuǎn)化藝術(shù)資源,有效奠定了創(chuàng)作視覺藝術(shù)的基礎(chǔ)。現(xiàn)階段,大眾對(duì)于個(gè)性化以及獨(dú)特性有著逐漸提高的需求,在對(duì)相對(duì)比較獨(dú)特的視覺技術(shù)進(jìn)行追求時(shí),在一定程度上提高了評(píng)價(jià)視覺作品的標(biāo)準(zhǔn)。在數(shù)字媒體當(dāng)中運(yùn)用計(jì)算機(jī)視覺技術(shù),會(huì)在很大程度上提高大眾對(duì)美的享受,保障大眾能夠充分感受到舒適以及愉快的感覺,同時(shí)還能夠得到審美方面的評(píng)價(jià),在該過(guò)程當(dāng)中,不能夠參雜任何的因素,應(yīng)該讓計(jì)算機(jī)視覺因素僅僅對(duì)視覺美感以及視覺形式進(jìn)行充分的追求,可以有效體現(xiàn)藝術(shù)的本質(zhì)。同時(shí),數(shù)字媒體有著美方面的品格,有效結(jié)合計(jì)算機(jī)視覺藝術(shù),保障數(shù)字媒體藝術(shù)的美以及真。這個(gè)實(shí)際的運(yùn)用過(guò)程能夠有效提升審美方面的機(jī)制,更好的領(lǐng)悟視覺藝術(shù)當(dāng)中所存在的美。
3結(jié)語(yǔ)
綜上所述,在數(shù)字媒體當(dāng)中,計(jì)算機(jī)視覺技術(shù)的運(yùn)用,應(yīng)該有效結(jié)合圖像、動(dòng)畫、聲音以及文本等多個(gè)因素,在對(duì)語(yǔ)言表現(xiàn)的具體形式進(jìn)行一定的豐富時(shí),應(yīng)該讓作品具有更大的感染力。除此之外,還應(yīng)該保障視覺技術(shù)有何足夠的光聲效果,利用一定的互動(dòng),會(huì)具有非常大的震撼能力,積極促進(jìn)大眾的參與程度。還可以在很大程度上滿足大眾對(duì)于美方面的追求,進(jìn)而對(duì)其所具有的藝術(shù)價(jià)值進(jìn)行充分發(fā)揮,有效提升藝術(shù)所具有的人文價(jià)值。
計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺下圖像檢索技術(shù)分析
從某種角度來(lái)說(shuō),在計(jì)算機(jī)視覺領(lǐng)域,這類目標(biāo)圖像檢索的研究是具有一定的挑戰(zhàn)與現(xiàn)實(shí)意義。它以計(jì)算機(jī)模擬人的視覺為基礎(chǔ),對(duì)其中相關(guān)圖像的內(nèi)容予以描述。在此基礎(chǔ)上,以描述的特點(diǎn)為參照,在眾多圖像中尋找那些感興趣的目標(biāo)圖像。隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)不斷發(fā)展,它的應(yīng)用范圍逐漸擴(kuò)大。比如,網(wǎng)絡(luò)圖像檢索、醫(yī)學(xué)圖像的挖掘、不良圖像的過(guò)濾。但就當(dāng)下計(jì)算機(jī)視覺下目標(biāo)圖像檢索技術(shù)研究的現(xiàn)狀來(lái)看,并不樂(lè)觀,還有很長(zhǎng)的路要走。可見,對(duì)計(jì)算機(jī)視覺下的目標(biāo)圖像檢索技術(shù)予以分析是非常必要的。
1計(jì)算機(jī)視覺概述
1.1計(jì)算機(jī)視覺學(xué)概述
從某種意義上說(shuō),計(jì)算機(jī)視覺學(xué)是一門在20世紀(jì)60年代興起的新學(xué)科。它是一門邊緣學(xué)科,融入了很多學(xué)科的特點(diǎn),具有很強(qiáng)的工程性特征。比如,圖像處理、應(yīng)用數(shù)學(xué)、光電技術(shù)。換個(gè)角度來(lái)說(shuō),計(jì)算機(jī)視覺同屬于工程領(lǐng)域、科學(xué)領(lǐng)域。
1.2計(jì)算機(jī)視覺的應(yīng)用
計(jì)算機(jī)視覺的應(yīng)用能夠使計(jì)算機(jī)具有和人一樣的視覺功能。在生活和生產(chǎn)過(guò)程中,照片資料、視頻資料的處理是計(jì)算機(jī)視覺應(yīng)用的主要方面。比如,在航空事業(yè)方面,對(duì)衛(wèi)星照片的翻譯;在醫(yī)學(xué)領(lǐng)域中,主要用于輔助性方面的診斷;在工業(yè)生產(chǎn)方面,由于各種復(fù)雜因素的影響,計(jì)算機(jī)視覺在這方面的應(yīng)用顯得特別簡(jiǎn)單,有利于相關(guān)系統(tǒng)的實(shí)際構(gòu)成。
2目標(biāo)圖像檢索存在的問(wèn)題
從某種角度來(lái)說(shuō),目標(biāo)圖像檢索需要分為特征匹配、特征提取兩個(gè)方面。它們表達(dá)了不同的含義。對(duì)于特征提取來(lái)說(shuō),它是圖像進(jìn)行檢索的及時(shí)步,其提取結(jié)果會(huì)對(duì)進(jìn)一步的研究造成直接的影響。而對(duì)于特征匹配來(lái)說(shuō),其匹配的度會(huì)直接影響圖像檢索系統(tǒng)的返回結(jié)果。但在目標(biāo)圖像檢索完善的過(guò)程中,遇到一些問(wèn)題阻礙了這兩個(gè)方面的完善。因此,本文作者對(duì)其中的一些予以了相關(guān)的探討。
2.1環(huán)境因素不斷變化
對(duì)于目標(biāo)圖像來(lái)說(shuō),環(huán)境因素是影響其率的重要因素。同時(shí),在復(fù)雜混亂的環(huán)境中,由于受到眾多干擾物的影響,加上部分目標(biāo)圖像區(qū)域被遮蓋,致使目標(biāo)圖像信息不夠,使目標(biāo)物體特征的提取難度進(jìn)一步加大。
2.2圖像噪聲的影響
子為了更好地模仿生活中的圖像檢索,數(shù)據(jù)庫(kù)中的圖像也會(huì)隨之發(fā)生一系列的變化。比如,尺度、角度、光照。而其中圖像噪音的影響會(huì)使目標(biāo)物體的外觀發(fā)生對(duì)應(yīng)的變化。在此基礎(chǔ)上,嚴(yán)重降低了目標(biāo)圖像信息獲取的度。
2.3目標(biāo)圖像檢索訓(xùn)練數(shù)據(jù)的自動(dòng)標(biāo)注
由于處于網(wǎng)絡(luò)中的圖像資源信息過(guò)于繁多,需要采用手工的方式對(duì)它們進(jìn)行標(biāo)注。但這種方法非常浪費(fèi)時(shí)間,率也比較低。很顯然,這就需要目標(biāo)檢索圖像能夠具有自動(dòng)標(biāo)注的能力。實(shí)際上,圖像檢索方法過(guò)分依賴人工標(biāo)注信息。而這些信息很多收到來(lái)自各方面因素的影響。比如,認(rèn)識(shí)差異因素、個(gè)人經(jīng)驗(yàn)。以至于對(duì)圖像產(chǎn)生誤解。
3基于計(jì)算機(jī)視覺下的目標(biāo)圖像檢索技術(shù)
3.1以多尺度視覺為紐帶的目標(biāo)圖像檢索方法
該種目標(biāo)檢索技術(shù)的應(yīng)用主要是為了提高目標(biāo)圖像檢索的率,能夠?qū)崿F(xiàn)目標(biāo)圖像訓(xùn)練數(shù)據(jù)的自動(dòng)化標(biāo)注。該類技術(shù)主要是用于那些沒有遮擋,不需要進(jìn)行監(jiān)督的目標(biāo)圖像檢索方面。具體來(lái)說(shuō),它需要經(jīng)過(guò)一系列的訓(xùn)練。在訓(xùn)練的過(guò)程中,以統(tǒng)計(jì)學(xué)習(xí)為紐帶,對(duì)相應(yīng)多尺度的目標(biāo)檢測(cè)模型進(jìn)行適當(dāng)?shù)挠?xùn)練。在此基礎(chǔ)上,以該模型為基點(diǎn),對(duì)圖像中那些顯著性的區(qū)域進(jìn)行合理地提取。比如,該區(qū)域的亮度、顏色。,需要對(duì)用于該實(shí)驗(yàn)研究中的概率潛在語(yǔ)義分析模型進(jìn)行合理地利用。總之,利用這種檢索方法可以對(duì)圖像中那些顯著目標(biāo)所處的區(qū)域自動(dòng)進(jìn)行檢測(cè)。同時(shí),對(duì)其中目標(biāo)圖像的顯著性進(jìn)行合理地排序,能夠提高檢索引擎所返回圖像結(jié)果的度。
3.2以彩色LBP局部紋理特點(diǎn)為媒介的目標(biāo)圖像檢索方法
這種目標(biāo)圖像檢索方法能夠有效地解決圖像信息采集過(guò)程圖像噪聲以及其它相關(guān)因素對(duì)所提取紋理特征的影響,提高了圖像目標(biāo)的率。對(duì)于這種圖像目標(biāo)檢索方法來(lái)說(shuō),它把圖像彩色空間特征和簡(jiǎn)化的LBP特征有機(jī)地相融合。在此基礎(chǔ)上,該類方法增加了光照的不變特性,卻保留了LBP局部的旋轉(zhuǎn)特點(diǎn)。在提高圖像檢索速度方面,主要是利用原來(lái)的LBP特征來(lái)丟失其中的彩色信息。以此,使其中的特征維度能夠在一定程度上降低。同時(shí),這種目標(biāo)圖像檢索方法的應(yīng)用可以使對(duì)應(yīng)計(jì)算方法的難度得以降低,還能對(duì)角度等變化狀態(tài)下的目標(biāo)圖像進(jìn)行地識(shí)別以及檢索。
3.3以視覺一致性為橋梁的目標(biāo)圖像檢索方法
從某個(gè)角度來(lái)說(shuō),它的應(yīng)用主要是為了提高圖像搜索引擎的返回效果,使局部噪聲圖形具有更高的顯著性特征。一是:站在客觀的角度,對(duì)搜索引擎返回結(jié)果的目標(biāo)顯著圖予以的計(jì)算。此外,還要對(duì)其中的目標(biāo)顯著系數(shù)進(jìn)行適當(dāng)?shù)剡^(guò)濾。二是:以所有圖像為基點(diǎn),以顯著目標(biāo)為導(dǎo)向,采取視覺一致性的模式。三是:以視覺一致性為基礎(chǔ),對(duì)其中的不同目標(biāo)圖像信息進(jìn)行客觀地分類。這種以視覺一致性為核心的方法能夠有效地提高圖像檢索結(jié)果的率。更重要的是,在提高圖像搜索引擎檢索性能的同時(shí),能夠及時(shí)為用戶選出的圖像信息。而這些信息資源和用戶尋找的主題信息密切相關(guān)。
4結(jié)語(yǔ)
總而言之,在新時(shí)代下,基于計(jì)算機(jī)視覺下目標(biāo)圖像檢索技術(shù)的研究與實(shí)踐應(yīng)用有著非常深遠(yuǎn)的意義。這些檢索方法的應(yīng)用能夠有效地解決目標(biāo)圖像檢索存在的問(wèn)題。以此,使我國(guó)在該方面的研究不斷完善,更好地發(fā)揮自身的實(shí)踐價(jià)值。同時(shí),在信息大爆炸的時(shí)代,成為人們及時(shí)而有效獲取目標(biāo)圖像資源信息道路上重要的基石。,作者希望本文在豐富廣大讀者朋友們內(nèi)心世界的同時(shí),也能喚起他們對(duì)此的思考以及展望。
作者:?jiǎn)挝唬汉?诮?jīng)濟(jì)學(xué)院
計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺教學(xué)改革分析
人類從外界獲取的信息中70-80%來(lái)源于視覺,因此,使計(jì)算機(jī)具備人類視覺的功能具有巨大的應(yīng)用價(jià)值。近年來(lái),計(jì)算機(jī)視覺技術(shù)市場(chǎng)前景明朗,需求日趨廣泛,計(jì)算機(jī)視覺領(lǐng)域工程師人才供不應(yīng)求。在此背景下,國(guó)內(nèi)外高校大多都開設(shè)了這門課程,深受學(xué)生歡迎。傳統(tǒng)計(jì)算機(jī)視覺課程根據(jù)Marr理論框架,圍繞由2D圖像獲取3D信息的基礎(chǔ)理論展開教學(xué)。通常,計(jì)算機(jī)視覺的目標(biāo)設(shè)定為獲取3D場(chǎng)景的有用信息,如深度、結(jié)構(gòu)、運(yùn)動(dòng)、表面朝向等。經(jīng)過(guò)多年工程碩士及本科教育發(fā)現(xiàn),以工程應(yīng)用能力培養(yǎng)為目標(biāo)的工程師培養(yǎng)中,傳統(tǒng)計(jì)算機(jī)視覺教學(xué)中尚存在如下問(wèn)題:
(1)課程內(nèi)容方面:工程應(yīng)用價(jià)值較小的內(nèi)容居多;具備工程應(yīng)用價(jià)值的方法,如基于結(jié)構(gòu)光的3D信息獲取,在課程內(nèi)容中卻極少出現(xiàn)。
(2)課程定位方面:現(xiàn)有課程體系中未能體現(xiàn)近期研究成果,而掌握世界近期工程應(yīng)用成果是工程師的基本要求之一。
(3)教學(xué)形式方面:傳統(tǒng)計(jì)算機(jī)視覺課程側(cè)重基本原理,盡管范例教學(xué)被引入到課堂教學(xué)中,在一定程度上幫助學(xué)生理解,但工程師培養(yǎng)目標(biāo)是培養(yǎng)學(xué)生解決實(shí)際工程問(wèn)題的能力。針對(duì)工程師培養(yǎng)目標(biāo),以及目前計(jì)算機(jī)視覺課程中存在的問(wèn)題,本文提出工程應(yīng)用導(dǎo)向型的課程內(nèi)容、面向近期成果的課程定位、理論實(shí)例化與工程實(shí)踐化的教學(xué)形式,以培養(yǎng)具有扎實(shí)理論基礎(chǔ)及工程實(shí)踐能力的工程師。
1工程應(yīng)用導(dǎo)向型的課程內(nèi)容傳統(tǒng)計(jì)算機(jī)視覺課程圍繞Marr理論框架展開教學(xué),其中部分原理僅在理想狀態(tài)或若干假設(shè)下成立,不能直接運(yùn)用到工程實(shí)踐中。近年來(lái)已具備工程應(yīng)用基礎(chǔ)的原理及方法,在傳統(tǒng)課程內(nèi)容中較少出現(xiàn),如已在工業(yè)測(cè)量、視頻監(jiān)控、游戲娛樂(lè)等領(lǐng)域中應(yīng)用的主動(dòng)式三維數(shù)據(jù)獲取方法等。我們對(duì)工程應(yīng)用價(jià)值高的課程內(nèi)容,增加課時(shí),充分講解其原理及算法,并進(jìn)行工程實(shí)例分析;對(duì)工程應(yīng)用價(jià)值較低內(nèi)容,壓縮課時(shí),以介紹方法原理為主。例如,在教授3D信息獲取部分時(shí),課時(shí)主要投入到工程應(yīng)用價(jià)值較大的內(nèi)容,如立體視覺、運(yùn)動(dòng)恢復(fù)結(jié)構(gòu)、基于結(jié)構(gòu)光的3D信息獲取等;而對(duì)于基于陰影的景物恢復(fù)等缺乏應(yīng)用基礎(chǔ)的內(nèi)容主要介紹其基本原理,并引導(dǎo)學(xué)生進(jìn)行其工程應(yīng)用的可行性分析,培養(yǎng)學(xué)生縝密的思維習(xí)慣,訓(xùn)練學(xué)生辯證的分析能力。
2面向近期成果的課程定位計(jì)算機(jī)視覺近十年來(lái)發(fā)展迅速,新方法和新理論層出不窮,在現(xiàn)有課程體系中未能得以體現(xiàn)。跟進(jìn)世界近期成果是工程師的基本要求之一,因此計(jì)算機(jī)視覺課程定位應(yīng)當(dāng)面向國(guó)際近期成果。為實(shí)現(xiàn)這一目標(biāo),我們主要從以下兩方面入手。
(1)選用涵蓋近期成果的教材。我們?cè)诮虒W(xué)中加入國(guó)際近期科研成果及應(yīng)用范例,在教材選取上采用2010年RichardSzeliski教授所著《Computervision:algorithmsandapplications》作為參考教材。該書是RichardSzeliski教授在多年MIT執(zhí)教經(jīng)驗(yàn)及微軟多年計(jì)算機(jī)視覺領(lǐng)域工作經(jīng)驗(yàn)基礎(chǔ)上所著,涵蓋計(jì)算機(jī)視覺領(lǐng)域的主要科研成果及應(yīng)用范例,參考文獻(xiàn)近期引用至2010年。這是目前近期的計(jì)算機(jī)視覺著作之一,條理清晰,深入淺出,特點(diǎn)在于對(duì)計(jì)算機(jī)視覺的基本原理介紹非常詳盡,算法應(yīng)用緊跟國(guó)際前沿。
(2)強(qiáng)化學(xué)生調(diào)研及自學(xué)能力。“授之以魚”,不如“授之以漁”。在教授學(xué)生的同時(shí),更重要的是培養(yǎng)學(xué)生調(diào)研、跟蹤、學(xué)習(xí)并分析國(guó)際近期科研及工程應(yīng)用成果的能力。為強(qiáng)化學(xué)生的知識(shí)結(jié)構(gòu),培養(yǎng)學(xué)生跟蹤國(guó)際前沿的能力,我們?cè)诮虒W(xué)中加入10%的課外學(xué)時(shí),指導(dǎo)每位學(xué)生完成最近三年本領(lǐng)域的國(guó)際近期文獻(xiàn)調(diào)研及工程應(yīng)用新技術(shù)調(diào)研,并撰寫相關(guān)調(diào)研論文。同時(shí),設(shè)置2學(xué)時(shí)課內(nèi)學(xué)時(shí),讓每位學(xué)生介紹調(diào)研成果,并進(jìn)行課堂討論。在調(diào)研基礎(chǔ)上,選擇相關(guān)算法進(jìn)行了實(shí)驗(yàn)證明,進(jìn)一步強(qiáng)化學(xué)習(xí)成果。實(shí)踐證明,由于學(xué)生能夠根據(jù)自己的興趣,選擇本領(lǐng)域感興趣的課題進(jìn)行深入調(diào)研,極大地調(diào)動(dòng)了學(xué)生的積極性,強(qiáng)化了學(xué)生調(diào)研、跟蹤、學(xué)習(xí)并分析國(guó)際近期科研及工程應(yīng)用成果的能力。
3工程實(shí)踐化的教學(xué)形式我們?cè)诮虒W(xué)中提出工程實(shí)踐化的教學(xué)形式,即以人類視覺功能為背景,由相應(yīng)工程實(shí)例引出相關(guān)理論,并最終將理論運(yùn)用到工程實(shí)例中的算法和方法傳授給學(xué)生。
(1)工程實(shí)例化的理論講解。在工程實(shí)例的系統(tǒng)功能基礎(chǔ)上,提出教學(xué)內(nèi)容的命題;在關(guān)鍵技術(shù)及難點(diǎn)基礎(chǔ)上,講解基本原理及方法。在教學(xué)過(guò)程中,不斷穿插眾所周知的實(shí)例。例如,講解攝像機(jī)模型時(shí),由“近大遠(yuǎn)小”的原理,解釋青少年流行拍攝的“大頭照”,從上而下俯拍容易拍出視覺更美的“錐子臉”;由過(guò)近拍照產(chǎn)生面部變形,解釋鏡頭原理及畸變現(xiàn)象。科學(xué)研究發(fā)現(xiàn),大學(xué)生課堂注意力平均為10-15分鐘。課堂教學(xué)質(zhì)量的優(yōu)劣關(guān)鍵取決于教學(xué)效率,因此,抓住學(xué)生注意力至關(guān)重要。經(jīng)過(guò)我們的教學(xué)實(shí)踐發(fā)現(xiàn),大量學(xué)生熟悉并感興趣的實(shí)例引入后,學(xué)生的注意力會(huì)即時(shí)迅速提高,興趣大大提升。
(2)理論的工程實(shí)踐化。工程師培養(yǎng)的關(guān)鍵是利用所學(xué)算法與方法解決實(shí)際工程問(wèn)題的能力。計(jì)算機(jī)視覺課程中介紹的方法大部分基于理想狀況的假設(shè)。在工程實(shí)踐中,生搬硬套將出現(xiàn)錯(cuò)誤。因此,培養(yǎng)學(xué)生將理論進(jìn)行工程實(shí)踐,是工程師培養(yǎng)中必不可少的一個(gè)環(huán)節(jié)。該過(guò)程不僅可以鍛煉學(xué)生的動(dòng)手能力,更重要的是引導(dǎo)學(xué)生認(rèn)識(shí)到理論知識(shí)與工程應(yīng)用的距離,提煉并解決理論結(jié)合實(shí)際時(shí)需解決的關(guān)鍵問(wèn)題。同時(shí),工程應(yīng)用中遇到的問(wèn)題,往往不是一門課程內(nèi)的知識(shí)可以解決的,需協(xié)同多門課程知識(shí)。這樣,可培養(yǎng)學(xué)生通匯貫通課程及相關(guān)領(lǐng)域知識(shí),解決問(wèn)題的能力。我們依托計(jì)算機(jī)視覺與模式識(shí)別實(shí)驗(yàn)室多年來(lái)在該領(lǐng)域的研究基礎(chǔ)與實(shí)驗(yàn)條件,對(duì)學(xué)生的工程實(shí)踐能力進(jìn)行配套培養(yǎng)。主要包括兩個(gè)策略:利用10%的課內(nèi)學(xué)時(shí),選取相關(guān)經(jīng)典工程實(shí)踐實(shí)驗(yàn),指導(dǎo)學(xué)生獨(dú)立完成;利用10%的課外學(xué)時(shí),指導(dǎo)學(xué)生調(diào)研近期科研成果,指導(dǎo)學(xué)生分組完成仿真實(shí)驗(yàn)。實(shí)踐證明,該過(guò)程加深了學(xué)生對(duì)理論的理解,大大提高了學(xué)生的成就感、學(xué)習(xí)興趣及工程實(shí)踐能力。4結(jié)論本文提出的計(jì)算機(jī)視覺課程教學(xué)方法是經(jīng)過(guò)多年工程型碩士及本科教學(xué)實(shí)踐探索的經(jīng)驗(yàn)所得,并在三個(gè)班次進(jìn)行了教學(xué)實(shí)踐。工程應(yīng)用導(dǎo)向型的課程內(nèi)容緊貼實(shí)際,所學(xué)即所用,極大地增強(qiáng)了學(xué)生的學(xué)習(xí)興趣及動(dòng)手樂(lè)趣;面向近期成果的課程定位緊跟計(jì)算機(jī)視覺的技術(shù)發(fā)展,培養(yǎng)學(xué)生調(diào)研、跟蹤、學(xué)習(xí)并分析國(guó)際近期科研及工程應(yīng)用成果,開闊學(xué)生眼界和思路;理論實(shí)例化與工程實(shí)踐化的教學(xué)形式,注重理論聯(lián)系實(shí)際的能力培養(yǎng)。教學(xué)實(shí)踐表明,上述方法對(duì)培養(yǎng)具有扎實(shí)理論基礎(chǔ)、理論結(jié)合實(shí)踐的工程實(shí)踐能力的工程師,起到了有別于傳統(tǒng)計(jì)算機(jī)視覺教學(xué)的良好效果。
計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺在交通領(lǐng)域的運(yùn)用
近年來(lái),隨著科技水平的提高,計(jì)算機(jī)視覺技術(shù)逐漸被人們熟知并廣泛應(yīng)用。相較于其他傳感器來(lái)說(shuō),視覺能獲得更多的信息。因此,在我國(guó)交通領(lǐng)域中,也對(duì)計(jì)算機(jī)視覺技術(shù)進(jìn)行研究完善,將計(jì)算機(jī)視覺技術(shù)應(yīng)用在交通領(lǐng)域各個(gè)方面中,并取得了顯著的成效。
1計(jì)算機(jī)視覺的概述及基本體系結(jié)構(gòu)
1.1計(jì)算機(jī)視覺概述
通過(guò)使用計(jì)算機(jī)和相關(guān)設(shè)備,對(duì)生物視覺進(jìn)行模擬的方式,就是計(jì)算機(jī)視覺。對(duì)采集到的圖片或視頻進(jìn)行相應(yīng)的技術(shù)處理,從而獲得相應(yīng)的三維信息場(chǎng)景,是計(jì)算機(jī)視覺的主要任務(wù)。計(jì)算機(jī)視覺是一門學(xué)問(wèn),它就如何通過(guò)計(jì)算機(jī)和照相機(jī)的運(yùn)用,使人們獲得被拍攝對(duì)象的數(shù)據(jù)與信息所需等問(wèn)題進(jìn)行研究。簡(jiǎn)單的說(shuō),就是讓計(jì)算機(jī)通過(guò)人們給其安裝上的“大腦”和“眼睛”,對(duì)周圍環(huán)境進(jìn)行感知。計(jì)算機(jī)視覺是一門綜合性學(xué)科,在各個(gè)領(lǐng)域都有所作為,已經(jīng)吸引了各個(gè)領(lǐng)域的研究者對(duì)其研究。同時(shí),計(jì)算機(jī)視覺也是科學(xué)領(lǐng)域中一個(gè)具有重要挑戰(zhàn)性的研究。
1.2計(jì)算機(jī)視覺領(lǐng)域基本體系結(jié)構(gòu)
提出及時(shí)個(gè)較為完善的視覺系統(tǒng)框架的是Marr,他從信息處理系統(tǒng)角度出發(fā),結(jié)合圖像處理、心理物理學(xué)等多領(lǐng)域的研究成果,提出被計(jì)算機(jī)視覺工作者基本接受的計(jì)算機(jī)視覺系統(tǒng)框架。在此基礎(chǔ)上,研究者們針對(duì)視覺系統(tǒng)框架的各個(gè)角度、各個(gè)階段、各個(gè)功能進(jìn)行分析研究,得出了計(jì)算機(jī)視覺系統(tǒng)的基本體系結(jié)構(gòu),如圖1。
2計(jì)算機(jī)視覺在交通領(lǐng)域的應(yīng)用
2.1牌照識(shí)別
車輛的身份是車輛牌照。在檢測(cè)違規(guī)車輛、稽查被盜車輛和管理停車場(chǎng)工作中,車輛牌照的有效識(shí)別與檢測(cè)具有重要的作用和應(yīng)用價(jià)值。然而在實(shí)際應(yīng)用工作中,雖然車牌識(shí)別技術(shù)相對(duì)成熟,但是由于受到拍攝角度、光照、天氣等因素的影響,車牌識(shí)別技術(shù)仍需改善。車牌定位技術(shù)、車牌字符識(shí)別技術(shù)和車牌字符分割技術(shù)是組成車牌識(shí)別技術(shù)的重要部分。
2.2車輛檢測(cè)
目前,城市交通路口處紅綠燈的間隔時(shí)間是固定不變的,但是受交通路口的位置不同、時(shí)間不同的影響,每個(gè)交通路口的交通流量也是持續(xù)變化的。此外,對(duì)于某些交通區(qū)域來(lái)說(shuō),公共資源的配備,比如交通警察、交通車輛的數(shù)量是有限的。如果能根據(jù)計(jì)算機(jī)視覺技術(shù),對(duì)交通路口的不同時(shí)間、不同位置的交通情況進(jìn)行分析計(jì)算,并對(duì)交通流量進(jìn)行預(yù)測(cè),有利于為交通警察縮短出警時(shí)間、為交通路口的紅綠燈根據(jù)實(shí)際情況設(shè)置動(dòng)態(tài)變化等技術(shù)提供支持。
2.3統(tǒng)計(jì)公交乘客人數(shù)
城市公共交通的核心內(nèi)容是城市公交調(diào)度問(wèn)題,一個(gè)城市如何合理的解決公交調(diào)度問(wèn)題,是緩解城市運(yùn)力和運(yùn)量矛盾,緩解城市交通緊張的有效措施。城市公交調(diào)度問(wèn)題,為公交公司與乘客的平衡利益,為公交公司的經(jīng)濟(jì)利益和社會(huì)效益的提高做出了巨大的貢獻(xiàn)。由于在不同的地域、不同的時(shí)間,公交客流會(huì)存在不均衡性,高峰時(shí)段的公交乘客過(guò)多,平峰時(shí)段的公交乘客過(guò)少,造成了公交調(diào)度不均衡問(wèn)題,使有限資源浪費(fèi)嚴(yán)重。在計(jì)算機(jī)視覺智能公交系統(tǒng)中,自動(dòng)乘客計(jì)數(shù)技術(shù)是其關(guān)鍵技術(shù)。自動(dòng)乘客計(jì)數(shù)技術(shù),是對(duì)乘客上下車的時(shí)間和地點(diǎn)自動(dòng)收集的最有效的技術(shù)之一。根據(jù)其收集到的數(shù)據(jù),從時(shí)間和地點(diǎn)兩方面對(duì)客流分析,為城市公交調(diào)度進(jìn)行合理的安排。
2.4對(duì)車道偏離程度和駕駛員工作狀態(tài)判斷
交通事故的發(fā)生率隨著車輛數(shù)量的增加而增加。引發(fā)交通事故的重要因素之一就是駕駛員疲勞駕駛。據(jù)相關(guān)數(shù)據(jù)顯示,因車道偏離導(dǎo)致的交通事故在40%以上。其中,駕駛員的疲勞駕駛就是導(dǎo)致車道偏離的主要原因。針對(duì)此種現(xiàn)象,為減少交通事故的發(fā)生,計(jì)算機(jī)視覺中車道偏離預(yù)警系統(tǒng)被研究開發(fā)并被廣泛應(yīng)用。針對(duì)駕駛員眨眼頻率,利用計(jì)算機(jī)視覺對(duì)駕駛員面部進(jìn)行圖像處理和分析,再根據(jù)疲勞駕駛關(guān)注度與眨眼頻率的關(guān)系,對(duì)駕駛員的工作狀態(tài)進(jìn)行判斷。此外,根據(jù)道路識(shí)別技術(shù),對(duì)車輛行駛狀態(tài)進(jìn)行檢測(cè),也是判斷駕駛員工作狀態(tài)的方法之一。這兩種方法,是目前基于計(jì)算機(jī)視覺的基礎(chǔ)上,檢測(cè)駕駛員疲勞狀態(tài)的有效方法。
2.5路面破損檢測(cè)
最常見的路面損壞方式就是裂縫。利用計(jì)算機(jī)視覺,及時(shí)發(fā)現(xiàn)路面破損情況,并在其裂縫程度嚴(yán)重之前進(jìn)行修補(bǔ),有利于節(jié)省維護(hù)成本,也避免出現(xiàn)路面坍塌,車輛凹陷的情況發(fā)生。利用計(jì)算機(jī)視覺進(jìn)行路面檢測(cè),相較于之前人工視覺檢測(cè)相比,有效提高了視覺檢測(cè)的效率,增強(qiáng)了自動(dòng)化程度,提高了安全性,為市民的出行安全帶來(lái)了更高保障。
3結(jié)論
本文從計(jì)算機(jī)視覺的概述,及計(jì)算機(jī)視覺基本體系結(jié)構(gòu),和計(jì)算機(jī)視覺在交通領(lǐng)域中的應(yīng)用三面進(jìn)行分析,可見計(jì)算機(jī)視覺在交通領(lǐng)域中的廣泛應(yīng)用,在交通領(lǐng)域中應(yīng)用的有效性、顯著性,以此可得計(jì)算機(jī)視覺在現(xiàn)展過(guò)程中的重要性。隨著計(jì)算機(jī)視覺技術(shù)的越來(lái)越成熟,交通領(lǐng)域的檢測(cè)管理一定會(huì)加嚴(yán)格,更加安全。
作者:夏棟 單位:同濟(jì)大學(xué)軟件學(xué)院
計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺交互技術(shù)在企業(yè)日常工作中的應(yīng)用
摘要:在現(xiàn)代企業(yè)的新產(chǎn)品開發(fā),市場(chǎng)調(diào)研數(shù)據(jù)分析報(bào)告等集體智力活動(dòng)當(dāng)中需要很多的可視化的展示與溝通工作。目前很多情況下企業(yè)往往是采用傳統(tǒng)的PPT方式進(jìn)行,這些PPT中大部分動(dòng)畫都是單向無(wú)實(shí)時(shí)交互的。隨著現(xiàn)代計(jì)算機(jī)視覺識(shí)別和交互技術(shù)的發(fā)展,可以設(shè)計(jì)更好的交互展示系統(tǒng),幫助企業(yè)改善復(fù)雜問(wèn)題的溝通。
關(guān)鍵詞:計(jì)算機(jī)技術(shù);視覺識(shí)別技術(shù);交互技術(shù);會(huì)議展示;智能辦公環(huán)境
在日常的企業(yè)辦公管理活動(dòng)中,有很多時(shí)候需要可視化地展示企業(yè)市場(chǎng)計(jì)劃、新產(chǎn)品設(shè)計(jì)、數(shù)據(jù)分析報(bào)告等。盡管這些活動(dòng)所需要的材料在事前可以經(jīng)由辦公自動(dòng)化軟件處理,但處理結(jié)果卻很大程度上只能由靜態(tài)的PPT展示和說(shuō)明。但很多時(shí)候,這些展示和說(shuō)明往往是多個(gè)部門不同專業(yè)背景的人員參與,于是展示材料制作的水平和質(zhì)量就很大程度上影響到了參與者對(duì)所展示內(nèi)容的理解和吸收程度。很多復(fù)雜的問(wèn)題或者設(shè)計(jì)的展示,如果能采用互動(dòng)交互的方式展示,在很大程度上能夠幫助問(wèn)題討論的參與者對(duì)所討論問(wèn)題更好的理解。這一點(diǎn)在常規(guī)的教育過(guò)程中已經(jīng)獲得了充分的證實(shí),相關(guān)的數(shù)據(jù)和結(jié)果可以從多媒體教學(xué)的優(yōu)勢(shì)的相關(guān)研究中得到。同樣,企業(yè)中很多方案的討論,數(shù)據(jù)分析報(bào)告的說(shuō)明其實(shí)對(duì)于企業(yè)而言也是一個(gè)方案設(shè)計(jì)者或數(shù)據(jù)研究分析者對(duì)相關(guān)人員類似教學(xué)的過(guò)程。采用現(xiàn)有企業(yè)常規(guī)會(huì)議設(shè)備諸如投影儀、普通筆記本電腦、電腦攝像頭配合相應(yīng)的計(jì)算機(jī)視覺識(shí)別程序,我們可以將交互的投影演示引入到企業(yè)日常的展示討論活動(dòng)中,增強(qiáng)溝通效果,提高工作效率,并且在技術(shù)上同樣的識(shí)別交互的程序配合上相應(yīng)的員工面部特征的數(shù)據(jù)庫(kù),還能擴(kuò)展延伸到考勤或門禁系統(tǒng)中提供更加智能化的辦公環(huán)境。對(duì)于以展示溝通為主的教育培訓(xùn)企業(yè),通過(guò)配合一般人臉數(shù)據(jù)特征,可以通過(guò)攝像頭捕捉現(xiàn)場(chǎng)視頻并識(shí)別其中人臉識(shí)別,記錄現(xiàn)場(chǎng)關(guān)注展示內(nèi)容的人員的數(shù)量,作為日后教學(xué)效果的自然客觀的評(píng)估參考。
1目前辦公信息化中存在的問(wèn)題
1.1會(huì)議演示文稿展示時(shí)多人交互型差
目前主流的演示文稿制作及展示軟件主要大多都集成在套裝的辦公軟件中,其中主要常見的種類分別是MicrosoftOffice系列中的PowerPoint、MacOS系統(tǒng)下的KeyNote、基于Linux操作系統(tǒng)的Openoffice中的Impress。它們主要的功能都是對(duì)輸入的文字、圖片聲音等多媒體進(jìn)行編輯制作生成電腦上播放的多媒體幻燈片,盡管它們都具有強(qiáng)大的多媒體數(shù)據(jù)的處理能力,但最終制作的多媒體幻燈片在演示時(shí)都是“單向交互”的,即由播放者播放,而其中的內(nèi)容及動(dòng)畫按預(yù)先設(shè)計(jì)好的模式顯示。如果使用Adobe公司的Captivate或Authware這樣的多媒體交互制作軟件則會(huì)需要有專人進(jìn)行操作,浪費(fèi)大量的時(shí)間和精力,但如果是配置專門的多點(diǎn)觸摸屏幕,則一來(lái)屏幕尺寸有所限制,二來(lái)費(fèi)用相對(duì)較高容易造成設(shè)備的浪費(fèi)。
1.2傳統(tǒng)辦公考勤與門禁系統(tǒng)的弱勢(shì)
目前企業(yè)常規(guī)的門禁系統(tǒng)與日常考勤系統(tǒng)往往是分離的,兩個(gè)系統(tǒng)使用了各自獨(dú)立的軟硬件環(huán)境,其中門禁系統(tǒng)使用的是攝像監(jiān)控設(shè)備采集信息并通過(guò)專人24小時(shí)值班,其主要職能僅僅是監(jiān)控辦公環(huán)境的人員進(jìn)出并記錄下相應(yīng)的影像資料。而企業(yè)日常的考勤系統(tǒng)則要么采用人工簽到的方式,要么采用人工打卡或者指紋打卡方式。如果采用打卡方式管理則需要添置專門的打卡機(jī),這些打卡機(jī)多數(shù)是獨(dú)立工作,對(duì)于員工的考勤則需要人工根據(jù)卡片記錄情況統(tǒng)計(jì)。無(wú)論是員工自身打卡或者是統(tǒng)計(jì)考勤都是人工完成,有時(shí)還會(huì)出現(xiàn)錯(cuò)誤和疏漏,同時(shí)主要的問(wèn)題還在于容易出現(xiàn)代人打卡等作假的情況。所以,在傳統(tǒng)的辦公考勤與門禁系統(tǒng)獨(dú)立的情況下,兩個(gè)系統(tǒng)各自記錄各自的相關(guān)數(shù)據(jù),同時(shí)投入兩套不同的軟硬件環(huán)境,有時(shí)這樣的辦公環(huán)境的信息化反而沒有給人員帶來(lái)便利,而是增加一項(xiàng)打卡簽到的日常任務(wù)。
2對(duì)存在的部分問(wèn)題的分析和討論
2.1傳統(tǒng)演示設(shè)備缺乏交互型功能
由于很長(zhǎng)一段時(shí)間硬件以及軟件的條件約束,電腦的鍵盤、鼠標(biāo)完成了95%以上的數(shù)據(jù)輸入工作,單一顯示功能的顯示器投影儀也成了最主要的信息輸出設(shè)備。所以常規(guī)軟件設(shè)計(jì)和開發(fā)時(shí)都是把鍵盤、鼠標(biāo)、顯示器/投影儀的輸入輸出組合當(dāng)做幾乎所有使用情況下的模式。但隨著觸摸屏與多點(diǎn)觸控硬件的出現(xiàn),多點(diǎn)觸控、屏幕的直接交互輸入輸出操作成了未來(lái)發(fā)展的一個(gè)趨勢(shì),并且相對(duì)普通鼠標(biāo)和單一顯示功能的顯示器用戶交互體驗(yàn)明顯提升,人機(jī)交互界面更友好直觀。但是對(duì)于普通辦公中使用的投影儀,由于其投影的目標(biāo)位置情況多樣,如果一體化的設(shè)計(jì)制造具有交互功能的互動(dòng)投影儀其成本要比普通投影儀更高,對(duì)于解決互動(dòng)操作的問(wèn)題經(jīng)濟(jì)上不是的。而大面積的多點(diǎn)觸控屏幕由于設(shè)備體積和重量的因素?zé)o法在需要靈活移動(dòng)的新產(chǎn)品推廣談判等活動(dòng)中使用,如果只是企業(yè)自身辦公環(huán)境中做普通會(huì)議展示的效果改進(jìn),其投入產(chǎn)出的效率也不理想。
2.2基于傳統(tǒng)輸入輸出設(shè)備的開發(fā)
由于長(zhǎng)期以來(lái)人機(jī)交互都是以鼠標(biāo)鍵盤為主,所以絕大多數(shù)程序開發(fā)設(shè)計(jì)都只考慮這種單一的輸入方式。但對(duì)于目前多媒體數(shù)據(jù)增多的趨勢(shì),這樣傳統(tǒng)的輸入輸出模式就存在著很多弊端,其中最明顯的是對(duì)于多媒體數(shù)據(jù)的采集就需要單獨(dú)使用設(shè)備,采集后再人工處理。而為了簡(jiǎn)化系統(tǒng)設(shè)計(jì)的復(fù)雜度,很多管理信息系統(tǒng)的數(shù)據(jù)采集和錄入主要基于鍵盤鼠標(biāo)的錄入,如果出現(xiàn)非鍵盤鼠標(biāo)錄入的數(shù)據(jù)則被要求人工進(jìn)行數(shù)據(jù)格式的轉(zhuǎn)換,所以從一個(gè)側(cè)面也反映出一些企業(yè)排斥信息化,因?yàn)樵編?lái)效率提升與管理便利的信息系統(tǒng),反而由于一些數(shù)據(jù)格式的錄入要求增加了人工勞動(dòng)。如果直接使用現(xiàn)實(shí)當(dāng)中的多媒體類的數(shù)據(jù)則系統(tǒng)又缺少相應(yīng)轉(zhuǎn)換的功能。因?yàn)橄到y(tǒng)在考慮使用鍵盤鼠標(biāo)錄入采集數(shù)據(jù)時(shí)已經(jīng)默認(rèn)了操作者來(lái)完成數(shù)據(jù)錄入前的標(biāo)準(zhǔn)化工作。但是實(shí)際上隨著現(xiàn)代計(jì)算機(jī)視覺以及人工智能、模式識(shí)別技術(shù)的發(fā)展和完善,過(guò)去無(wú)法識(shí)別的原始多媒體數(shù)據(jù)現(xiàn)在也可以由計(jì)算機(jī)識(shí)別并進(jìn)行標(biāo)準(zhǔn)化的處理。
3運(yùn)用計(jì)算機(jī)視覺技術(shù)改善人機(jī)交互
3.1低分辨率識(shí)別情況下改善會(huì)議演示交互效果
采用現(xiàn)代的計(jì)算機(jī)影像處理技術(shù)和方法,可以用普通的圖像采集設(shè)備配合程序識(shí)別影像當(dāng)中的特定顏色區(qū)域的移動(dòng)軌跡,并對(duì)軌跡做出判斷實(shí)現(xiàn)與計(jì)算機(jī)的交互。由于該識(shí)別只是需要識(shí)別圖像中的特定顏色的區(qū)域的運(yùn)動(dòng),而非具體的形狀與細(xì)節(jié),所以識(shí)別的難度相對(duì)不大,可以運(yùn)用在會(huì)議的展示環(huán)境下,通過(guò)定位確定普通投影區(qū)域與特定顏色區(qū)域的位置關(guān)系,并通過(guò)圖形圖像的投影與變形運(yùn)算,實(shí)現(xiàn)人與普通投影的交互。在環(huán)境背景比較清晰,圖像采集設(shè)備分辨率與色彩分辨比較靈敏的情況下還能更進(jìn)一步對(duì)人體膚色和手的幾何特征進(jìn)行識(shí)別,實(shí)現(xiàn)更加自然良好的人機(jī)互動(dòng)交互,并且還能引入人工智能的模式識(shí)別算法,實(shí)現(xiàn)多人的互動(dòng)交互,從而大大改善互動(dòng)展示效果,實(shí)現(xiàn)更加人性化有效的溝通。特別在教育培訓(xùn)行業(yè),在現(xiàn)有普通硬件條件下能夠?qū)崿F(xiàn)更加生動(dòng)的教學(xué)講解演示,提高學(xué)生的課堂體驗(yàn)激發(fā)更多興趣,改善教學(xué)效果。
3.2運(yùn)用計(jì)算機(jī)視覺與模式識(shí)別技術(shù)整合企業(yè)門禁與考勤系統(tǒng)
應(yīng)用計(jì)算機(jī)視覺技術(shù)配合相對(duì)高分辨率的識(shí)別與人像數(shù)據(jù)庫(kù),企業(yè)可以采用現(xiàn)有的門禁系統(tǒng)的硬件設(shè)備配合相應(yīng)的軟件實(shí)現(xiàn)門禁與考勤系統(tǒng)的整合,以此提高企業(yè)辦公環(huán)境的智能化人性化的效果,并對(duì)員工進(jìn)行更加精細(xì)化的管理。重要的是,通過(guò)人機(jī)接口的改進(jìn)改變以往服務(wù)信息系統(tǒng)的面貌,讓人在自然的環(huán)境下工作提高系統(tǒng)的人性化程度。同時(shí)整合門禁與考勤系統(tǒng)可以通過(guò)識(shí)別企業(yè)內(nèi)部員工與外來(lái)人員加強(qiáng)辦公環(huán)境的管理,而且在硬件上可以利用現(xiàn)有的設(shè)備,軟件方面可以與前面提到的交互演示系統(tǒng)共用相同的圖形圖像處理內(nèi)核,減少代碼的冗余降低系統(tǒng)復(fù)雜度提高性。就目前的人像識(shí)別技術(shù)而言,已經(jīng)在個(gè)人電腦的安全保護(hù)上得到了應(yīng)用,所以在技術(shù)上是可行的,并且也有了實(shí)際應(yīng)用的例子。將該技術(shù)移植到普通的門禁管理系統(tǒng)與考勤系統(tǒng)中,只需要解決接口的數(shù)據(jù)交換就能實(shí)現(xiàn),并且隨著現(xiàn)代企業(yè)辦公環(huán)境的要求,應(yīng)用該技術(shù)能大大提高企業(yè)的辦公環(huán)境的智能化程度,并且通過(guò)門禁系統(tǒng)提取的企業(yè)員工考勤信息更加自然和真實(shí),能夠更加地掌握和管理企業(yè)員工的日常工作情況提高管理精度。
3.3具體實(shí)現(xiàn)方法與原理
為了能充分利用企業(yè)現(xiàn)有的硬件設(shè)備,并使得附加的程序簡(jiǎn)單化,這里針對(duì)類似會(huì)議互動(dòng)展示這樣不需要細(xì)節(jié)識(shí)別的情況采用的是顏色識(shí)別的方法,即統(tǒng)計(jì)場(chǎng)景中的圖像直方圖,然后探測(cè)直方圖上的變化,由于特定顏色的待識(shí)別區(qū)域的引入可以對(duì)整體直方圖的特定區(qū)域產(chǎn)生峰值的變化,并且通過(guò)反向的直方圖運(yùn)算又可以確定特定區(qū)域的位置。而直方圖的運(yùn)算屬于比較簡(jiǎn)單的圖像運(yùn)算處理所以能夠在很多圖像處理的開發(fā)工具中直接找到。并且對(duì)于細(xì)節(jié)識(shí)別要求比較高的人像的模式識(shí)別,采用以上的運(yùn)算也能縮小待檢測(cè)區(qū)域的大小,提高識(shí)別效率,并且人的面部特征采用色識(shí)別也能很快找到特征點(diǎn)(眼睛、鼻孔、嘴唇、頭發(fā)以及頭像邊緣)。在前面通過(guò)色彩識(shí)別找到的檢測(cè)區(qū)域中,識(shí)別出特征點(diǎn),并測(cè)量特征點(diǎn)的位置關(guān)系比例,進(jìn)而在和數(shù)據(jù)庫(kù)中數(shù)據(jù)對(duì)比模式匹配找到最終結(jié)果。
4結(jié)語(yǔ)
在越南河內(nèi)的機(jī)場(chǎng),為了使乘客能在等待航班時(shí)有比較輕松的環(huán)境,在旅客的候機(jī)大廳專門安放了一臺(tái)具有互動(dòng)功能的投影儀,并將互動(dòng)內(nèi)容投影在地面,乘客可以在候機(jī)時(shí)與地面上的互動(dòng)投影交互,緩解候機(jī)帶來(lái)的單調(diào)乏味感。同樣我們可以把它引入到日常企業(yè)辦公會(huì)議或者是培訓(xùn)教育類企業(yè)的日常教學(xué)中,運(yùn)用現(xiàn)有的投影屏幕和現(xiàn)有的設(shè)備實(shí)現(xiàn)多人的在投影屏幕上的互動(dòng)交互討論。而人像識(shí)別系統(tǒng)在單機(jī)上的應(yīng)用也在很多商用筆記本電腦上得到了應(yīng)用,在一些科研院所和高科技企業(yè)人像識(shí)別的門禁系統(tǒng)也被應(yīng)用到了辦公環(huán)境當(dāng)中,提高了辦公環(huán)境的智能化程度;將人像識(shí)別技術(shù)結(jié)合考勤系統(tǒng)則在教育行業(yè)能夠?qū)崿F(xiàn)更為方便的考勤管理防止目前比較嚴(yán)重的代簽逃課等情況的發(fā)生。隨著現(xiàn)在對(duì)數(shù)據(jù)挖掘技術(shù)的研究,從日常情況采集到的數(shù)據(jù)積累到一定程度還能為今后分析員工/學(xué)生行為做出數(shù)據(jù)的積累。這里所討論和解決的問(wèn)題主要只是集中在人機(jī)交互界面的一些改進(jìn),其實(shí)對(duì)于IT技術(shù)而言這只是一小部分,對(duì)于企業(yè)而言需要使用IT技術(shù)真正提高企業(yè)的工作效率還需要其他很多方面的配合和集成。
計(jì)算機(jī)視覺論文:基于計(jì)算機(jī)視覺的植物黑腐病病斑分析
摘要:給出一種基于圖像處理和神經(jīng)網(wǎng)絡(luò)技術(shù)進(jìn)行植物黑腐病病斑分析的方法,即利用圖像處理技術(shù)提取病斑的幾何特征和顏色特征,其中幾何特征根據(jù)病斑形狀提取,并基于HSV空間提取病斑顏色矩結(jié)合紅綠顏色特征作為病斑的顏色特征,利用神經(jīng)網(wǎng)絡(luò)加以識(shí)別,從而判斷病斑所處的生長(zhǎng)周期?給出系統(tǒng)的總體設(shè)計(jì)和實(shí)現(xiàn)方案,研究結(jié)果表明,該系統(tǒng)獲得了較為理想的檢測(cè)效果?這一思路為植物病害檢測(cè)和分析提供一種新的方法?
關(guān)鍵詞:計(jì)算機(jī)視覺;神經(jīng)網(wǎng)絡(luò);病斑分析
1引言
基于計(jì)算機(jī)視覺的植物黑腐病病斑的檢測(cè)與分析的研究?jī)?nèi)容和目標(biāo)是提取植物葉片及黑腐病病斑的特征,分類并確定病害程度?十字花科蔬菜黑腐病(Xanthomonas campestris pv.campestris (Pammel) Dowson)俗稱“半邊癱”,是蔬菜生產(chǎn)重的主要病害之一[1]?它是一種細(xì)菌引起的病害,癥狀是引起維管束壞死變黑?細(xì)菌從葉緣入侵后,產(chǎn)生玉米粒大小的黃褐色壞死斑,再延葉脈蔓延,逐漸擴(kuò)大成“V”字形或長(zhǎng)條形斑塊,周邊伴有黃色退綠暈帶?進(jìn)入致病末期,葉緣形成火燒似的卷縮燒邊,致使大量外葉枯死?因?yàn)橹参锊『Φ燃?jí)判定的一些特性一般都可以由采集樣本觀察測(cè)量獲得數(shù)據(jù),即所選的性狀都是可以直接觀察到的,則相應(yīng)的數(shù)字化圖片上同樣可以獲得,所以我們利用計(jì)算機(jī)自動(dòng)?高效?的特點(diǎn),提出了基于計(jì)算機(jī)視覺的植物黑腐病病斑分析的概念,并對(duì)黑腐病病斑危害程度的確定進(jìn)行了探索?本文根據(jù)病斑的幾何及顏色特征進(jìn)行選擇,并用人工神經(jīng)網(wǎng)絡(luò)的方法加以識(shí)別?
2病斑的幾何特征選擇
由于黑腐病進(jìn)入中后期后,病斑呈較為規(guī)則的“V”字形斑塊,所以可以選擇其幾何特征作為其等級(jí)判斷的依據(jù)?通過(guò)多次試驗(yàn),我們選擇了以下幾種較為具有代表性的幾何特征[2]:
2.1病斑區(qū)域與葉片區(qū)域的面積比p
式中,s為葉片面積,S為病斑面積,葉片和病斑區(qū)域面積可以通過(guò)掃描圖像,累加同一標(biāo)記區(qū)域中象素的個(gè)數(shù)來(lái)表示?
2.2病斑區(qū)域的圓形度C
圓形度C描述的是病斑形狀接近圓形的程度,其計(jì)算公式為:式中,S表示的是病斑面積,L為病斑周長(zhǎng);C值的范圍是0~1,當(dāng)病斑區(qū)域?yàn)閳A形時(shí)周長(zhǎng)最短,C=1,病斑區(qū)域越偏離圓形,則C值越小?
2.3病斑區(qū)域長(zhǎng)?寬比E
E=min{寬度,高度}mx{寬度,高度}病斑區(qū)域越細(xì)長(zhǎng),E越小,當(dāng)病斑區(qū)域?yàn)閳A形時(shí),E=1?
2.4病斑形狀復(fù)雜性e
式中,L表示周長(zhǎng),S表示面積,用離散指數(shù)e來(lái)描述單位面積圖形的周長(zhǎng)大小?e越大,表示單位面積圖形周長(zhǎng)越大,即圖形離散,為復(fù)雜圖形?
2.5從重心到輪廓線的長(zhǎng)度的平均變動(dòng)系數(shù)d
如果從病斑重心出發(fā),每隔10°對(duì)病斑輪廓進(jìn)行掃描,設(shè)重心到輪廓的距離分別為 n,其中n=0°,10°,…,350°,則平均變動(dòng)系數(shù):
3病斑的顏色特征選擇
由于葉片的生長(zhǎng)及病斑的蔓延存在很大的隨機(jī)性,所以單一依靠病斑的幾何特征無(wú)法對(duì)病斑做出而有效的判斷?鑒于此種情況,除幾何特征外,我們提取病斑的顏色特征結(jié)合上述幾何特征共同作為病斑的評(píng)判依據(jù)?
3.1基于HSV空間的病斑顏色矩特征提取
為了處理彩色圖像,首先要選取合適的顏色空間?由于常用的RGB三色空間中,兩點(diǎn)間的歐氏距離與顏色距離不成線性比例,也就是說(shuō)顏色受亮度影響很大,RGB空間不具有進(jìn)行彩色圖像處理所要求的獨(dú)立性和均勻性指標(biāo),所以我們?cè)谔崛〔“哳伾靥卣鲿r(shí)采用了均勻性更好的HSV空間?從RGB到HSV的轉(zhuǎn)換公式為[3]:
由于顏色信息集中在圖像顏色的低階矩中,我們主要對(duì)每種顏色分量的一階?二階和三階矩 進(jìn)行統(tǒng)計(jì)?這三個(gè)顏色矩的數(shù)學(xué)定義如下[4]:式中:pij是第j個(gè)象素的第i個(gè)顏色分量的值;N是象素?cái)?shù)量?由于每幅圖像有3個(gè)顏色分量,每個(gè)顏色分量包括3個(gè)顏色矩,這樣就一共得到了9個(gè)特征向量?
顏色矩的優(yōu)點(diǎn)是特征描述比較緊湊,缺點(diǎn)是低階顏色矩往往分辨率不夠,所以除此之外我們又提出了基于統(tǒng)計(jì)的病斑紅?綠象素特征特提取的方法?
3.2基于統(tǒng)計(jì)的病斑紅?綠象素特征提取病菌對(duì)葉片的侵蝕實(shí)際上是一種破壞植物葉綠素的過(guò)程?經(jīng)過(guò)實(shí)驗(yàn)發(fā)現(xiàn),葉片致病后病斑部位與正常葉片相比,圖像G通道平均數(shù)值相對(duì)R通道大幅降低,由原先G>R轉(zhuǎn)變?yōu)镚
圖2正常葉片的R?G?B曲線圖3早期黃色病斑的R?G?B曲線圖4中后期褐色病斑的R?G?B曲線
基于此種情況,我們提取R通道和G通道的象素平均灰度值和的相 對(duì)關(guān)系參數(shù)X和L作為病斑特征?其中N是象素個(gè)數(shù),Ri和Gi分別是R通道和G通道第i個(gè)象素的灰度值,式中X描述病斑由黃色轉(zhuǎn)為褐色,R?G通道數(shù)值均減小的過(guò)程,L則表征伴隨病情的加重,葉綠素的減少,G值相對(duì)R值變化的過(guò)程?
4人工神經(jīng)網(wǎng)絡(luò)分類器設(shè)計(jì)
4.1神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)在本文中,我們利用bp算法進(jìn)行人工神經(jīng)網(wǎng)絡(luò)分類器的設(shè)計(jì)[5],借助MATLAB2006Ra及其所帶的神經(jīng)網(wǎng)絡(luò)工具箱系統(tǒng)進(jìn)行系統(tǒng)的實(shí)現(xiàn)?最終采用3層神經(jīng)網(wǎng)絡(luò):16個(gè)輸入節(jié)點(diǎn),分別為文中上述提取的16種特征;30個(gè)隱含層節(jié)點(diǎn);3個(gè)輸出節(jié)點(diǎn),分別代表病斑處于致病的早期,中期和晚期?
4.2取樣與神經(jīng)網(wǎng)絡(luò)的訓(xùn)練
由于實(shí)驗(yàn)室培育的黑腐病發(fā)病周期一般為6天,我們?cè)?006年4月3日~2006年4月8日間,在溫度為24~28℃,濕度為80%的廣西大學(xué)生命科學(xué)院溫室內(nèi),每天隨機(jī)采取樣本40枚,共計(jì)采取樣本240枚?將其掃描為圖片后,從中挑選出75張圖片作為訓(xùn)練樣本?其中發(fā)病頭兩天的25張,作為早期;發(fā)病3~4天的圖片25張,作為中期;剩下25張作為末期?經(jīng)過(guò)大量實(shí)驗(yàn),我們將中間層的傳遞函數(shù)和輸出層的傳遞函數(shù)均設(shè)為S型的對(duì)數(shù)函數(shù),即logsig/logsig,訓(xùn)練次數(shù)設(shè)為1000次,訓(xùn)練目標(biāo)誤差為0.001?經(jīng)過(guò)736次后訓(xùn)練后,網(wǎng)絡(luò)收斂,目標(biāo)誤差達(dá)到要求?
5實(shí)驗(yàn)結(jié)果
使用早期,中期,晚期圖片各20張為測(cè)試樣本(其中15張為新取樣本,5張為已使用過(guò)的學(xué)習(xí)樣本)對(duì)已學(xué)習(xí)好的神經(jīng)網(wǎng)絡(luò)進(jìn)行測(cè)試,網(wǎng)絡(luò)輸出值大于等于0.85時(shí)算作1,當(dāng)輸出值小于等于0.15時(shí)算作0?則表1為全部測(cè)試樣本的判別結(jié)果:
6結(jié)論與展望
應(yīng)用上述方案進(jìn)行識(shí)別實(shí)驗(yàn),bp訓(xùn)練網(wǎng)絡(luò)全部收斂,而且收斂速度較快,15個(gè)學(xué)習(xí)樣本全部正確識(shí)別?從上表中可以看出,病斑危害程度的平均識(shí)別率達(dá)到了90%,其中晚期病斑識(shí)別率較高,達(dá)到了95%?中期識(shí)別率較低,為85%,這可能是由于某些病斑發(fā)展較快或較慢導(dǎo)致中期特征并不明顯,使得識(shí)別時(shí)出現(xiàn)偏差?另外早期病斑的識(shí)別率偏低,這可能是由于有些早期病斑太小,感染初期病斑形狀很不規(guī)則,所以出現(xiàn)誤分?如何在判別中增加早期病斑顏色判據(jù)的權(quán)重,增加晚期病斑形狀判別的權(quán)重,使得分類更加合理,是下一步需要繼續(xù)思考的問(wèn)題?
計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺在案例推理系統(tǒng)中的應(yīng)用
摘要:本文結(jié)合案例推理的關(guān)鍵技術(shù),從計(jì)算機(jī)視覺如何圖像獲取、如何圖像預(yù)處理、如何圖像特征抽取描述及案例如何進(jìn)行檢索,得出計(jì)算機(jī)視覺如何在案例推理系統(tǒng)應(yīng)用,實(shí)現(xiàn)案例推理系統(tǒng)對(duì)產(chǎn)品實(shí)時(shí)質(zhì)量檢測(cè)、監(jiān)控和故障診斷。
關(guān)鍵詞:計(jì)算機(jī)視覺;案例推理;圖像處理;圖像描述
1 引言
基于案例推理(case-base reasoning)是人工智能中正不斷發(fā)展的一項(xiàng)重要推理技術(shù)。基于案例推理與類比推理方法相似,案例推理將舊經(jīng)驗(yàn)或教訓(xùn)轉(zhuǎn)換為知識(shí),出現(xiàn)新問(wèn)題時(shí),首先查找以前是否有相似的案例,并用相似案例解決新問(wèn)題。如果沒遇到相似案例的,經(jīng)過(guò)推理后解決新問(wèn)題的方法,又會(huì)成為新的案例或新經(jīng)驗(yàn),下一次再遇到相同問(wèn)題時(shí),就可以復(fù)用這些案例或經(jīng)驗(yàn)。
這與人遇到問(wèn)題時(shí),首先會(huì)用經(jīng)驗(yàn)思考解決問(wèn)題的方式相似,這也是解決問(wèn)題較好的方法。基于案例推理應(yīng)用于工業(yè)產(chǎn)品檢測(cè)或故障診斷時(shí)具有以下特點(diǎn):
CBR智能化程度較高。利用案例中隱含的難以規(guī)則化的知識(shí),以輔助規(guī)則推理的不足,提高故障診斷系統(tǒng)的智能化程度。
CBR較好解決“知識(shí)獲取”的瓶頸。CBR知識(shí)表示以案例為基礎(chǔ),案例的獲取比規(guī)則獲取要容易,大大簡(jiǎn)化知識(shí)獲取的過(guò)。
CBR求解效率較高。是對(duì)過(guò)去的求解結(jié)果進(jìn)行復(fù)用,而不是再次從頭開始推導(dǎo),可以提高對(duì)新問(wèn)題的求解效率。
CBR求解的質(zhì)量較高。CBR以過(guò)去求解成功或失敗的經(jīng)歷,可以指導(dǎo)當(dāng)前求解時(shí)該怎樣走向成功或避開失敗。
CBR持續(xù)不斷的學(xué)習(xí)能力,使得它可以適應(yīng)于將來(lái)問(wèn)題的解決。
所以基于案例推理方法正不斷應(yīng)用在產(chǎn)品質(zhì)量檢測(cè)和設(shè)備故障診斷方面,并取得較好的經(jīng)濟(jì)效益。為了產(chǎn)品檢測(cè)和設(shè)備故障診斷中,更為智能化,更容易實(shí)現(xiàn)現(xiàn)場(chǎng)檢測(cè)和診斷,計(jì)算機(jī)視覺技術(shù)起到很大的作用。
計(jì)算機(jī)視覺是研究用計(jì)算機(jī)來(lái)模擬人和生物的視覺系統(tǒng)功能的技術(shù)學(xué)科,使計(jì)算機(jī)具有感知周圍視覺世界的能力。通過(guò)計(jì)算機(jī)視覺,進(jìn)行圖像的獲取預(yù)處理、圖像分割與特征抽取、識(shí)別與分類、三維信息理解、景物描述、圖像解釋,讓計(jì)算機(jī)具有對(duì)周圍世界的空間物體進(jìn)行傳感、抽象、判斷的能力,從而達(dá)到識(shí)別、理解的目的。
計(jì)算機(jī)視覺隨著科學(xué)技術(shù)發(fā)展,特別計(jì)算機(jī)技術(shù)、通信技術(shù)、圖像采集技術(shù)、傳感器技術(shù)等,以及神經(jīng)網(wǎng)絡(luò)理論、模糊數(shù)學(xué)理論、小波的分析理論等計(jì)算機(jī)視覺理論的不斷發(fā)展和日趨成熟,使計(jì)算機(jī)視覺從上世紀(jì)60年代開始興起發(fā)展到現(xiàn)在,取得快速發(fā)展,已經(jīng)從簡(jiǎn)單圖像質(zhì)量處理發(fā)展到圍繞著紋理分析、圖像編碼、圖像分割和濾波等研究。圖像的分析與處理,也由靜止轉(zhuǎn)向運(yùn)動(dòng),由二維轉(zhuǎn)向三維,并主要著眼于對(duì)圖像的識(shí)別和理解上,也使計(jì)算機(jī)視覺的應(yīng)用領(lǐng)域更為廣泛,為案例推理中運(yùn)用計(jì)算機(jī)視覺打下基礎(chǔ)。
2 案例推理系統(tǒng)的主要關(guān)鍵技術(shù)
(1)案例的表示與組織
案例的表示與組織即是如何抽取案例的特征變量,并以一定的結(jié)構(gòu)在計(jì)算機(jī)中組織存儲(chǔ)。如何將信息抽取出特征變量,選擇什么語(yǔ)言描述案例和選擇什么內(nèi)容存放在案例中,案例按什么組織結(jié)構(gòu)存放在存儲(chǔ)器中,這關(guān)系到基于案例推理方法的效率,而且對(duì)于案例數(shù)量越來(lái)越多,結(jié)構(gòu)十分復(fù)雜的案例庫(kù),尤其重要。
(2)案例的索引與檢索
案例的索引與檢索即是為了查找相似案例,如何建立案例索引和相似度算法,利用檢索信息從案例庫(kù)中檢索并選擇潛在可用相似案例。后面的工作能否發(fā)揮出應(yīng)有的作用,很大程度上依賴于這一階段得到的案例質(zhì)量的高低,因此這一步非常關(guān)鍵。
(3)案例的復(fù)用和調(diào)整
案例的復(fù)用即是如何根據(jù)舊案例得出新解,涉及到找出案例與新問(wèn)題之間的不同之處,案例中的哪些部分可以用于新問(wèn)題,哪些部分不適合應(yīng)用于新問(wèn)題的解決。而復(fù)用還分案例的結(jié)果復(fù)用,案例的求解方法復(fù)用。
(4)案例的學(xué)習(xí)
案例的學(xué)習(xí)即是將新解添加到案例庫(kù)中,擴(kuò)充案例庫(kù)的案例種類與數(shù)量,這過(guò)程也是知識(shí)獲取。此過(guò)程涉及選取哪些信息保留,以及如何把新案例有機(jī)集成到案例庫(kù)中,包括如何存儲(chǔ),如何建立索引等等。
針對(duì)案例推理的關(guān)鍵技術(shù),根據(jù)檢測(cè)和故障診斷系統(tǒng)的特點(diǎn),計(jì)算機(jī)視覺主要解決如何將產(chǎn)品圖像輸入系統(tǒng),如何將產(chǎn)品圖像特征進(jìn)行抽取和描述,如何區(qū)別產(chǎn)品不同之處。以便案例推理系統(tǒng)進(jìn)行案例建模,確立案例的表示形成和案例相似度的計(jì)算。本文主要從計(jì)算機(jī)視覺如何運(yùn)用在案例推理系統(tǒng)進(jìn)行探討。
3 產(chǎn)品輸入系統(tǒng)
產(chǎn)品輸入系統(tǒng)在不同產(chǎn)品類型和生產(chǎn)環(huán)境可能有不同之處,主要應(yīng)有傳感器單元和圖像采集單元。如圖1。
圖1 產(chǎn)品輸入系統(tǒng)結(jié)構(gòu)
傳感器單元主要判斷是否有產(chǎn)品存在,是否需要進(jìn)行圖像采集,是否繼續(xù)下一個(gè)產(chǎn)品圖像的采集。這簡(jiǎn)單傳感器可使用光電開關(guān),配合光源,當(dāng)產(chǎn)品經(jīng)過(guò)時(shí),產(chǎn)品遮擋住光源,使光電開關(guān)產(chǎn)生一個(gè)0值,而沒有產(chǎn)品經(jīng)過(guò)時(shí),光電開關(guān)產(chǎn)生相反的1值,系統(tǒng)通過(guò)判斷光電開關(guān)的值,從而判斷是否有產(chǎn)品。
圖像采集單元簡(jiǎn)單地說(shuō)是將產(chǎn)品拍攝并形成數(shù)字化圖像,主要包括光源、反射鏡、CCD相機(jī)和圖像采集卡等組成。光源和反射鏡作用主要使圖像中的物體和背景之間有較大灰度。CCD相機(jī)主要是拍攝設(shè)備。圖像采集卡主要是將圖像數(shù)字化。通過(guò)傳感器判斷有產(chǎn)品后,光源發(fā)出的光均勻地照在被測(cè)件上,CCD相機(jī)拍攝,拍攝圖像經(jīng)過(guò)圖像采集卡數(shù)字化后輸入存儲(chǔ)設(shè)備。存儲(chǔ)設(shè)備即為計(jì)算機(jī)硬盤。存放原始圖像、數(shù)據(jù)、處理結(jié)果等。
這是案例推理系統(tǒng)的原始數(shù)據(jù),是圖像處理、圖像特征抽取描述的基礎(chǔ)。
4 圖像處理
在案例推理系統(tǒng)中,需要對(duì)案例的組織和案例建模,案例的組織即案例的表示,相對(duì)計(jì)算機(jī)而言,即圖像特征的抽取,即某圖像具有與其它圖像不同之處,用于區(qū)別其它圖像,具有性。同時(shí),又能完整地表示該圖像。所以案例的表示要體現(xiàn)案例的完整性、性、操作容易性。
圖像中有顏色區(qū)別、又有物體大小之分以及圖像由不同的物體組成。如何表示圖像,或說(shuō)圖像內(nèi)部包含表示的本質(zhì),即圖像的描述。根據(jù)圖像特點(diǎn),確立圖像案例的表示,以圖像的像素、圖像的數(shù)字化外觀、圖像物體的數(shù)字組成等屬性。這需要對(duì)產(chǎn)品輸入的原始圖像進(jìn)行處理。
在計(jì)算機(jī)視覺技術(shù)中,對(duì)原始圖像主要進(jìn)行圖像增強(qiáng)、平滑、邊緣銳化、分割、特征抽取、圖像識(shí)別與理解等內(nèi)容。經(jīng)過(guò)這些處理后,輸出圖像的質(zhì)量得到相當(dāng)程度的改善,既改善了圖像的視覺效果,又便于計(jì)算機(jī)對(duì)圖像進(jìn)行分析、處理和識(shí)別。具體工作流程如圖2所示:
圖2 計(jì)算機(jī)視覺的任務(wù)與工作流程
圖像預(yù)處理是將產(chǎn)品的數(shù)字圖像輸入計(jì)算機(jī)后,首先要進(jìn)行圖像的預(yù)處理,主要完成對(duì)圖像噪聲的消除以及零件的邊緣提取。預(yù)處理的步驟為:圖像二值化處理;圖像的平滑處理;圖像的邊緣提取。
圖像二值化處理主將灰度圖形二值化的關(guān)鍵是閾值的選取,由于物體與背景有明顯的灰度差,可以選取根據(jù)灰度直方圖中兩峰之間的谷值作為閾值來(lái)分割目標(biāo)和背景。
圖像的平滑處理技術(shù)即圖像的去噪聲處理,主要是為了去除實(shí)際成像過(guò)程中因成像設(shè)備和環(huán)境所造成的圖像失真,提取有用信息。
圖像邊緣提取是為了將圖像中有意義的對(duì)象與其背景分開,并使之具有某種指定的數(shù)學(xué)或符號(hào)表達(dá)形式,使計(jì)算機(jī)能夠理解對(duì)象的具體含義,檢測(cè)出邊緣的圖像就可以進(jìn)行特征提取和形狀分析了。可采用多種算法,如采用Sobel算子提取邊緣。
圖像預(yù)處理是為下一步的特征描述打基礎(chǔ),預(yù)處理的好壞直接影響案例推理的結(jié)果和檢測(cè)診斷的效率。
特征提取是對(duì)圖像進(jìn)行描述,是案例建模關(guān)鍵,案例建模是根據(jù)案例組織要求抽取圖像特征,是建立案例索引和檢索的關(guān)鍵。如果圖像沒有特征,就談不上進(jìn)行檢索。圖像特征可通過(guò)圖像邊界、圖像分割、圖像的紋理等方法,確定圖像特征,包括是什么產(chǎn)品、產(chǎn)品形狀大小、產(chǎn)品顏色,產(chǎn)品有什么缺陷、產(chǎn)品缺陷在什么位置等特征,根據(jù)這些圖像特征進(jìn)行描述,形成計(jì)算機(jī)中屬性值,并從數(shù)據(jù)庫(kù)查找相應(yīng)信息資料,從而確定產(chǎn)品之間的關(guān)系,相似度,也就是案例推理的方向。
5 系統(tǒng)的檢索
根據(jù)案例推理原理和相應(yīng)算法,建立案例推理系統(tǒng)模型,如圖3所示。
圖3 案例推理系統(tǒng)
對(duì)話系統(tǒng):完成人機(jī)交互、問(wèn)題描述、結(jié)果顯示和系統(tǒng)總控制。
案例庫(kù)系統(tǒng):由案例庫(kù)及案例庫(kù)管理系統(tǒng)組成。
數(shù)據(jù)析取系統(tǒng):對(duì)各種已有的源數(shù)據(jù)庫(kù)的數(shù)據(jù)通過(guò)轉(zhuǎn)換而形成所需的數(shù)據(jù)。
多庫(kù)協(xié)同器:根據(jù)問(wèn)題求解的需要,按照一定的數(shù)據(jù)抽取策略,完成問(wèn)題求解過(guò)程中對(duì)模型庫(kù)系統(tǒng)、方法庫(kù)系統(tǒng)、知識(shí)庫(kù)系統(tǒng)和數(shù)據(jù)庫(kù)系統(tǒng)等資源的調(diào)度與協(xié)調(diào)。
知識(shí)庫(kù)系統(tǒng):由產(chǎn)生式規(guī)則組成,這些知識(shí)包括專家經(jīng)驗(yàn)和以規(guī)則形式表示的有關(guān)知識(shí),也可以是數(shù)據(jù)挖掘結(jié)論,支持案例檢索、案例分析、案例調(diào)整等。 模型庫(kù)系統(tǒng):由模型庫(kù)、算法庫(kù)、模型庫(kù)管理系統(tǒng)組成。完成模型識(shí)別和調(diào)用,并把結(jié)果綜合,送入對(duì)話系統(tǒng)顯示,作為補(bǔ)充信息供案例檢索、調(diào)整使用。
數(shù)據(jù)庫(kù)系統(tǒng):存放待決策支持的所有問(wèn)題,并完成其維護(hù)與查詢等功能。
由于系統(tǒng)主要應(yīng)用產(chǎn)品的現(xiàn)場(chǎng)實(shí)時(shí)檢測(cè)監(jiān)控或故障診斷,所以系統(tǒng)的檢索時(shí),也必須輸入檢索值,即輸入現(xiàn)場(chǎng)產(chǎn)品的圖像,在通過(guò)產(chǎn)品預(yù)處理、圖像的二值化、分割和邊界處理后,進(jìn)行圖像特征描述,根據(jù)圖像描述進(jìn)行分類識(shí)別。根據(jù)案例推理的算法檢索案例庫(kù)中,是否有相似的案例。即確定相似度。相似度確定主要由案例推理的算法確定,如貼近分析法。確定相似度較大作為結(jié)果,并將案例的解輸出,給相關(guān)控制系統(tǒng)進(jìn)行決策。如產(chǎn)品質(zhì)量檢測(cè),確定產(chǎn)品質(zhì)量是否合格,是否有不合格產(chǎn)品,不合格產(chǎn)品是什么原因造成,故障源是什么,如何解決和排除故障,等等。
6 結(jié)論
案例推理方法有效地解決計(jì)算機(jī)視覺技術(shù)中圖像檢索問(wèn)題。對(duì)提高圖像檢索的效率和度提供了平臺(tái)。
計(jì)算機(jī)視覺技術(shù)也為案例推理系統(tǒng)實(shí)現(xiàn)產(chǎn)品現(xiàn)場(chǎng)實(shí)時(shí)檢測(cè)、監(jiān)控、診斷提供技術(shù)支持。計(jì)算機(jī)視覺技術(shù)現(xiàn)場(chǎng)的數(shù)據(jù)采集、處理為案例推理打好基礎(chǔ)。
兩者的結(jié)合設(shè)計(jì)的系統(tǒng)適用范圍很廣,只要產(chǎn)品需要進(jìn)行質(zhì)量檢測(cè)、監(jiān)控,或設(shè)備需要進(jìn)行故障診斷和維護(hù),都可以適用。
系統(tǒng)提供的實(shí)時(shí)檢測(cè)、監(jiān)控和診斷功能,提高企業(yè)的生產(chǎn)效益,降低了生產(chǎn)成本。
計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺技術(shù)在交通工程測(cè)量中的應(yīng)用
一、引言
隨著科技的發(fā)展,計(jì)算機(jī)替代人的視覺與思維已經(jīng)成為現(xiàn)實(shí),這也是計(jì)算機(jī)視覺的突出顯現(xiàn)。那么在物體圖像中識(shí)別物體并作進(jìn)一步處理,是客觀世界的主觀反應(yīng)。在數(shù)字化圖像中,我們可以探尋出較為固定的數(shù)字聯(lián)系,在物體特征搜集并處理時(shí)做到二次實(shí)現(xiàn)。這既是對(duì)物體特征的外在顯現(xiàn)與描繪,更是對(duì)其定量信息的標(biāo)定。從交通工程領(lǐng)域的角度來(lái)看,該種技術(shù)一般應(yīng)用在交管及安全方面。監(jiān)控交通流、識(shí)別車況及高速收費(fèi)都是屬于交通管理的范疇;而對(duì)交通重大事件的勘察及甄別則是交通安全所屬。在這個(gè)基礎(chǔ)上,筆者對(duì)計(jì)算機(jī)視覺系統(tǒng)的組成及原理進(jìn)行了分析,并形成視覺處理相關(guān)技術(shù)研究。
二、設(shè)計(jì)計(jì)算機(jī)視覺系統(tǒng)構(gòu)成
計(jì)算機(jī)視覺處理技術(shù)的應(yīng)用是建立在視覺系統(tǒng)的建立基礎(chǔ)上的。其內(nèi)部主要的構(gòu)成是計(jì)算機(jī)光源、光電轉(zhuǎn)換相關(guān)器件及圖像采集卡等元件。
(一)照明條件的設(shè)計(jì)。在測(cè)量物體的表征時(shí),環(huán)境的創(chuàng)設(shè)是圖像分析處理的前提,其主要通過(guò)光線反射將影像投射到光電傳感器上。故而要想獲得清晰圖像離不開照明條件的選擇。在設(shè)計(jì)照明條件時(shí),我們通常會(huì)視具體而不同處理,不過(guò)總的目標(biāo)是一定的,那就是要利于處理圖像及對(duì)其進(jìn)行提取分析。在照明條件的設(shè)定中,主動(dòng)視覺系統(tǒng)結(jié)構(gòu)光是較為典型的范例。
(二)數(shù)據(jù)采集的處理。如今電耦合器件(CCD)中,攝像機(jī)及光電傳感器較為常見。它們輸出形成的影像均為模擬化的電子信號(hào)。在此基礎(chǔ)上,A模式與D模式的相互對(duì)接更能夠讓信號(hào)進(jìn)入計(jì)算機(jī)并達(dá)到數(shù)字處理標(biāo)準(zhǔn),再量化入計(jì)算機(jī)系統(tǒng)處理范圍。客觀物體色彩的不同,也就造就了色彩帶給人信息的差異。一般地黑白圖像是單色攝像機(jī)輸入的結(jié)果;彩色圖像則需要彩色相機(jī)來(lái)實(shí)現(xiàn)。其過(guò)程為:彩色模擬信號(hào)解碼為RGB單獨(dú)信號(hào),并單獨(dú)A/D轉(zhuǎn)換,輸出后借助色彩查找表來(lái)顯示相應(yīng)色彩。每幅圖像一旦經(jīng)過(guò)數(shù)字處理就會(huì)形成點(diǎn)陣,并將n個(gè)信息濃縮于每點(diǎn)中。彩色獲得的圖像在16比特,而黑白所獲黑白灰圖像則僅有8比特。故而從信息采集量上來(lái)看,彩色的圖像采集分析更為繁復(fù)些。不過(guò)黑白跟灰度圖像也基本適應(yīng)于基礎(chǔ)信息的特征分析。相機(jī)數(shù)量及研究技法的角度,則有三個(gè)分類:“單目視覺”、“雙目”及“三目”立體視覺。
三、研究與應(yīng)用計(jì)算機(jī)視覺處理技術(shù)
從對(duì)圖像進(jìn)行編輯的過(guò)程可以看出,計(jì)算機(jī)視覺處理技術(shù)在物體成像及計(jì)算后會(huì)在灰度陣列中參雜無(wú)效信息群,使得信息存在遺失風(fēng)險(xiǎn)。成像的噪聲在一定程度上也對(duì)獲取有效信息造成了干擾。故而,處理圖像必須要有前提地預(yù)設(shè)分析,還原圖像本相,從而消去噪音。邊緣增強(qiáng)在特定的圖像變化程度中,其起到的是對(duì)特征方法的削減。基于二值化,分割圖像才能夠進(jìn)一步開展。對(duì)于物體的檢測(cè)多借助某個(gè)范圍來(lái)達(dá)到目的。識(shí)別和測(cè)算物體一般總是靠對(duì)特征的甄別來(lái)完成的。
四、分析處理三維物體技術(shù)
物體外輪擴(kuò)線及表面對(duì)應(yīng)位置的限定下,物體性質(zhì)的外在表現(xiàn)則是其形狀。三維物體從內(nèi)含性質(zhì)上來(lái)看也有體現(xiàn),如通過(guò)其內(nèi)含性質(zhì)所變現(xiàn)出來(lái)的表層構(gòu)造及邊界劃定等等。故而在確定圖像特征方面,物體的三維形態(tài)是最常用的處理技術(shù)。檢測(cè)三維物體形狀及分析距離從計(jì)算機(jī)視覺技術(shù)角度來(lái)看,渠道很多,其原理主要是借助光源特性在圖像輸入時(shí)的顯現(xiàn)來(lái)實(shí)現(xiàn)的。其類別有主動(dòng)與被動(dòng)兩類。借助自然光照來(lái)對(duì)圖像獲取并挖掘深入信息的技術(shù)叫做被動(dòng)測(cè)距;主動(dòng)測(cè)距的光源條件則是利用人為設(shè)置的,其信息也是圖像在經(jīng)過(guò)測(cè)算分析時(shí)得到的。被動(dòng)測(cè)距的主要用途體現(xiàn)在軍工業(yè)保密及限制環(huán)境中,而普通建筑行業(yè)則主要利用主動(dòng)測(cè)距。特別是較小尺寸物體的測(cè)算,以及擁有抗干擾及其他非接觸測(cè)距環(huán)境。
(一)主動(dòng)測(cè)距技術(shù)。主動(dòng)測(cè)距,主要是指光源條件是在人為創(chuàng)設(shè)環(huán)境中滿足的,且從景物外像得到相關(guān)點(diǎn)化信息,可以適當(dāng)顯示圖像大概并進(jìn)行初步分析處理,以對(duì)計(jì)算適應(yīng)功率及信息測(cè)算程度形成水平提高。從技術(shù)種類上說(shuō),主動(dòng)測(cè)距技術(shù)可分為雷達(dá)取像、幾何光學(xué)聚焦、圖像干擾及衍射等。除了結(jié)構(gòu)光法外的測(cè)量方法均為基于物理成像,并搜集所成圖像,并得到特殊物理特征圖像。從不同的研究環(huán)境到條件所涉,以結(jié)構(gòu)光法測(cè)量作為主要技術(shù)的工程需求較為普遍,其原理為:首先在光源的設(shè)計(jì)上由人為來(lái)進(jìn)行環(huán)境考慮測(cè)算,再?gòu)钠渲蝎@取較為的離散點(diǎn)化信息。在離散處理后,此類圖像已經(jīng)形成了較多的物體真是特征表象。在此基礎(chǔ)上,信息需要不斷簡(jiǎn)化與甄別、壓縮。如果分析整個(gè)物體特征信息鏈,則后期主要體現(xiàn)在對(duì)于數(shù)據(jù)的簡(jiǎn)化分析。如今人們已經(jīng)把研究的目光轉(zhuǎn)向了結(jié)構(gòu)光測(cè)量方法的應(yīng)用,體現(xiàn)在物體形狀檢測(cè)等方面。
(二)被動(dòng)測(cè)距技術(shù)。被動(dòng)測(cè)距,對(duì)光照條件的選擇具有局限性,其主要通過(guò)對(duì)于自然光的覆蓋得以實(shí)現(xiàn)。它在圖像原始信息處理及分析匹配方面技術(shù)指向較為突出。也通過(guò)此三維物體之形狀及周圍環(huán)境深度均被顯露。在圖像原始信息基礎(chǔ)上的應(yīng)用計(jì)算,其與結(jié)構(gòu)光等相比繁雜程度較高。分析物體三維特性,著重從立體視覺內(nèi)涵入手,適應(yīng)物體自身特點(diǎn)而存在。不過(guò)相對(duì)來(lái)說(shuō)獲得圖像特征才是其適應(yīng)匹配的條件保障。點(diǎn)、線、區(qū)域及結(jié)構(gòu)紋理等是物象特征的主體形式。其中物特較為基礎(chǔ)與原始的特征是前兩個(gè)特征,同時(shí)它們也是其他相關(guān)表征的前提。計(jì)算機(jī)系統(tǒng)技術(shù)測(cè)量基本原理為對(duì)攝像機(jī)進(jìn)行構(gòu)建分析,并對(duì)其圖像表征進(jìn)行特征匹配,以得到圖像不同區(qū)間的視覺差異。
五、結(jié)束語(yǔ)
通過(guò)對(duì)計(jì)算機(jī)視覺技術(shù)的研究,悉知其主要的應(yīng)用領(lǐng)域及技術(shù)組成。在系統(tǒng)使用的基礎(chǔ)上深入設(shè)計(jì),對(duì)系統(tǒng)主要構(gòu)成環(huán)節(jié)進(jìn)行分析。從而將三維復(fù)雜形態(tài)原理、算法及測(cè)量理論上升到實(shí)際應(yīng)用。隨著社會(huì)對(duì)于計(jì)算機(jī)的倚賴程度增加,相信該技術(shù)在建筑或者其他領(lǐng)域會(huì)有更加深入的研究及應(yīng)用。
計(jì)算機(jī)視覺論文:計(jì)算機(jī)視覺技術(shù)及其在自動(dòng)化中的應(yīng)用
摘要:隨著社會(huì)的發(fā)展,科技的進(jìn)步,計(jì)算機(jī)的應(yīng)用范圍也越來(lái)越廣,人們開始試圖建立利用計(jì)算機(jī)來(lái)代替人類進(jìn)行自動(dòng)識(shí)別的人工智能系統(tǒng),而要想建成這種系統(tǒng)一項(xiàng)必不可少的技術(shù)就是計(jì)算機(jī)視覺技術(shù)。為了進(jìn)一步促進(jìn)計(jì)算機(jī)視覺技術(shù)的發(fā)展,使計(jì)算機(jī)視覺技術(shù)得到更廣泛的推廣與應(yīng)用,本文概述了計(jì)算機(jī)視覺技術(shù)的基本概念、工作原理與理論框架,并重點(diǎn)分析了計(jì)算機(jī)視覺技術(shù)在農(nóng)業(yè)自動(dòng)化、工業(yè)自動(dòng)化以及醫(yī)學(xué)自動(dòng)化中的應(yīng)用,以期為計(jì)算機(jī)視覺技術(shù)的推廣與發(fā)展貢獻(xiàn)自己的綿薄之力。
關(guān)鍵詞:計(jì)算機(jī);視覺技術(shù);應(yīng)用;分析
計(jì)算機(jī)人工智能技術(shù)中的一項(xiàng)重要技術(shù)就是計(jì)算機(jī)視覺技術(shù),這種技術(shù)主要是讓計(jì)算機(jī)利用圖像來(lái)實(shí)現(xiàn)認(rèn)知環(huán)境信息的目的,這一目的的實(shí)現(xiàn)需要用到多種高尖端技術(shù)。近年來(lái)隨著計(jì)算機(jī)技術(shù)以及計(jì)算機(jī)網(wǎng)絡(luò)的普及與發(fā)展,計(jì)算機(jī)視覺技術(shù)也得到了較快發(fā)展,并且在實(shí)際生產(chǎn)與生活中的應(yīng)用也越來(lái)越廣泛。
1 計(jì)算機(jī)視覺技術(shù)概述
1.1 基本概念
計(jì)算機(jī)視覺技術(shù)主要研究計(jì)算機(jī)認(rèn)知能力的一門技術(shù),其具體主要是通過(guò)用攝像機(jī)代替人的眼睛,用電腦代替人的大腦,最終使計(jì)算機(jī)具備類似于人類的識(shí)別、判斷以及記憶目標(biāo)的功能,代替人類進(jìn)行部分生產(chǎn)作業(yè)。人們目前研究的人工智能技術(shù)中的一項(xiàng)重要內(nèi)容就是計(jì)算機(jī)視覺技術(shù),通過(guò)研究計(jì)算機(jī)視覺技術(shù)可以讓計(jì)算機(jī)擁有利用二維圖像認(rèn)知三維環(huán)境的功能。總的來(lái)說(shuō),計(jì)算機(jī)視覺技術(shù)是在圖像與信號(hào)處理技術(shù)、概率分析統(tǒng)計(jì)、網(wǎng)絡(luò)神經(jīng)技術(shù)以及信息處理技術(shù)的基礎(chǔ)上,利用計(jì)算機(jī)來(lái)分析、處理視覺信息的技術(shù),它是現(xiàn)代社會(huì)新興起的一門高新技術(shù)。
1.2 工作原理
在亮度滿足要求的情況下,首先使用攝像機(jī)對(duì)具體事物的圖像信息進(jìn)行采集,利用網(wǎng)絡(luò)把采集到的圖像信息向計(jì)算機(jī)內(nèi)部輸送,然后在計(jì)算機(jī)系統(tǒng)內(nèi)部處理加工圖像信息會(huì)把事物的原始圖像得到,隨后利用圖像處理技術(shù)進(jìn)一步處理原始圖像,獲得優(yōu)化質(zhì)量效果之后的圖像,分類與整理圖像中有特征價(jià)值的信息,通過(guò)智能識(shí)別技術(shù)識(shí)別與描述提取到的圖像信息特征,把得到的高層次的抽象信息存儲(chǔ)起來(lái),在進(jìn)行識(shí)別事務(wù)時(shí)分析對(duì)比這些儲(chǔ)存信息就可以實(shí)現(xiàn)事物的識(shí)別,這樣視覺系統(tǒng)的基本任務(wù)也就完成了。其具體視覺系統(tǒng)如圖1所示:
1.3理論框架
人類研究視覺技術(shù)雖然起步比較早,但取得較大進(jìn)步是在20世紀(jì)80年代初伴隨著視覺計(jì)算理論的出現(xiàn)。它的出現(xiàn)把研究視覺理論的策略問(wèn)題解決了,視覺技術(shù)是一項(xiàng)特別復(fù)雜的信息處理過(guò)程,要想對(duì)視覺的本質(zhì)完整的理解,必須從不同角度與層次研究與分析視覺本質(zhì)。視覺計(jì)算理論研究層次大致可分為:計(jì)算機(jī)理論、算法以及實(shí)際執(zhí)行。站在計(jì)算機(jī)理論的角度分析視覺技術(shù),我們可知必須用要素圖、維圖、以及三維模型表像來(lái)描述視覺信息。
所以,可以把計(jì)算機(jī)視覺技術(shù)當(dāng)做從三維環(huán)境圖像中抽取、描述與解釋信息的過(guò)程,其主要分析步驟可分為感覺、處理、描述、識(shí)別、解釋等。若依據(jù)上述各過(guò)程實(shí)現(xiàn)需用到的方法與技術(shù)的復(fù)雜性劃分層次,可大致把計(jì)算機(jī)視覺技術(shù)劃分為:低層視覺處理、中層視覺處理、高層視覺處理三個(gè)層次。
2 計(jì)算機(jī)視覺技術(shù)在自動(dòng)化中的應(yīng)用
2.1 農(nóng)業(yè)自動(dòng)化中計(jì)算機(jī)視覺技術(shù)的應(yīng)用
在農(nóng)業(yè)自動(dòng)化中應(yīng)用計(jì)算機(jī)視覺技術(shù)可以全天候?qū)崟r(shí)監(jiān)測(cè)農(nóng)作物的生長(zhǎng)狀況,便于科學(xué)管理農(nóng)作物。還可以應(yīng)用計(jì)算機(jī)視覺技術(shù)來(lái)檢測(cè)農(nóng)產(chǎn)品的質(zhì)量,例如可以應(yīng)用計(jì)算機(jī)監(jiān)測(cè)技術(shù)來(lái)監(jiān)測(cè)大多數(shù)蔬菜的質(zhì)量,傳統(tǒng)的人工檢測(cè)蔬菜質(zhì)量的方法,不僅費(fèi)時(shí)費(fèi)力,而且檢測(cè)結(jié)果的性也不能很好的保障,在實(shí)際人工檢測(cè)過(guò)程中還容易傷害蔬菜,可以通過(guò)利用計(jì)算機(jī)視覺技術(shù)來(lái)感應(yīng)蔬菜自身釋放的紅外線、紫外線以及其他可見光的能量大小,然后和質(zhì)量達(dá)標(biāo)蔬菜的光線能量大小進(jìn)行對(duì)比,根據(jù)這些對(duì)比結(jié)果可以把蔬菜質(zhì)量的好壞判斷出來(lái),在蔬菜質(zhì)量檢測(cè)過(guò)程中應(yīng)用計(jì)算機(jī)視覺技術(shù),把傳統(tǒng)的蔬菜檢測(cè)方法顛覆了,極大的方便了農(nóng)產(chǎn)品的質(zhì)量檢測(cè),由此可見,計(jì)算機(jī)視覺技術(shù)在農(nóng)業(yè)生產(chǎn)中有很高的使用與推廣價(jià)值。
2.2 在工業(yè)自動(dòng)化中計(jì)算機(jī)視覺技術(shù)的應(yīng)用
計(jì)算機(jī)視覺技術(shù)在工業(yè)自動(dòng)化應(yīng)用的一個(gè)重要領(lǐng)域就是可以精密測(cè)量零件尺寸,其測(cè)量與被測(cè)對(duì)象的原理如圖2所示。
光學(xué)系統(tǒng)、計(jì)算機(jī)處理系統(tǒng)以及CCD攝像頭,是計(jì)算機(jī)檢測(cè)系統(tǒng)的主要組成,被測(cè)物體由光源發(fā)出的平行光束進(jìn)行照射,利用顯微光學(xué)鏡把待檢測(cè)部位的輪廓圖像呈現(xiàn)在攝像機(jī)的面陣CCD上,然后再通過(guò)計(jì)算機(jī)處理這些圖像,進(jìn)而把被測(cè)部位的輪廓位置信息獲取下來(lái),若被測(cè)對(duì)象是出現(xiàn)位移時(shí),可通過(guò)兩次重復(fù)測(cè)量,利用兩次測(cè)量的位置差就可以得出,被測(cè)物體的位移量。
此外計(jì)算機(jī)視覺技術(shù)還可以應(yīng)用于逆向工程中,應(yīng)用3D數(shù)字化測(cè)量?jī)x可以快速的測(cè)出現(xiàn)有工件輪廓的坐標(biāo)值,同時(shí)還能構(gòu)建曲面,保存成CAD或CAM圖像,把這些圖像送入CNC制作中心加工,便可制作出產(chǎn)品,這也就是所謂的逆向工程。由上述分析我們可知逆向工程要想實(shí)現(xiàn),最關(guān)鍵的一環(huán)就是如何通過(guò)精密測(cè)量系統(tǒng)來(lái)測(cè)量樣品的三圍尺寸,獲得各部位數(shù)據(jù),進(jìn)而做曲面處理進(jìn)而加工生產(chǎn)。對(duì)于這一難題我可以通過(guò)利用線結(jié)構(gòu)光測(cè)量物體表面輪廓技術(shù)來(lái)實(shí)現(xiàn),器具體輪廓結(jié)構(gòu)示意圖如下圖3所示。
這種測(cè)量方法的工作原理為:利用激光穿越平行、等距的振幅光柵組件,或直接采用干涉儀發(fā)出的干涉條紋,形成平面條紋結(jié)構(gòu)光,再向物體表面投射,由于物體各表面的深度與曲率的不同,條紋會(huì)自動(dòng)出現(xiàn)變化,然后再通過(guò)使用CCD攝像機(jī)對(duì)變形條紋進(jìn)行拍攝。這樣就可以把物體表面輪廓的變化情況分析出來(lái)。攝像機(jī)在拍攝圖像的過(guò)程中,把圖像信號(hào)轉(zhuǎn)化為模擬信號(hào),再轉(zhuǎn)化為數(shù)字信號(hào),然后經(jīng)過(guò)傳送再還原信號(hào)到圖形處理系統(tǒng),就得到三維輪廓圖像。
在工業(yè)自動(dòng)化中計(jì)算機(jī)視覺技術(shù)的深入廣泛應(yīng)用,不但使工業(yè)產(chǎn)品的生產(chǎn)質(zhì)量得到了保障,而且跨越式的提高了工業(yè)產(chǎn)品的生產(chǎn)速度。如計(jì)算機(jī)視覺技術(shù)可以很好的檢測(cè)產(chǎn)品包裝質(zhì)量,封口質(zhì)量以及印刷質(zhì)量等等,如我國(guó)重點(diǎn)指定的印刷造幣機(jī)器的南京造幣廠,由于貨幣制造印刷是由印刷造幣機(jī)器來(lái)實(shí)現(xiàn)的,所以要嚴(yán)格要求其生產(chǎn)工藝,一絲一毫的生產(chǎn)差錯(cuò)都不允許存在,為了保障印刷制造出來(lái)的造幣機(jī)器質(zhì)量達(dá)標(biāo),必須嚴(yán)格檢測(cè)生產(chǎn)出來(lái)的成品。在印刷造幣機(jī)器的過(guò)程中要求要有非常高的計(jì)算機(jī)視覺技術(shù),隨著計(jì)算機(jī)視覺技術(shù)的不斷進(jìn)步,計(jì)算機(jī)視覺技術(shù)已經(jīng)對(duì)印刷造幣機(jī)器的需求滿足了,實(shí)際的應(yīng)用效果也非常理想,印刷造幣機(jī)器在實(shí)際生產(chǎn)的過(guò)程中,南京造幣廠把計(jì)算機(jī)視覺技術(shù)應(yīng)用在了每個(gè)應(yīng)刷造幣機(jī)器的生產(chǎn)工序上,硬幣受到重力下落的瞬間,計(jì)算機(jī)視覺技術(shù)可以瞬間采集圖像的信息,拍攝硬幣在下落過(guò)程中的圖像,通過(guò)高速光纖傳感器可以把硬幣圖像向計(jì)算機(jī)系統(tǒng)快速傳輸,利用計(jì)算機(jī)系統(tǒng)處理信息與識(shí)別信息的超強(qiáng)能力,可以及時(shí)識(shí)別硬幣質(zhì)量,經(jīng)大量實(shí)踐研究得出,在印刷造幣機(jī)器上應(yīng)用計(jì)算機(jī)視覺技術(shù)已經(jīng)幾乎沒有檢查差錯(cuò)現(xiàn)象的發(fā)生,由此可知,在工業(yè)自動(dòng)化中計(jì)算機(jī)視覺技術(shù)的應(yīng)用不但可行,而且發(fā)展空間還很大。
2.3 在醫(yī)學(xué)自動(dòng)化中計(jì)算機(jī)視覺技術(shù)的應(yīng)用
在醫(yī)學(xué)領(lǐng)域計(jì)算機(jī)視覺技術(shù)也得到了廣泛應(yīng)用,如醫(yī)學(xué)中經(jīng)常用到的CT圖像以及X射線圖都用到了計(jì)算機(jī)視覺技術(shù),這些技術(shù)的廣泛應(yīng)用很大程度上方便了醫(yī)生判斷病人病情,另外,在生產(chǎn)藥品的過(guò)程中,應(yīng)用計(jì)算機(jī)視覺技術(shù)可以高效檢測(cè)藥品包裝的合格與否,其基本流程是:傳送裝置先運(yùn)輸藥品到指定位置,傳送裝置自身又可分為檢測(cè)與分離兩個(gè)區(qū)域,在傳送藥品的過(guò)程中藥品的圖像信息會(huì)被特定的攝像機(jī)采集,采集完成后向計(jì)算機(jī)系統(tǒng)傳遞采集信息,然后計(jì)算機(jī)系統(tǒng)會(huì)分析與處理這些信息,把沒有包裝好的藥品自動(dòng)識(shí)別出來(lái),并且向分離區(qū)傳遞識(shí)別信息,分離區(qū)的自動(dòng)裝置會(huì)依據(jù)傳輸?shù)姆蛛x信息,隔離開沒有包裝好的藥品,這樣就可以有效分類包裝好的藥品與沒有包裝好的藥品,在藥品包裝檢測(cè)方面應(yīng)用計(jì)算機(jī)視覺技術(shù)代替?zhèn)鹘y(tǒng)人工檢測(cè),不但可以實(shí)現(xiàn)藥品無(wú)誤的檢測(cè),而且還可以大大提高檢測(cè)藥品包裝質(zhì)量的效率,完善了藥品生產(chǎn)的自動(dòng)化,由此可見,在醫(yī)學(xué)自動(dòng)化中應(yīng)用計(jì)算機(jī)視覺技術(shù)可以積極促進(jìn)醫(yī)學(xué)自動(dòng)化的發(fā)展。
3 結(jié)束語(yǔ)
總之,計(jì)算機(jī)視覺技術(shù)是一門研究計(jì)算機(jī)識(shí)別能力的高新技術(shù),它涵蓋了很多其他技術(shù),具有一定復(fù)雜性。要想使其在自動(dòng)化生產(chǎn)中得到更好地推廣與應(yīng)用,我們必須在明白其基本概念、工作原理以及理論框架的基礎(chǔ)上,結(jié)合實(shí)際生產(chǎn)情況,不斷進(jìn)行深入研究,只有這樣才能使計(jì)算機(jī)視覺技術(shù)得到更好地推廣與應(yīng)用,才能使這項(xiàng)現(xiàn)代化的高新技術(shù)更好的服務(wù)于社會(huì),服務(wù)于人類。
計(jì)算機(jī)視覺論文:淺議高校計(jì)算機(jī)視覺課程教學(xué)的創(chuàng)新
摘要:計(jì)算機(jī)視覺是利用計(jì)算機(jī)及相關(guān)設(shè)備來(lái)模仿生物視覺的技術(shù),計(jì)算機(jī)視覺課程的建立對(duì)學(xué)生的學(xué)習(xí)和互聯(lián)網(wǎng)的發(fā)展有著重要的意義。基于此,本文將著重探討計(jì)算機(jī)視覺課程的特點(diǎn)和高校計(jì)算機(jī)視覺課程教學(xué)的創(chuàng)新策略,主要包括教學(xué)內(nèi)容的選取和工程實(shí)例的選取,以期為當(dāng)前計(jì)算機(jī)視覺課程的教學(xué)提供一些指導(dǎo)意見。
關(guān)鍵詞:計(jì)算機(jī)視覺;課程創(chuàng)新;教學(xué)改革
計(jì)算機(jī)視覺課程是人工智能學(xué)科的分支學(xué)科,對(duì)互聯(lián)網(wǎng)技術(shù)的發(fā)展有著重要的推進(jìn)作用。隨著時(shí)代的飛速變遷,越來(lái)越多的學(xué)生對(duì)這一領(lǐng)域產(chǎn)生了濃厚的興趣,計(jì)算機(jī)視覺課程在信息專業(yè)中也開始占據(jù)重要的地位。如何讓學(xué)生對(duì)這門課程保持長(zhǎng)久的興趣,如何培養(yǎng)學(xué)生的專業(yè)能力和實(shí)踐能力,是當(dāng)前高校應(yīng)該考慮的問(wèn)題。經(jīng)過(guò)近幾年的教學(xué)實(shí)踐后,很多高校已經(jīng)逐步確定了通過(guò)實(shí)際應(yīng)用培養(yǎng)學(xué)生興趣的教學(xué)方法,在滿足學(xué)生對(duì)計(jì)算機(jī)視覺應(yīng)用需求的同時(shí),加深了學(xué)生對(duì)理論知識(shí)的理解,這已經(jīng)成為了當(dāng)前高校計(jì)算機(jī)視覺課程教學(xué)的重要模式。
一、計(jì)算機(jī)視覺課程的特點(diǎn)
近年來(lái),隨著計(jì)算機(jī)網(wǎng)絡(luò)的飛速發(fā)展,計(jì)算機(jī)視覺的應(yīng)用也越來(lái)越廣泛,成為了信息相關(guān)專業(yè)學(xué)生的一門必修課。計(jì)算機(jī)視覺課程涉及眾多領(lǐng)域,包括人工智能與模式識(shí)別、應(yīng)用數(shù)學(xué)等,其覆蓋范圍廣,綜合性較強(qiáng)。具體來(lái)說(shuō),計(jì)算機(jī)視覺課程有以下幾個(gè)特點(diǎn):一是內(nèi)容廣泛,理論抽象。計(jì)算機(jī)視覺是一門新技術(shù),隨著時(shí)代的變遷,互聯(lián)網(wǎng)新技術(shù)的更新日新月異,這就使得課程內(nèi)容的更新過(guò)快,內(nèi)容廣泛,教師很難在及時(shí)時(shí)間向?qū)W生輸送所有的課程知識(shí)。二是計(jì)算機(jī)視覺課程涉及多個(gè)學(xué)科領(lǐng)域,并且所涉及的領(lǐng)域知識(shí)內(nèi)容復(fù)雜,表達(dá)抽象,這對(duì)學(xué)生的學(xué)習(xí)來(lái)說(shuō)是一個(gè)較大的障礙。三是實(shí)踐性強(qiáng)。計(jì)算機(jī)視覺課程的知識(shí)內(nèi)容來(lái)源于各種專業(yè)不同的領(lǐng)域,操作性極強(qiáng),學(xué)生只有在具有一定的工程項(xiàng)目綜合能力后,才能進(jìn)行計(jì)算機(jī)視覺應(yīng)用和操作。
二、計(jì)算機(jī)視覺與計(jì)算機(jī)圖形學(xué)、數(shù)字圖像處理之間的聯(lián)系和區(qū)別
1.計(jì)算機(jī)視覺與計(jì)算機(jī)圖形學(xué)的聯(lián)系與區(qū)別。計(jì)算機(jī)視覺一般輸入的都是圖像或圖像序列,其輸入資料主要來(lái)自u(píng)sb攝像頭或是相機(jī)。經(jīng)過(guò)處理后,計(jì)算機(jī)視覺輸出的是對(duì)圖像序列和圖像對(duì)應(yīng)的對(duì)真實(shí)世界的一種理解,在這一方面,計(jì)算機(jī)視覺有識(shí)別車牌、人臉的作用。而計(jì)算機(jī)圖形學(xué)則是一種對(duì)虛擬場(chǎng)景的描述。它一般是由多個(gè)多邊性數(shù)組組成,每個(gè)多邊性有三個(gè)頂點(diǎn),輸出的是二維像素?cái)?shù)組。在增強(qiáng)現(xiàn)實(shí)的應(yīng)用中,人們不僅需要用計(jì)算機(jī)視覺來(lái)提高對(duì)物體識(shí)別和姿態(tài)獲取的效率,還需要用到計(jì)算機(jī)圖形學(xué)對(duì)虛擬三維物體的疊加方法。
2.計(jì)算機(jī)視覺與數(shù)字圖像處理的聯(lián)系和區(qū)別。首先,計(jì)算機(jī)視覺與數(shù)字圖像處理之間的聯(lián)系在于數(shù)字圖像處理是計(jì)算機(jī)視覺處理的基礎(chǔ),而計(jì)算機(jī)視覺的研究成果也可以作為數(shù)字處理的素材。其次,計(jì)算機(jī)視覺與數(shù)字圖像處理之間的區(qū)別在于圖形是一種純數(shù)字化、矢量的單位,而圖像則不僅包括圖形,有時(shí)還包括來(lái)自現(xiàn)實(shí)世界的信號(hào),并且圖形的處理不是一種簡(jiǎn)單的堆積,計(jì)算機(jī)視覺的處理要從圖像中找到一些統(tǒng)計(jì)數(shù)據(jù)和信息,并做進(jìn)一步的數(shù)據(jù)分析。
三、高校計(jì)算機(jī)視覺課程教學(xué)的創(chuàng)新策略
1.以工程應(yīng)用為導(dǎo)向的課程內(nèi)容。鑒于學(xué)習(xí)本課程的學(xué)生在畢業(yè)之后多數(shù)會(huì)進(jìn)入相關(guān)工程企業(yè)或者研究院工作,因此,在對(duì)學(xué)生進(jìn)行培養(yǎng)時(shí),高校一方面要考慮到學(xué)生的知識(shí)接受度,另一方面要設(shè)置以工程應(yīng)用為導(dǎo)向的課程內(nèi)容,幫助學(xué)生更好的進(jìn)入企業(yè)或研究院開展工作。高校在進(jìn)行計(jì)算機(jī)視覺課程教學(xué)創(chuàng)新時(shí),首先要?jiǎng)?chuàng)新課程教材,摒棄以往枯燥的理論書籍,多選取一些實(shí)踐性和應(yīng)用性強(qiáng)的教材。考慮到國(guó)內(nèi)教材的滯后性和學(xué)生基礎(chǔ)的薄弱性,高校應(yīng)該選擇以下兩本書作為學(xué)生的專用教材:一本是我國(guó)著名教授賈云得編纂的《機(jī)器學(xué)習(xí)》,這部教材深刻體現(xiàn)了時(shí)展的教學(xué)要求,書中不僅詳細(xì)講述了計(jì)算機(jī)視覺中的一些基本知識(shí),包括計(jì)算機(jī)視覺的基本概念、算法及其應(yīng)用,還有一些經(jīng)典的數(shù)字圖像處理方法和視覺應(yīng)用分析,對(duì)學(xué)生了解基礎(chǔ)知識(shí)和實(shí)踐內(nèi)容有著重要的意義;另外一本是國(guó)內(nèi)外十分推崇的計(jì)算機(jī)視覺著作,它是美國(guó)教授Richard Szeliski教授的作品。該書在2010年出版,獲得了眾多業(yè)界人士的好評(píng)。Richard Szeliski教授是華盛頓大學(xué)的兼職教授,也是微軟研究院交互視覺與多媒體的主任,他對(duì)計(jì)算機(jī)視覺的發(fā)展和未來(lái)走向十分清楚,也深刻了解產(chǎn)業(yè)界和大學(xué)需要什么樣的計(jì)算機(jī)視覺課程教材。因此,這本教材面向應(yīng)用,與當(dāng)今近期的科技成果緊密相連,綜合論述了計(jì)算機(jī)視覺在各個(gè)領(lǐng)域的發(fā)展,展示了計(jì)算機(jī)視覺的近期研究成果和未來(lái)的發(fā)展趨勢(shì)。此外,本書中還有詳細(xì)的國(guó)外研究案例和更加深入的應(yīng)用案例,適合學(xué)生開展探究性學(xué)習(xí)。兩本教材都是遵循以工程應(yīng)用為導(dǎo)向的原則,對(duì)學(xué)生開放性思維的培養(yǎng)有著重要的意義。
2.面向科技近期成果的課程定位。計(jì)算機(jī)視覺是一門新技術(shù),科技創(chuàng)新是其發(fā)展的原動(dòng)力,因此,高校在進(jìn)行課程安排時(shí),應(yīng)該將當(dāng)今計(jì)算機(jī)視覺領(lǐng)域的重要的科技成果作為計(jì)算機(jī)課程的基本教學(xué)內(nèi)容。要想以科技近期成果定位計(jì)算機(jī)視覺課程,高校要做到以下兩個(gè)方面:(1)選取涵蓋近期成果的教材。考慮到不同學(xué)生的數(shù)字圖像處理基礎(chǔ)不一的問(wèn)題,學(xué)校可以在課程中補(bǔ)充一些有關(guān)數(shù)字圖像處理的基礎(chǔ)內(nèi)容。在選擇教材內(nèi)容時(shí),計(jì)算機(jī)視覺課程的內(nèi)容應(yīng)該包括數(shù)字圖像處理、視覺學(xué)習(xí)和模式識(shí)別這三大部分。數(shù)字圖像處理是視覺課程的基礎(chǔ)內(nèi)容,主要向?qū)W生介紹數(shù)字圖像處理和計(jì)算機(jī)視覺所涉及的一些基礎(chǔ)知識(shí),包括圖像的分割和檢測(cè)、圖像濾波的處理等。數(shù)字圖像處理是整個(gè)計(jì)算機(jī)課程學(xué)習(xí)的重要基礎(chǔ)內(nèi)容,其課時(shí)可占總課時(shí)的二分之一。其次,視覺部分是近幾年來(lái)計(jì)算機(jī)視覺的近期科技成果,內(nèi)容主要包括攝像機(jī)的幾何設(shè)定和計(jì)算機(jī)攝影機(jī)的序列處理等。作為最前沿的科技領(lǐng)域,視覺部分將會(huì)是該課程后期的重點(diǎn)內(nèi)容,與實(shí)踐作業(yè)緊密結(jié)合。而模式識(shí)別則更多的是新技術(shù)的一種工程應(yīng)用,學(xué)生會(huì)更多的涉及到實(shí)踐操作,更好的培養(yǎng)學(xué)生的實(shí)踐能力。(2)強(qiáng)化學(xué)生自學(xué)和調(diào)研能力。課程調(diào)研和實(shí)踐是信息專業(yè)學(xué)生強(qiáng)化能力的重要方法之一,高校可以在課程項(xiàng)目中引入新技術(shù)的探究,在使課程在具有基礎(chǔ)性、研究性的同時(shí),具有一定的前沿性,還能讓學(xué)生在及時(shí)時(shí)間了解到近期的科技成果和互聯(lián)網(wǎng)應(yīng)用技術(shù)。在課程調(diào)研和實(shí)踐中,高校必須要強(qiáng)化學(xué)生的自學(xué)和調(diào)研能力,在調(diào)研時(shí)給每一個(gè)小組安排一位高年級(jí)研究生作為指導(dǎo),每組學(xué)生獨(dú)立完成任務(wù),高年級(jí)研究生只做引導(dǎo)和輔助的作用。學(xué)生在自我設(shè)置調(diào)研程序,查找資料,理解和熟悉相關(guān)程序的時(shí)候,能夠更加掌握近期科技成果的內(nèi)容,同時(shí)還提高了學(xué)生的自學(xué)能力和團(tuán)隊(duì)協(xié)作能力。
3.工程實(shí)踐化的教學(xué)形式。工程項(xiàng)目綜合能力是信息專業(yè)的學(xué)生必須具備的素質(zhì)之一,因此在計(jì)算機(jī)視覺課程的教學(xué)過(guò)程中,培養(yǎng)學(xué)生的工程實(shí)踐能力是教學(xué)目標(biāo)之一。高校可以采取以下兩種方法:(1)選取適當(dāng)?shù)墓こ虒?shí)例。對(duì)于信息專業(yè)的學(xué)生而言,計(jì)算機(jī)視覺課程各個(gè)獨(dú)立的算法和方法較多,彼此沒有過(guò)多的聯(lián)系。這對(duì)學(xué)生來(lái)說(shuō)過(guò)于抽象,不易理解,因此教師不應(yīng)當(dāng)僅僅限于知識(shí)的傳授,還應(yīng)該選取一些適當(dāng)?shù)墓こ虒?shí)例,將知識(shí)體系串聯(lián)在一起,加深學(xué)會(huì)對(duì)教學(xué)內(nèi)容的理解,從而達(dá)到良好的教學(xué)效果。例如,在教學(xué)過(guò)程中,教師可以著重介紹手機(jī)制造的例子。手機(jī)是現(xiàn)在學(xué)生十分熟悉的產(chǎn)品,用手機(jī)舉例更加貼近學(xué)生的生活,教師可以詳細(xì)介紹手機(jī)鍵盤和主板的制造過(guò)程,并在這一過(guò)程中將所學(xué)的算法和理論融合進(jìn)去,加深學(xué)生對(duì)知識(shí)的理解。其次,教師在手機(jī)講解時(shí),還可以引導(dǎo)學(xué)生思考類似的產(chǎn)品制造,從而引出數(shù)碼相機(jī)的制造原理,和學(xué)生一起探討其制造算法。這種做法不僅可以幫助學(xué)生學(xué)習(xí),還可以讓學(xué)生拓寬思路,發(fā)散思維,不斷創(chuàng)新計(jì)算機(jī)視覺領(lǐng)域。(2)選擇合適的實(shí)際應(yīng)用。計(jì)算機(jī)視覺課程是一門實(shí)踐性和操作性極強(qiáng)的學(xué)科,因此,為了學(xué)生更好的學(xué)習(xí),教師要將理論工程實(shí)踐化,選擇合適的實(shí)際應(yīng)用來(lái)提高學(xué)生的實(shí)踐能力。教師可以安排學(xué)生進(jìn)入手機(jī)制造廠房,給學(xué)生上一堂別開生面的實(shí)踐課,詳細(xì)介紹每個(gè)制造流程,并向?qū)W生不斷拋出與課程有關(guān)的問(wèn)題,引發(fā)學(xué)生的思考,比如選擇什么樣的模板匹配法可以更為簡(jiǎn)單。學(xué)生在不斷的解答和提問(wèn)中,對(duì)學(xué)科知識(shí)的了解也會(huì)逐步加深。其次,高校可以建立專門的實(shí)訓(xùn)基地,學(xué)生可以在基地里實(shí)踐操作,將理論轉(zhuǎn)化為實(shí)物,親自嘗試做出模型,這種做法可以極大地提高學(xué)生的實(shí)踐能力,使學(xué)生更快的將理論轉(zhuǎn)化為實(shí)際。
四、結(jié)語(yǔ)
在新形勢(shì)下,高校應(yīng)不斷創(chuàng)新計(jì)算機(jī)視覺課程的教學(xué)模式,并以此展開教學(xué)活動(dòng),培養(yǎng)學(xué)生的實(shí)踐能力和創(chuàng)新精神。將工程應(yīng)用和科技近期成果結(jié)合的教學(xué)模式,有利于解決理論和實(shí)踐相脫節(jié)的問(wèn)題,在增強(qiáng)學(xué)生學(xué)習(xí)興趣、提高學(xué)生獨(dú)立分析能力的同時(shí),還使學(xué)生接觸了國(guó)際近期的研究成果,拓寬了學(xué)生的思路,這對(duì)學(xué)生未來(lái)的發(fā)展有著重要的意義。