邊界提升MSER算法和原始MSER算法的實驗結果分析

1 邊界提升MSER算法和原始MSER算法的對比測試 自然場景中圖像存在著或多或小的差別,實驗結果如下表所示,可以從中看出:邊界提升MSER算法相比于原始的MSER提取的區域個數大約減少了35%左右。 表2 邊界提升MSER算法提取區域個數統計 區域個數比 平均耗時 原

1 邊界提升MSER算法和原始MSER算法的對比測試
       自然場景中圖像存在著或多或小的差別,實驗結果如下表所示,可以從中看出:邊界提升MSER算法相比于原始的MSER提取的區域個數大約減少了35%左右。
表2   邊界提升MSER算法提取區域個數統計

    區域個數比 平均耗時
原始MSER   1.00 0.46
邊界提升MSER 邊界提升MSER算法和原始MSER算法的實驗結果分析S=50% 0.62 0.49
邊界提升MSER算法和原始MSER算法的實驗結果分析S=60% 0.65 0.49

2 MSER的優缺點
       按步驟來,首先是輸入一幅圖像,然后進行必要的預處理,例如灰度化,再提取MSER區域,最后再把經過處理之后的區域轉換為二值圖像,利用所獲取的區域坐標信息,把所得到的區域二值圖像進行連通域分析,首先直接剔除一部分字符特征明顯不符合的區域,接下來對剔除留下來的圖像進行閉運算,最后在將進行了閉運算之后的圖像再一次剔除,經過兩次剔除之后留下來的區域為文本區域的包圍盒。實驗結果將在下面展示出來,靠左是未識別之前的圖,靠右是識別之后的圖片,綠色的線標注出來的區域為文本所在區域。
邊界提升MSER算法和原始MSER算法的實驗結果分析邊界提升MSER算法和原始MSER算法的實驗結果分析
圖9 識別后                   圖10 識別前
邊界提升MSER算法和原始MSER算法的實驗結果分析邊界提升MSER算法和原始MSER算法的實驗結果分析
圖11 識別前                         圖12 識別后      
       但是在處理過程中發現一些問題,部分圖片的曝光好壞直接影響到圖片處理的結果,考慮到文本檢測的主要服務對象,圖像的采集過程中沒有刻意的去追求過度曝光或者欠曝光效果的情況,理想的檢測輸入仍然以均勻分布為宜。事實上,適度的欠曝光在MSER檢測結果中,在保留全部文本區域的基礎上,有著小部分區域的錯誤檢測,作為MSER檢測的輸入來說,欠曝光的圖像是處理起來最為理想的,但是這樣說起來,“適度”的標準難以量化,沒有具體的數值來表示,并且,刻意的去追求欠曝光的效果造成圖像的亮度區域細節的丟失,可能造成更大的不便,帶來更多的不利影響,由此得出,在MSER處理的過程中,第一步統一對需要檢測的圖像進行灰度轉換,具體的操作為應用線性變換對圖像的灰度直方圖做水平方向的拉伸。
       從上述公式可以看出,此操作的目的在于對圖像的線性進行調整,對上述灰度變換操作進行相當于地勢落差的拉伸,分水嶺更加的明顯,高聳,集水區域更為凹陷,山壁則變得更加的陡峭,單位注水量使得集水盆的變化更加的明顯和細膩。雖然說經過一些列的處理之后,mser的檢測結果會在一定程度上受到影響,但是,由于灰度變換并不改變圖像局部的亮度極值的位置,極值區域的外緣變化將在可接受的范圍內,這一結論同時也印證了MSER對線性光照變化的不敏感。
       對預處理后的圖像再做MSER檢測,就可以得到如下圖所示的輸出結果,其中最大穩定極值區域由綠色方框標識,方框之間存在著相互嵌套。幾乎所有的文字都在綠色方框內,充分說明了對文本對象所做出的假設是合理的,將最大穩定極值區域當作候選文本區域是可以行的通的。
       自然場景文本檢測僅僅使用了像素的亮度信息,缺乏對文本對象的個性化挑選,輸出結果當中必然包含了大量的非文本區域。為了提高檢測的準確率,需要借助必要的條件對標記出來的區域進行篩選。往往MSER算法會訓練分類器用于區分文本和非文本區域,使用的特征包括字符的高寬比,顏色的一致性,緊密度,結構孔洞的數量,相對段落的高度,骨架長度和周長之比等一些列,上述特征都具有尺度不變性。本文通過檢測尺寸與高寬比對標記內容,然后借助字符的其他特征,進一步進行文本區域的剔除,減輕背景以及噪音對文本檢測的干擾。
    本文中自然場景文本檢測在原圖像的灰度變化副本上進行,輸出結果仍然顯示在原始圖像上面,這樣一方面保證了算法的運行效率,另外一個方面也為接下來的背景分離技術保留了顏色還有紋理線索,當然,MSER應用在場景文本的檢測野存在著一定的局限性,在文本與背景相似度或者背景中存在著與文本尺寸很接近的的柵欄時,MSER檢測幾乎不可能提供任何有用的價值信息。
       雖然如此,但是基于MSER的文本檢測算法仍然對自然場景中的文本檢測做出了巨大的貢獻,利用MSER的特性,算法首先對場景文本中進行預處理:圖像做尺寸歸一化和灰度變換,提成算法的運行效率以及緩解圖像的曝光等問題,然后基于線性時間檢測算法提取圖像中的MSER區域,并且依據篩選出的結果進行后續的處理,就可以得到大概的候選文本區域。從檢測的結果來看,基于極值穩定區域算法完整覆蓋了場景中的全部文本對象,有力的證明了前提假設的合理性,與此同時算法時間的復雜程度為線性,運行效率較高,有著很大的發展前景。但是基于極值穩定區域對場景文本的額提取比較粗糙,即通過篩選,合并之后的處理操作,輸出的結果之中仍然包含著大量的非文本區域。

下載提示:

1、如文檔侵犯商業秘密、侵犯著作權、侵犯人身權等,請點擊“文章版權申述”(推薦),也可以打舉報電話:18735597641(電話支持時間:9:00-18:30)。

2、網站文檔一經付費(服務費),不意味著購買了該文檔的版權,僅供個人/單位學習、研究之用,不得用于商業用途,未經授權,嚴禁復制、發行、匯編、翻譯或者網絡傳播等,侵權必究。

3、本站所有內容均由合作方或網友投稿,本站不對文檔的完整性、權威性及其觀點立場正確性做任何保證或承諾!文檔內容僅供研究參考,付費前請自行鑒別。如您付費,意味著您自己接受本站規則且自行承擔風險,本站不退款、不進行額外附加服務。

原創文章,作者:寫文章小能手,如若轉載,請注明出處:http://www.therealfoodists.com/chachong/607.html,

(0)
上一篇 2017年9月7日
下一篇 2017年9月8日

相關推薦

My title page contents 毛片操逼视频A片|国产欧美成AV人高清|嫖妓特黄AV在线|无码AV天堂免费网址
? ? ?