基于卷積神經網絡的脫機手寫漢字識別與目標檢測研究
發布時間:2024-07-10 18:54
圖像分類與檢測屬于計算機視覺領域重要的研究課題。本文首先研究圖像分類問題,然后進一步深入研究圖像目標檢測。對于圖像分類問題本文選擇脫機手寫漢字識別來進行研究。對于圖像目標檢測本文將分析現有的目標檢測算法及其存在的不足,并對其進行改進。本文將基于深度學習中的卷積神經網絡算法對脫機手寫漢字識別和目標檢測進行研究。主要研究內容如下:(1)由于傳統脫機手寫漢字識別的過程復雜、精度低;而常用卷積神經網絡的特征信息提取不充分。因此,本文設計了網絡模型CharacterNet。首先,通過多級堆疊的特征分組提取模塊,提取圖像的深層抽象特征信息,并進行特征信息之間的交流融合;然后,利用設計的下采樣和通道擴增模塊,在降低特征維度的同時保留圖像重要信息。最后,將特征信息進行精煉和濃縮,來解決特征信息的重疊和冗余問題。本文使用包含3755個漢字的CASIA-HWDB(V1.1)數據集對模型進行訓練和測試,實驗結果驗證了模型的有效性。(2)針對SSD目標檢測算法平均檢測精度低,尤其對小目標的檢測問題經常出現漏檢和誤檢的問題,本文基于VGG網絡設計了多尺度融合的目標檢測算法MFSSD。在算法中使用分步卷積拆分算法...
【文章頁數】:75 頁
【學位級別】:碩士
【部分圖文】:
本文編號:4004577
【文章頁數】:75 頁
【學位級別】:碩士
【部分圖文】:
圖2-11AlexNet網絡模型
燕山大學工學碩士學位論文-18-圖2-11AlexNet網絡模型(2)VGGNet網絡繼AlexNet網絡之后,牛津大學工程系利用3×3大小的卷積核來增加卷積神經網絡的深度,并提出VGGNet網絡模型。VGGNet網絡通過加深網絡結構,所以提取的特征更加豐富和抽象。此外,網絡最后....
圖3-5特征分組示意圖
燕山大學工學碩士學位論文-24-1133輸入特征分組特征整合+輸出特征整合特征整合特征整合特征整合特征整合特征整合特征整合特征整合5577553333111133333311圖3-4改進網絡模塊2圖3-5特征分組示意圖雖然網絡寬度的增加對提升網絡性能有很大幫助,但是隨著寬度增加無....
圖3-13訓練損失
燕山大學工學碩士學位論文-36-習率設置為一個固定的經驗值,此時網絡的訓練會達到比較不錯的效果,但是訓練后期會出現平臺期,甚至出現效果下降的問題;谝陨蠁栴}本文根據訓練情況對學習率采取經驗的手動調整,首先,將學習率設置為0.1來加快收斂速度;然后,當訓練到40000步時將學習率....
圖3-14訓練準確率
燕山大學工學碩士學位論文-36-習率設置為一個固定的經驗值,此時網絡的訓練會達到比較不錯的效果,但是訓練后期會出現平臺期,甚至出現效果下降的問題。基于以上問題本文根據訓練情況對學習率采取經驗的手動調整,首先,將學習率設置為0.1來加快收斂速度;然后,當訓練到40000步時將學習率....
本文編號:4004577
本文鏈接:http://www.malleg.cn/shoufeilunwen/xixikjs/4004577.html

