基于神經網絡集成的模式識別研究
1、引言
人工神經網絡已經在眾多領域得到了成功的應用.隨著應用的深入推廣租實際問題的日益涌現.神經計算的局限與不足逐漸跟現出來,如學習海量信息、時處理速度過慢、泛化能力差、記憶容量有限、需要反復訓練、在接受新信息時易發生失憶現象等c這些缺陷使得人們對傳統人工神經網絡理論的進一步發展提HI了強烈的要求,人們考慮采用多種分類器集成融合的方法來提高識別率c早在1990年.HansSalamont通過實驗證明,一組神經網絡的集成性能優于最好的單一神經網絡的性能,多分類器集成的輸出可明顯改善分類結果。這一研究成果使得集成學習技術尤其是神經網絡集成技術成功的應用到了眾多領域,并取得了較好的效果。
神經網絡集成方法可以合成多個神經網絡的訓練和仿真結果.極大地提高神經網絡系統的泛化能力。在1996年.Sollirh;flKroghl21為神經網絡集成下了一個定義:神經網絡集成是用有限個神經網絡對同一個問題進行學習,集成在某個輸入示例下的輸出山構成集成的各神經網絡在該示例下的輸出共同決定一
2、神經罔蠕集成模型
神經網絡集成通過有限個個體網絡對同一個問題進行學習.
其原理就是通過訓練多個神經網絡并將其結論進行合成川飛其非線性處理能力和泛化能力較之單個網絡更具有優勢,已經應用于多個領域,尤其在信息處理、模式識別、智能控制等領域得到越來越廣泛的應用υ當前對神經網絡集成理論分析的研究主要集中在兩個方面,一個就是對結論生成方法的分析以及對個體網絡生成方法的分析c
2.1集成結論生成
在神經網絡的結論生成方面,吁該集成網絡用與回歸估計時.通常再用各個個體網絡簡單的平均或者加權來產生Co目前已有學者提出來,權值的優化將會導致過配,以至于降低集成的泛化能力,因此建議使用權值的簡單平均。在集成結論生成方面,當前還有采取動態權值的集成方法、貝葉斯方法、各種無約束和約束線性問歸方法等c
另外一種情況是當神經網絡集成用于分類器時,神經網絡集成的結論通常由個體網絡的輸出投票產生,一般采用絕對多數戎相對多數投票法。絕對多數投票法即某分類成為最終結果二~且僅吁有超過半數的神經網絡輸出結果為該分類.相對多數投票法即某分類成為最終結果當且僅吁輸出結果為該分類的神經網絡的數目最多。理論分析和試驗表明,相對多數投票法雯優于絕對多數投票法,目前大多采用相對多數投票法。
2.2個體神經網絡生成
在個體神經網絡生成方面.日前有兩個優秀的算法Boosting和lBaggingoBagging方法的思想是建立在可重復取樣的基礎L.通過從原始訓練集中隨機選取訓練樣卒,兩者的規模相當,也可以重復選取。這會導致訓練集中某些示例在新的訓練集中出現多次,而有些樣本可能不出現Bagging方法就是通過這樣重復選取訓練來增加神經網絡集成的差異度,進而提高泛化能力們
BoostingJf.法的思想是通過依次訓練一組分量分類器,其中每個分量分類器的訓練、集都選擇已有的其它各個分類器所給出的"最富信息"的樣本點組成。分類器的結果決定著最終的判決結果。
2.3噪聲添加原理
已有研究證明組成神經網絡集成的各個體神經網絡的差異越大.集成的效果越好。為了獲取差異性較大的個體網絡,眾多學者通過不同的初始條件、不同的訓練算法和訓練集、差異的網絡拓撲結構來提高網絡間的差異,獲取較好的泛化能力。在神經網絡訓練中,研究者總是希望得到更多的訓練數據,對每個隨機過程通過增加觀察點的數量來增加訓練、樣本。對于現有的有限個樣本,隨機添加一定量的噪聲點來增加樣本個數.這樣就可以用新訓練樣本來訓練個體神經網絡,使不同的個體網絡訓練在不同的樣本集上.增加了個體網絡的泛化能力,也提高了個體神經網絡的預測精度。
3、實驗仿真
水文選用了UCI機器學習知識庫下面的標準數據集來進行模式識別仿真,選用的是Iris數據集。Iris數據集由150組數據組成嘈每組數據包含有四個屬性.分別是等片與花瓣的長度和寬度r
150組數據共分成=之類,其分別是如tosa、Vrsirol()ur和Virginira.這其中每一類共有50組τ在Iris數據集中,本文選用數據集中50%的數據作為生成神經網絡集成的訓練數據,而另外50'3毛的數據用于對生成的神經網絡集成系統進行仿真測試,仿真軟件使用MATLAB7.0.神經網絡集成的結構如下,每個個體網絡均采用反饋神經網絡,采用經典的BP算法進行訓練,筆耕論文新浪博客,輸入節點數即為數據集的屬性值,輸出節點數是數據集的類數c通過訓練得到了泛化性能較好的集成系統,通過對余下50%的數據的仿真識別,結果顯示,識別來分別為:Stosa(96%)。
4、結語
本文提出了通過將噪聲添加到神經網絡的訓練樣本集中來增大訓練樣本集,是不同的個體網絡能使用差異較大的訓練數據,以此來提高集成系統的精度以及集成中個體網絡的差異度,得到的人工神經網絡集成.個體網絡差異性大,泛化性能好,并將該方法應用于模式識另IJ實驗中巳通過對UCI下的標準數據集Iris數據集進行模式識別實驗,仿真結果驗證了本方法的可行性與有效性,同時也驗證了本方法在解決個體網絡差異性問題上的實用性。
本文由整理發布,轉載請注明出處!
本文編號:5993
本文鏈接:http://www.malleg.cn/kejilunwen/jisuanjikexuelunwen/5993.html

