基于深度學習的藏文問答系統研究
發布時間:2024-07-09 06:24
問答系統的目標是讓機器能夠理解人類以自然語言的形式提出的問題,并且返回一個準確地、簡練的答案。近年來,知識庫的迅速發展為問答系統的研究提供了豐富而又便捷的資源支撐。因此知識庫問答越來越受到工業界和學術界的關注。目前,知識庫問答系統在中英文領域取得成績較為顯著,同時越來越多的研究者投身其中。然而,藏文問答系統的研究還處于探索階段,尤其是藏文知識庫問答的研究,存在著許多挑戰。首先,藏文屬于低資源語言,相比較中英文,藏文問答語料庫稀少。其次,藏文知識庫數據稀疏,傳統的表示方式無法很好對知識庫進行表示學習。最后,在藏文問答語料庫規模較少的情況下,如何利用深度學習進行藏文問句的特征抽取和答案返回是藏文知識庫問答重要研究內容。針對以上問題,本文研究了基于深度學習的藏文知識庫問答,主要工作如下:(1)為了自動擴充藏文問答語料庫,本文提出兩種方法進行問答語料庫構建:基于圖的半監督模型算法和基于深度學習的QuGAN模型算法。基于圖的半監督模型主要是利用已構建的藏文知識庫,將知識庫模型與實體(關系)類型相結合,自動構建藏文問句模板和事實性問句。基于深度學習的QuGAN模型首先通過最大似然估計對隨機問題進行...
【文章頁數】:96 頁
【學位級別】:碩士
【部分圖文】:
本文編號:4004532
【文章頁數】:96 頁
【學位級別】:碩士
【部分圖文】:
圖2-1?RNN基本模型以及展開圖??-
要思想是通過記住序列的歷史信息來處理序列任務。RNN之所以稱為循環神經??網絡,在于RNN當前時刻的輸出不僅僅當前時刻的輸入有關,同時還與RNN上??一時刻的輸出有關。如圖2-1左半部分展示了一個RNN基本單元的結構框架,??圖2-1的右半部分展示了?RNN隨時間步驟(即輸入序列....
圖2-2?LSTM網絡單元結構??LSTM網絡單元的關鍵在于細胞狀態(cell?state)?C的更新
??圖2-2?LSTM網絡單元結構??LSTM網絡單元的關鍵在于細胞狀態(cell?state)?C,的更新。如圖2-2所示,??細胞狀態在一條直線上進行更新和傳遞,只涉及線性操作。所以,細胞狀態就類??似于傳送帶,沿著LSTM網絡層進行信息傳遞,而傳遞的信息因為沒有涉及非線??....
圖2-3最大池化層??-
?-'2??圖2-3最大池化層??圖2-3是在2x2的局部窗口中進行最大池化操作,原始的輸入被劃分為四個??不同的子區域,在通過對每個區域進行取最大值操作,得到池化層的輸出。??2.?3語言模型??語言模型是自然語言處理領域一個基本卻又非常重要的任務。它主要就是通??過計算一堆詞....
圖2-6ELMo語言模型
Sample:?{w,Cont^xt{w)}??圖?2-5?Skip-Gram?模型??2.?3.?3?ELMo?模型??ELMo模型[76]主要是一種通用詞和句子嵌入的方法,主要利用深度上下文??單詞表示,能夠處理單詞用法中的復雜特性,比如句法和語義。同時能夠感知單??詞在不同....
本文編號:4004532
本文鏈接:http://www.malleg.cn/wenyilunwen/yuyanyishu/4004532.html
上一篇:關聯理論視角下網絡熱詞的翻譯
下一篇:沒有了
下一篇:沒有了

