基于知識分詞算法的病案全文檢索系統
發布時間:2025-07-02 00:49
隨著科技的發展和經濟的騰飛,圖書館、新聞出版、企業等單位電子數據激增,可供人們選擇的信息迅速膨脹。這些文檔常常并非存在于結構化的數據庫中,以TXT, DOC, HTML,XML, XLS, PPT, PDF等多種文檔格式存儲。當人們需要某方面信息的時候,就要從這大量的文檔中提取有用的信息。然而目前的全文檢索系統或因特網搜索對中文信息在查全率和查準率很難讓用戶滿意,這很大程度上與中文的語言特性相關。 本課題的研究重點是中文分詞。漢語自動分詞是中文信息處理技術的“瓶頸”問題。各類分詞算法不下幾十種。圍繞提高分詞效率和精度,減少歧義,本文提出了知識分詞的思路,以各類知識體系為基礎建立分詞系統。 數據庫全文檢索技術也獲得了蓬勃的發展。各大數據庫廠商大都為自己的數據庫配置了全文檢索引擎。由于這種引擎是完全集成在數據庫中的,因此具有很高的效率,并且管理方便,易于使用,容易與數據庫應用系統相關聯。本課題利用ORACLE大型數據庫提供的全文檢索引擎Oracle Text 建立一個病案全文檢索系統,并將分詞系統與Oracle Text建立關聯,提高全文檢索的查全率與查準率。...
【文章頁數】:59 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 概述
1.1 課題意義
1.2 自然語言處理技術的理論基礎
1.3 課題的研究策略和論文組織
第二章 全文檢索技術
2.1 信息檢索的發展過程
2.2 全文檢索技術的發展
2.3 全文檢索的特點
2.4 全文檢索所面臨的問題
2.5 全文檢索的方法
第三章 中文分詞算法
3.1 分詞的由來
3.2 自動分詞方法與技術
3.3 目前存在的問題
3.4 自動分詞的作用與發展
3.5 本章小結
第四章 知識分詞系統的研究
4.1 知識分詞的相關理論
4.2 知識分詞系統研究及實現
4.3 歧義校正
第五章 病案全文檢索系統的實現
5.1 系統需求說明
5.2 ORACIE CONTEXT全文檢索的實現
5.3 運行過程與結果分析
第六章 結束語
參考文獻
碩士期間發表的論文
致謝
文獻綜述
本文編號:4054959
【文章頁數】:59 頁
【學位級別】:碩士
【文章目錄】:
摘要
Abstract
第一章 概述
1.1 課題意義
1.2 自然語言處理技術的理論基礎
1.3 課題的研究策略和論文組織
第二章 全文檢索技術
2.1 信息檢索的發展過程
2.2 全文檢索技術的發展
2.3 全文檢索的特點
2.4 全文檢索所面臨的問題
2.5 全文檢索的方法
第三章 中文分詞算法
3.1 分詞的由來
3.2 自動分詞方法與技術
3.3 目前存在的問題
3.4 自動分詞的作用與發展
3.5 本章小結
第四章 知識分詞系統的研究
4.1 知識分詞的相關理論
4.2 知識分詞系統研究及實現
4.3 歧義校正
第五章 病案全文檢索系統的實現
5.1 系統需求說明
5.2 ORACIE CONTEXT全文檢索的實現
5.3 運行過程與結果分析
第六章 結束語
參考文獻
碩士期間發表的論文
致謝
文獻綜述
本文編號:4054959
本文鏈接:http://www.malleg.cn/tushudanganlunwen/4054959.html

