漢語詞頻的歷時演化研究
發布時間:2025-05-28 00:49
在語言系統的歷時演化過程中,詞的變化速度要快于語音和語法。詞頻,即詞在特定文本或語料庫中的使用頻率,能夠對語言的歷時演化情況進行相對細致的描述和展示。本文從微觀和宏觀兩個角度,運用計量語言學的詞頻研究方法對漢語歷時演化中的一些量變情況進行了考察。在微觀方面,本文以宋元時代、明代、清代和現代四個規模相等的語料庫為基礎,調查了從宋元至今常用代詞在使用頻率方面的量變情況。調查的代詞包括人稱代詞:“我”、“吾”、“我們”、“俺”、“咱”、“你”、“汝”、“你們”、“您”、“他”、“他們”,指示代詞:“這個”、“那個”、“這些”、“那些”、“這里”、“那里”和疑問代詞:“誰”、“什么”、“哪個”、“哪些”、“哪里”。結果顯示,不同代詞在使用頻率方面的歷時變化趨勢或各時代的變化幅度都是不同的。通過對各時代、各代詞使用頻率差異的檢驗、量化和排序,我們對具體代詞在歷時演化中的量變趨勢有了更詳細的了解,也為漢語歷時演化研究中已有的觀點和看法提供了數據支撐,彌補了傳統研究方法在詞頻統計方面的不足。在宏觀方面,本文分兩部分對漢語書面語的歷時發展情況進行了調查:第一部分通過對文言(1855年)、北京官話(190...
【文章頁數】:256 頁
【學位級別】:博士
【部分圖文】:
本文編號:4047815
【文章頁數】:256 頁
【學位級別】:博士
【部分圖文】:
圖2.1對小說《林家鋪子》進行分詞后所形成的詞的秩一頻序列分布??
在這里我們再通過一個中文文本的實例來讓讀者對詞的秩一頻序列分布有更??直觀的理解。??圖2.1是以小說《林家鋪子》的詞頻秩序號為X軸,詞的頻率為Y軸的一??個秩一頻序列分布。其中“的”的秩序號為1,在文中出現的頻率為571次,“了”??的秩序號為2,在文中出現的頻率為467次......
圖2.2小說《林家鋪子》的部分秩一頻序列分布??“”
序弓??圖2.2小說《林家鋪子》的部分秩一頻序列分布??我們將“任意兩個相鄰頻率之間的歐幾里德距離”叫做一個弧段。例如:圖2??中“的”所在的點到“了”所在的點之間的歐幾里德距離就是一個弧段的長度,“了’’??所在的點到“林”所在的點之間的歐幾里德距離又是一個弧段的長度.........
圖3.3“我”使用頻率的歷時分布情況??
?現代??圖3.3“我”使用頻率的歷時分布情況??在圖3.3中,盡管“我”使用頻率的上升趨勢已經十分明顯,但我們對于這種??趨勢的判斷是具有主觀性的,科學地證實或證偽假設不能僅憑主觀判斷就得出結??論。同時,我們需要對“我”使用頻率在不同的變化幅度進行量化,才能判斷出在??哪個時....
圖3.4“吾”使用頻率的歷時分布情況??
圖3.4“吾”使用頻率的歷時分布情況??湘(1985)認為秦漢以后,“吾”可能只存在于書面語中。吳在唐五代,漢語口語中的第一人稱代詞已經完全統一于“我能夠發現,“吾”在宋元到清代引述的人物話語中都有出就從口語中完全消失,而白話文獻能夠反映其所處時代的宋元到明代的白話文獻中“吾”的....
本文編號:4047815
本文鏈接:http://www.malleg.cn/shoufeilunwen/rwkxbs/4047815.html
上一篇:當代藝術展覽觀看方式與設計研究
下一篇:沒有了
下一篇:沒有了

