研究生: |
劉瑞瓏 Liu, Rey-Long |
---|---|
論文名稱: |
在自然語言處理中語言知識的自動習得 Automatic Acquisition of Linguistic Knowledge for Natural Language Processing |
指導教授: |
蘇豐文
Soo, Von-Wun |
口試委員: | |
學位類別: |
博士 Doctor |
系所名稱: |
電機資訊學院 - 資訊工程學系 Computer Science |
畢業學年度: | 82 |
語文別: | 中文 |
中文關鍵詞: | 自然語言習得; 以解釋為主的學習; 共通的語言學原理 |
外文關鍵詞: | Natural Language Acquisition; Explanation-Based Learning; Universal Linguistic Principles |
相關次數: | 點閱:78 下載:0 |
分享至: |
查詢本校圖書館目錄 查詢臺灣博碩士論文知識加值系統 勘誤回報 |
在自然語言處理中大型語言知識庫的建構往往是一大瓶頸。所以如何能讓
電腦自動地習得處理自然語言的語言知識顯得既重要且有趣。本研究從語
言習得的各相關領域出發以提出一個語言習得上可具實際成效的電腦模型
。這些相關領域包括機器學習理論、語言學理論、及自然語言處理技術。
此模型是一個以解釋為主的語言習得模型。經由將適當且共通的語言學原
理 (Universal Linguistic Principles)整合於以解釋為主的學習(
Explanation- Based Learning) 的環境中,此模型可以快速且有效地習
得文法 (grammar)及字典(lexical)知識。在此語言習得的電腦模型上本
論文並進一步探討語言習得的一些重要問題如完全自動的語言學習(
Fully Automatic Language Learning)及具時效的語言學習(Tractable
Language Learning)。在完全自動的語言學習方面本論文提出一個方法以
期能讓電腦在訓練者只提供自然語言語句的情況下也能習得語法知識。由
於自然語言語句在一般語料庫中很容易獲得,此法可讓電腦習得自然語言
的可行性大為提高。在具時效的語言學習方面本研究發現以往觸發學習的
機制 (Triggering Strategies of Generalization)不能讓電腦在合理的
時間內習得某些語言知識。因此本論文提出一個新的觸發學習的機制,以
期能在同一時限內習得更多的語言知識。本論文分為九章:第一章導論;
第二章提出此一以解釋為主的語言習得模型;第三章介紹此模型如何習得
語法知識;第四章介紹此模型如何習得論旨知識(Thematic Knowledge);
第五章從各方面對此模型進行評估。這些方面包括各共通的語言學原理在
語言習得上的用法及限制、訓練用的語料的搜集及其正當性、及以解釋為
主的學習在語言習得上的貢獻及可能的改進等。第六章描述完全自動的語
言學習的背景及所提出的方法。第七章描述具時效的語言學習的背景及所
提出的觸發學習的機制。第八章介紹此語言習得模型所使用的剖析策略。
第九章結論:透過本研究我們發現經由引進來自各相關領域適當的理論及
技術,並整體地考慮語言習得的要求及問題再據以提出有效的學習策略,
電腦更可以自動地習得它所需但又欠缺的處理自然語言的語言知識。