在英語教學和測試領域,作文是檢測英語學習者語言能力的重要指標。評測學習者英語作文通常依靠教師或評分員人工評閱。這一過程需要耗費大量的人力和物力,同時很難保障作文評測的信度和效度。為了克服上述弊端,國內外學者近年來開始借助自然語言處理技術,利用計算機自動評測學習者的作文質量。其中,語法錯誤的自動檢測和修改是作文質量自動評測的重要環節。目前,學習者作文的語法檢測主要采用基于語法規則和基于統計兩種方法,前者有的語言學理論基礎,充分考慮語言的線性和層級結構,但依靠語言學家直覺編寫的語法規則覆蓋面有限,無法檢測涉及搭配和冠詞、介詞等類別的語法錯誤;后者以大規模的真實語料為知識來源,避免了人工編寫規則的繁瑣,且覆蓋面大,但這種方法對語言的層級結構考慮不夠。本研究擬結合上述兩種方法的優點,使用混合法進行自動語法檢查:混合法以語法規則為基礎編寫錯誤模板,同時,從大規模經過詞性和句法標注的語料庫中提取詞匯-語法信息構建模型,彌補模板的不足,提高現有語法檢測系統的率。
面向英語書面語誤自動檢測的依存規則研究》結合基于語法規則和基于統計兩種語法檢測方法的優點,使用混合
法進行自動語法檢查:混合法以語法規則為基礎編寫錯誤模板,同時,從大規模經過詞性和句法標注的語料庫中提
取詞匯-語法信息構建模型,彌補模板的不足,提高現有語法檢測系統的率。
劉磊于2011-2014年間師從北京外國語大學中國外語研究中心的梁茂成教授,獲得外國語言學與應用語言學方向博士學位。本人研究興趣包括語料庫語言學、計算機語言學和計算機輔助英語教學。近年來,本人參與和主持了若干校級和省部級項目,內容涉及英語學習者書面語誤自動檢測和學習者書面語搭配特征研究等,并發表了相關論文。