UB Paderborn / Katalog / Suche / Details

Ergebnis 21 von 26

自然言語処理, 2013/12/13, Vol.20(5), pp.727-748

Autor(en) / Beteiligte

Titel

歴史的日本語資料を対象とした形態素解析

Ist Teil von

Ort / Verlag

一般社団法人　言語処理学会

Link zum Volltext

Quelle

EZB*

Beschreibungen/Notizen

単語情報がタグ付けされた本格的な通時コーパスを構築するためには，歴史的な日本語資料の形態素解析が必要とされるが，従来はこれを十分な精度で行うことができなかった．そこで，現代語用の UniDic に語彙の追加を行い，明治時代の文語文と平安時代の仮名文学作品のコーパスを整備することで，「近代文語 UniDic」と「中古和文 UniDic」を作成した．この辞書によりコーパス構築に利用可能な約 96～97% での解析が可能になった．この辞書の学習曲線をもとに歴史的資料の形態素解析辞書に必要な訓練用のタグ付きコーパスのサイズを調査した結果，約 5 万語のコーパスで精度 95% を超える実用的な解析が可能になること，5,000 語程度の少量であっても対象テキストの訓練コーパスを用意することが有効であることを確認した．

Sprache: Japanisch
Identifikatoren: ISSN: 1340-7619
eISSN: 2185-8314
DOI: 10.5715/jnlp.20.727
Titel-ID: cdi_jstage_primary_article_jnlp_20_5_20_727_article_char_ja

Empfehlungen zum selben Thema automatisch vorgeschlagen von bX