Sie befinden Sich nicht im Netzwerk der Universität Paderborn. Der Zugriff auf elektronische Ressourcen ist gegebenenfalls nur via VPN oder Shibboleth (DFN-AAI) möglich. mehr Informationen...
Ergebnis 21 von 26
自然言語処理, 2013/12/13, Vol.20(5), pp.727-748

Details

Autor(en) / Beteiligte
Titel
歴史的日本語資料を対象とした形態素解析
Ist Teil von
  • 自然言語処理, 2013/12/13, Vol.20(5), pp.727-748
Ort / Verlag
一般社団法人 言語処理学会
Link zum Volltext
Quelle
EZB*
Beschreibungen/Notizen
  • 単語情報がタグ付けされた本格的な通時コーパスを構築するためには,歴史的な日本語資料の形態素解析が必要とされるが,従来はこれを十分な精度で行うことができなかった.そこで,現代語用の UniDic に語彙の追加を行い,明治時代の文語文と平安時代の仮名文学作品のコーパスを整備することで,「近代文語 UniDic」と「中古和文 UniDic」を作成した.この辞書によりコーパス構築に利用可能な約 96~97% での解析が可能になった.この辞書の学習曲線をもとに歴史的資料の形態素解析辞書に必要な訓練用のタグ付きコーパスのサイズを調査した結果,約 5 万語のコーパスで精度 95% を超える実用的な解析が可能になること,5,000 語程度の少量であっても対象テキストの訓練コーパスを用意することが有効であることを確認した.
Sprache
Japanisch
Identifikatoren
ISSN: 1340-7619
eISSN: 2185-8314
DOI: 10.5715/jnlp.20.727
Titel-ID: cdi_jstage_primary_article_jnlp_20_5_20_727_article_char_ja

Weiterführende Literatur

Empfehlungen zum selben Thema automatisch vorgeschlagen von bX