UNIVERSI
TÄ
TS-
BIBLIOTHEK
P
ADERBORN
Anmelden
Menü
Menü
Start
Hilfe
Blog
Weitere Dienste
Neuerwerbungslisten
Fachsystematik Bücher
Erwerbungsvorschlag
Bestellung aus dem Magazin
Fernleihe
Einstellungen
Sprache
Deutsch
Deutsch
Englisch
Farbschema
Hell
Dunkel
Automatisch
Sie befinden Sich nicht im Netzwerk der Universität Paderborn. Der Zugriff auf elektronische Ressourcen ist
gegebenenfalls
nur via VPN oder Shibboleth (DFN-AAI) möglich.
mehr Informationen...
Universitätsbibliothek
Katalog
Suche
Details
Zur Ergebnisliste
Ergebnis 21 von 26
Datensatz exportieren als...
BibTeX
歴史的日本語資料を対象とした形態素解析
自然言語処理, 2013/12/13, Vol.20(5), pp.727-748
小木曽, 智信
小町, 守
松本, 裕治
Details
Autor(en) / Beteiligte
小木曽, 智信
小町, 守
松本, 裕治
Titel
歴史的日本語資料を対象とした形態素解析
Ist Teil von
自然言語処理, 2013/12/13, Vol.20(5), pp.727-748
Ort / Verlag
一般社団法人 言語処理学会
Link zum Volltext
Quelle
EZB*
Beschreibungen/Notizen
単語情報がタグ付けされた本格的な通時コーパスを構築するためには,歴史的な日本語資料の形態素解析が必要とされるが,従来はこれを十分な精度で行うことができなかった.そこで,現代語用の UniDic に語彙の追加を行い,明治時代の文語文と平安時代の仮名文学作品のコーパスを整備することで,「近代文語 UniDic」と「中古和文 UniDic」を作成した.この辞書によりコーパス構築に利用可能な約 96~97% での解析が可能になった.この辞書の学習曲線をもとに歴史的資料の形態素解析辞書に必要な訓練用のタグ付きコーパスのサイズを調査した結果,約 5 万語のコーパスで精度 95% を超える実用的な解析が可能になること,5,000 語程度の少量であっても対象テキストの訓練コーパスを用意することが有効であることを確認した.
Sprache
Japanisch
Identifikatoren
ISSN: 1340-7619
eISSN: 2185-8314
DOI: 10.5715/jnlp.20.727
Titel-ID: cdi_jstage_primary_article_jnlp_20_5_20_727_article_char_ja
Format
–
Schlagworte
UniDic
,
古文
,
形態素解析
,
歴史コーパス
Weiterführende Literatur
Empfehlungen zum selben Thema automatisch vorgeschlagen von
bX