Sie befinden Sich nicht im Netzwerk der Universität Paderborn. Der Zugriff auf elektronische Ressourcen ist gegebenenfalls nur via VPN oder Shibboleth (DFN-AAI) möglich. mehr Informationen...
Ergebnis 7 von 36
Chinese Computational Linguistics and Natural Language Processing Based on Naturally Annotated Big Data, p.141-152
Volltextzugriff (PDF)

Details

Autor(en) / Beteiligte
Titel
A Hybrid Sentence Splitting Method by Comma Insertion for Machine Translation with CRF
Ist Teil von
  • Chinese Computational Linguistics and Natural Language Processing Based on Naturally Annotated Big Data, p.141-152
Ort / Verlag
Cham: Springer International Publishing
Quelle
Alma/SFX Local Collection
Beschreibungen/Notizen
  • When writing formal articles many English writers often use long sentences with few punctuation marks. Since long sentences bring difficulty to machine translation systems, many researchers try to split them using punctuation marks before translation. But dealing with sentences with few punctuation marks is still intractable. In this paper we use a log linear model to insert commas into proper positions to split long sentence, trying to shorten the length of sub-sentence and benefit to machine translation. Experiment results show that our method can reasonably segment long sentences, and improve the quality of machine translation.
Sprache
Englisch
Identifikatoren
ISBN: 331925815X, 9783319258157
ISSN: 0302-9743
eISSN: 1611-3349
DOI: 10.1007/978-3-319-25816-4_12
Titel-ID: cdi_springer_books_10_1007_978_3_319_25816_4_12
Format

Weiterführende Literatur

Empfehlungen zum selben Thema automatisch vorgeschlagen von bX