Sie befinden Sich nicht im Netzwerk der Universität Paderborn. Der Zugriff auf elektronische Ressourcen ist gegebenenfalls nur via VPN oder Shibboleth (DFN-AAI) möglich. mehr Informationen...
Ergebnis 18 von 26441
Lecture notes in computer science, 2004, p.217-226
2004

Details

Autor(en) / Beteiligte
Titel
The Enron Corpus: A New Dataset for Email Classification Research
Ist Teil von
  • Lecture notes in computer science, 2004, p.217-226
Ort / Verlag
Berlin, Heidelberg: Springer Berlin Heidelberg
Erscheinungsjahr
2004
Link zum Volltext
Quelle
Alma/SFX Local Collection
Beschreibungen/Notizen
  • Automated classification of email messages into user-specific folders and information extraction from chronologically ordered email streams have become interesting areas in text learning research. However, the lack of large benchmark collections has been an obstacle for studying the problems and evaluating the solutions. In this paper, we introduce the Enron corpus as a new test bed. We analyze its suitability with respect to email folder prediction, and provide the baseline results of a state-of-the-art classifier (Support Vector Machines) under various conditions, including the cases of using individual sections (From, To, Subject and body) alone as the input to the classifier, and using all the sections in combination with regression weights.
Sprache
Englisch
Identifikatoren
ISBN: 9783540231059, 3540231056
ISSN: 0302-9743
eISSN: 1611-3349
DOI: 10.1007/978-3-540-30115-8_22
Titel-ID: cdi_pascalfrancis_primary_16144318

Weiterführende Literatur

Empfehlungen zum selben Thema automatisch vorgeschlagen von bX