Sie befinden Sich nicht im Netzwerk der Universität Paderborn. Der Zugriff auf elektronische Ressourcen ist gegebenenfalls nur via VPN oder Shibboleth (DFN-AAI) möglich. mehr Informationen...
Ergebnis 5 von 6
2011 International Conference on Document Analysis and Recognition, 2011, p.779-783
2011
Volltextzugriff (PDF)

Details

Autor(en) / Beteiligte
Titel
A Table Detection Method for Multipage PDF Documents via Visual Seperators and Tabular Structures
Ist Teil von
  • 2011 International Conference on Document Analysis and Recognition, 2011, p.779-783
Ort / Verlag
IEEE
Erscheinungsjahr
2011
Quelle
IEEE
Beschreibungen/Notizen
  • Table detection is always an important task of document analysis and recognition. In this paper, we propose a novel and effective table detection method via visual separators and geometric content layout information, targeting at PDF documents. The visual separators refer to not only the graphic ruling lines but also the white spaces to handle tables with or without ruling lines. Furthermore, we detect page columns in order to assist table region delimitation in complex layout pages. Evaluations of our algorithm on an e-Book dataset and a scientific document dataset show competitive performance. It is noteworthy that the proposed method has been successfully incorporated into a commercial software package for large-scale Chinese e-Book production.
Sprache
Englisch
Identifikatoren
ISBN: 1457713500, 9781457713507
ISSN: 1520-5363
eISSN: 2379-2140
DOI: 10.1109/ICDAR.2011.304
Titel-ID: cdi_ieee_primary_6065417

Weiterführende Literatur

Empfehlungen zum selben Thema automatisch vorgeschlagen von bX