Text Block Recognition in Multi-Oriented Handwritten Documents
Herzog, Rainer ; Solth, Arved ; Neumann, Bernd
URL | http://edoc.sub.uni-hamburg.de/informatik/volltexte/2014/207/ |
---|---|
Dokumentart: | Report (Bericht) |
Institut: | Fachbereich Informatik |
Schriftenreihe: | Berichte des Fachbereichs Informatik der Universität Hamburg |
Bandnummer: | 301 |
Sprache: | Englisch |
Erstellungsjahr: | 2014 |
Publikationsdatum: | 25.11.2014 |
Freie Schlagwörter (Deutsch): | Dokument Layout Analyse , Manuskript , Textblock Erkennng , Gabor Transformation |
Freie Schlagwörter (Englisch): | document layout analysis , manuscript , text block recognition , Gabor Transform |
DDC-Sachgruppe: | Informatik |
BK - Klassifikation: | 54.74 |
Kurzfassung auf Deutsch:
Die automatische Erkennung von Textblöcken auf digitalisierten Dokumenten ist häufig eine Voraussetzung für die Anwendung von Zeichenerkennungs- oder "Word-spotting"-Methoden. Unser Ansatz erkennt Textblöcke mittels Gabor Transformation auf historischen handschriftlichen Dokumenten. Häufig findet man neben einem Haupttextblock Randtexte, deren Textgröße, Orientierung und Abmessungen deutlich variieren. Um auch solche Randtexte erfassen zu können, werden von unserer Methode keine Vorannahmen bezüglich Textblockanzahl, Position, Textgröße, Textblockgröße oder Form gemacht. Einzige Voraussetzungen sind ein Mindestumfang von drei Zeilen bei annähernd gleichartigem Abstand und Orientierung. Gute Resultate wurden auf 40 der zur Auswertung benutzten Dokumente erzielt. Diese stammen aus unterschiedlichen Quellen mit verschiedenem Layout in europäischen und asiatischen Schreibsystemen.
Kurzfassung auf Englisch:
Automatic detection of text blocks is an important step before applying OCR or word-spotting techniques to document images. Our approach focusses on handwritten (historical) documents and uses the Gabor Transformation to facilitate this task. Apart from the main text, which often consists of rectangular shaped text blocks, marginalia are of special interest here. These areas are generally unconstrained regarding size, dimensions or orientation. Our system detects text blocks of at least three lines, representing a moderately homogeneous region regarding orientation and distances of text lines. Experiments on 40 documents, written in different european and asian writing systems, show good results, depending on the complexity of the layout.
Hinweis zum Urherberrecht
Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:
Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.
Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.