Computer-based Stroke Extraction in Historical Manuscripts

; ;

URL
Dokumentart: Report (Bericht)
Schriftenreihe: Berichte des Fachbereichs Informatik der Universität Hamburg
Bandnummer: 296
Sprache: Englisch
Erstellungsjahr: 2010
Publikationsdatum:
SWD-Schlagwörter: Dokumentverarbeitung , Mustererkennung , Bildverarbeitung
Freie Schlagwörter (Deutsch): Manuskriptanalyse , Zeichen
Freie Schlagwörter (Englisch): stroke analysis , image analysis
DDC-Sachgruppe: Informatik
BK - Klassifikation: 54.72

Kurzfassung auf Deutsch:

In diesem Bericht wird ein Verfahren zur Extraktion von Strichen in handgeschriebenen Zeichen verschiedener Schriftsysteme vorgestellt. Das Erkennen einzelner Striche als Bestandteile von Zeichen kann für verschiedene Ziele der Manuskriptanalyse, insbesondere der Analyse historischer Manuskripte, von Bedeutung sein, z.B. als Basis für den Vergleich ähnlicher Zeichen, zur Identifizierung von Schreibern, oder zur Zeichenerkennung. Das vorgestellte Verfahren beruht auf der Constrained Delaunay Triangulierung (CDT), die für die Zerlegung ebener Formen vorgeschlagen wurde. Angewandt auf handschriftliche Zeichen markiert das Verfahren anhand von Kontureigenschaften mögliche Anfangs- und Endpunkte sowie Kreuzungen von Strichen. Damit stehen Kontursegmente zur Verfügung, aus denen vollständige Striche gebildet werden können. Es werden experimentelle Ergebnisse für chinesische, amharische und tamilische Zeichen vorgestellt.

Kurzfassung auf Englisch:

Recovering individual strokes in historical manuscripts can provide a valuable basis for various goals of manuscript analysis, e.g. retrieving similar allographs, comparing the handwriting of scribes, or recognising characters. Here we report on stroke analysis using the Constrained Delaunay Triangulation (CDT), previously proposed for shape decomposition in image analysis. Applied to handwritten graphemes, this method marks possible start, end points and intersections of strokes based on local contour properties, thus providing stroke segments from which complete strokes can be formed by concatenation. Results are shown for Chinese, Amharic and Tamil characters.

Hinweis zum Urherberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.