A Case Study in Part-of-Speech Tagging Using the ICOPOST Toolkit

URN urn:nbn:de:gbv:18-228-7-1247
URL
Dokumentart: Report (Bericht)
Schriftenreihe: Mitteilungen des Fachbereichs Informatik der Universität Hamburg
Bandnummer: 314
Sprache: Englisch
Erstellungsjahr: 2002
Publikationsdatum:
SWD-Schlagwörter: Angewandte Informatik , Sprachverarbeitung
Freie Schlagwörter (Englisch): speech recognition
DDC-Sachgruppe: Informatik
BK - Klassifikation: 54.00 , 54.89 , 54.75

Kurzfassung auf Englisch:

Part-of-speech tagging is an important processing step for many natural language systems. It has been tackled with a number of different approaches, both machine learning algorithms and methods relying on rules that are hand crafted by human experts. This paper investigates and compares four of the more popular machine learning approaches to POS tagging that have been implemented within the ICOPOST toolkit which is freely available under the GNU public license from the author's home page at http://nats-www.informatik.uni-hamburg.de/~ingo/icopost/.

Hinweis zum Urherberrecht

Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:

Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.

Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.