A Case Study in Part-of-Speech Tagging Using the ICOPOST Toolkit
URL | http://edoc.sub.uni-hamburg.de/informatik/volltexte/2009/124/ |
---|---|
Dokumentart: | Report (Bericht) |
Schriftenreihe: | Mitteilungen des Fachbereichs Informatik der Universität Hamburg |
Bandnummer: | 314 |
Sprache: | Englisch |
Erstellungsjahr: | 2002 |
Publikationsdatum: | 18.12.2009 |
SWD-Schlagwörter: | Angewandte Informatik , Sprachverarbeitung |
Freie Schlagwörter (Englisch): | speech recognition |
DDC-Sachgruppe: | Informatik |
BK - Klassifikation: | 54.00 , 54.89 , 54.75 |
Kurzfassung auf Englisch:
Part-of-speech tagging is an important processing step for many natural language systems. It has been tackled with a number of different approaches, both machine learning algorithms and methods relying on rules that are hand crafted by human experts. This paper investigates and compares four of the more popular machine learning approaches to POS tagging that have been implemented within the ICOPOST toolkit which is freely available under the GNU public license from the author's home page at http://nats-www.informatik.uni-hamburg.de/~ingo/icopost/.
Hinweis zum Urherberrecht
Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:
Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.
Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.