A Case Study in Part-of-Speech Tagging Using the ICOPOST Toolkit
URL | http://edoc.sub.uni-hamburg.de/informatik/volltexte/2009/124/ |
---|---|
Document type: | TechReport |
Series: | Mitteilungen des Fachbereichs Informatik der Universität Hamburg |
Volume Number: | 314 |
Language: | English |
Year of creation: | 2002 |
Date of publication: | 18.12.2009 |
Keywords from authority file SWD (German): | Angewandte Informatik , Sprachverarbeitung |
Free keywords (English): | speech recognition |
Dewey Decimal Classification: | Computer science |
BK - classification: | 54.00 , 54.89 , 54.75 |
Abstract in English:
Part-of-speech tagging is an important processing step for many natural language systems. It has been tackled with a number of different approaches, both machine learning algorithms and methods relying on rules that are hand crafted by human experts. This paper investigates and compares four of the more popular machine learning approaches to POS tagging that have been implemented within the ICOPOST toolkit which is freely available under the GNU public license from the author's home page at http://nats-www.informatik.uni-hamburg.de/~ingo/icopost/.
Hinweis zum Urherberrecht
Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:
Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.
Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.