How to identify elliptical poems within a digital corpus of auditory poetry
Hussein, Hussein ; Meyer-Sickendiek, Burkhard ; Baumann, Timo
URN | urn:nbn:de:gbv:18-228-7-2579 |
---|---|
URL | http://edoc.sub.uni-hamburg.de/informatik/volltexte/2021/257/ |
Dokumentart: | InProceedings (Aufsatz / Paper einer Konferenz etc.) |
Institut: | Fachbereich Informatik |
Sprache: | Englisch |
Erstellungsjahr: | 2019 |
Publikationsdatum: | 03.12.2021 |
Originalveröffentlichung: | Proceedings of Elektronische Sprachverarbeitung (ESSV), 2019 (2019) |
Freie Schlagwörter (Deutsch): | Digital Humanities , post-moderne Lyrik , Stilerkennung , Ellipse |
Freie Schlagwörter (Englisch): | digital humanities , free verse poetry , style detection , ellipsis |
DDC-Sachgruppe: | Informatik |
BK - Klassifikation: | 54.75 , 17.77 , 17.83 |
Kurzfassung auf Englisch:
Ellipses denote the omission of one or more grammatically necessary phrases. In this paper, we will demonstrate how to identify such ellipses as a rhythmical pattern in modern and postmodern free verse poetry by using data from lyrikline which contain the corresponding audio recording of each poem as spoken by the original author. We present a feature engineering approach based on literary analysis as well as a neural networks based approach for the identification of ellipses within the lines of a poem. A contrast class to the ellipsis is defined from poems consisting of complete and correct sentences. The feature-based approach used features derived from a parser such as verb, comma, and sentence ending punctuation. The classifier of neural networks is trained on the line level to integrate the textual information, the spoken recitation, and the pause information between lines, and to integrate information across the lines within the poem. A statistic analysis of poet's gender showed that 65% of all elliptical poems were written by female poets. The best results, calculated by the weighted F-measure, for the classification of ellipsis with the contrast class is 0.94 with the neural networks based approach. The best results for classification of elliptical lines is 0.62 with the feature-based approach.
Hinweis zum Urherberrecht
Für Dokumente, die in elektronischer Form über Datenenetze angeboten werden, gilt uneingeschränkt das Urheberrechtsgesetz (UrhG). Insbesondere gilt:
Einzelne Vervielfältigungen, z.B. Kopien und Ausdrucke, dürfen nur zum privaten und sonstigen eigenen Gebrauch angefertigt werden (Paragraph 53 Urheberrecht). Die Herstellung und Verbreitung von weiteren Reproduktionen ist nur mit ausdrücklicher Genehmigung des Urhebers gestattet.
Der Benutzer ist für die Einhaltung der Rechtsvorschriften selbst verantwortlich und kann bei Mißbrauch haftbar gemacht werden.