Annotation und Evaluation deutschsprachiger Hotelbewertungen für die Aspekt-basierte Sentiment Analyse
- Thema:
- Annotation und Evaluation deutschsprachiger Hotelbewertungen für die Aspekt-basierte Sentiment Analyse
- Art:
- BA
- BetreuerIn:
- Jakob Fehle
- BearbeiterIn:
- Leonie Münster
- ErstgutachterIn:
- Christian Wolff
- ZweitgutachterIn:
- Udo Kruschwitz
- Status:
- abgeschlossen
- Stichworte:
- Sentiment Analyse, Machine Learning, NLP
- angelegt:
- 2022-12-14
- Antrittsvortrag:
- 2023-01-16
Hintergrund
Sentiment Analysen extrahieren Meinungen und Emotionen aus Texten und gehören in den Bereich der natürlichen Sprachverarbeitung. Eine Weiterentwicklung ist die Aspekt-basierte Sentiment Analyse (ABSA). Sie beschäftigt sich genauer mit Bewertungen und Meinungen zu Aspekten eines Themas, wie beispielsweise dem Aspekt der Lage bei einem Hotel. Ziel der ABSA ist die Extraktion der Polarität dieser einzelnen Aspekte durch Methoden des Machine Learning. Deutsche Machine Learning-Methoden sind noch wenig erforscht und evaluiert.
Zielsetzung der Arbeit
Ziel der Arbeit ist die Annotation eines Datensatzes mit deutschsprachigen Hotelbewertungen und die Evaluation durch eine Machine Learning-Methode für die Aspekt-basierte Sentiment Analyse. Die Aspekte und Polaritäten werden mithilfe einer Studie annotiert, um sie anschließend als Trainingsdaten für die Klassifizierung verwenden zu können. Evaluiert wird die Performance eines Transformer(BERT)-Modells.
Konkrete Aufgaben
- Literaturrecherche
- Analyse und Vergleich von Aspekten englischer Hotelbewertungen
- Analyse und Vergleich von Machine Learning-Methoden deutscher Datensätze
- Annotationsanleitung
- Design und Durchführung einer Studie zur Annotation des Datensatzes
- Kuration der Studie und Berechnung des Inter annotator agreements
- Klassifizierung und Evaluation des Transformermodells
- Auswertung und Vergleich mit ähnlichen Ansätzen
- Schriftliche Ausarbeitung
Erwartete Vorkenntnisse
- Machine Learning, NLP
- Python
Weiterführende Quellen
Corvonato, A. (2021, January). Re-Evaluating GermEval 2017: Document-Level and Aspect-Based Sentiment Using Pre-Trained Language Models. (pp.1-87) https://epub.ub.uni-muenchen.de/75190/1/MA_Corvonato.pdf https://github.com/ac74/reevaluating_germeval2017.
Moreno-Ortiz, A. et al. (2018, November). Design and validation of annotation schemas for aspct-based sentiment analysis in the tourism sector. In Information Technology& Tourism (2019). (pp.535-557). https://link.springer.com/content/pdf/10.1007/s40558-019-00155-0.pdf
Qiang, Y. et al. (2020, March). Toward Tag-free Aspect Based Sentiment Analysis: A Multiple Attention Network Approach. (pp.1-8). https://arxiv.org/pdf/2003.09986v1.pdf https://github.com/qiangyao1988/Toward-tag-free-ABSA.
Tran, T., Ba, H. & Huynh,V. (2019, March). Measuring Hotel Review Sentiment: An Aspect-Based Sentiment Analysis Approach. In IUKM 2019. (pp.393-405). https://link.springer.com/chapter/10.1007/978-3-030-14815-7_33.
Wojatzki, M. et al. (2017, September). Proceedings of the GermEval 2017: Shared Task on Aspect-based Sentiment in Social Media Customer Feedback. In Language Technologies for the Challenges of the Digital Age (GSCL 2017) (pp. 1-12). https://www.inf.uni-hamburg.de/en/inst/ab/lt/publications/2017-wojatzkietal-germeval2017-proceedings.pdf.