Many-shot in-context Learning for Aspect-based sentiment analyisis

Thema:: Many-shot in-context learning for aspect-based sentiment analysis
Art:: BA, MA
BetreuerIn:: Nils Constantin Hellwig
Status:: ausgeschrieben
Stichworte:: LLM, Sentiment Analyse, NLP, ABSA
angelegt:: 2025-04-06

Hintergrund

Mit der zunehmenden Verbreitung großer Sprachmodelle (LLMs) hat sich das In-Context Learning (ICL) als eine leistungsfähige Methode zur Modellanpassung ohne explizite Gewichtsaktualisierungen etabliert. Während sich viele Arbeiten auf das Few-Shot ICL konzentrieren, eröffnet die Erweiterung der Kontextfenster aktueller LLMs die Möglichkeit auch große Mengen annotierter Beispiele (shots/demonstrations) in der Prompt bereitzustellen. Dieses Paradigma, “Many-shot in-context learning” wurde nun im Rahmen der NeurIPS 2024 von Goolge untersucht (https://proceedings.neurips.cc/paper_files/paper/2024/file/8cb564df771e9eacbfe9d72bd46a24a9-Paper-Conference.pdf). Leistungsgrenzen und Herausforderungen von Many-Shot ICL wurden bisher im Bereich der ABSA / Sentimentanalyse nicht umfassend erforscht.

Zielsetzung der Arbeit

Ziel dieser Arbeit ist es, das Potenzial von Many-Shot In-Context Learning für die (Aspekt-basierte) Sentimentanalyse systematisch zu untersuchen. Dabei soll (1.) der Einfluss der Menge an In-context Beispiele auf die Modellleistung analysiert werden. Des Weiteren (2.) untersucht werden, inwieweit Many-Shot ICL klassische, feingetunte Modelle in verschiedenen Sentimentanalyse-Aufgaben übertreffen kann und welche Faktoren die Effektivität dieser Methode beeinflussen. Dabei wird ein besonderer Fokus auf unterschiedliche Subtasks (z.B. klassische Sentimentklassifikation, aspektbasierte Sentimentanalyse) gelegt.

Konkrete Aufgaben

Durchführung einer umfassenden Literaturrecherche zu Many-Shot ICL und Sentimentanalyse.
Auswahl und Aufbereitung geeigneter Datensätze für Many-Shot ICL.
Implementierung und Evaluierung von Many-Shot ICL-Ansätzen mit modernen Open-source LLMs.
Vergleich der Modellleistung mit bestehenden Sentimentanalyse-Methoden (z. B. feingetunte Modelle, Few-Shot ICL).

Erwartete Vorkenntnisse

Dringend erforderlich: Python
Dringend erforderlich: Grundkenntnisse in natürlicher Sprachverarbeitung (NLP).

Nice to have:

Erfahrung im Umgang mit LLM-Schnittstellen (z.B. OpenAI API, Ollama).
Kenntnisse in NLP Python-Bibliotheken (z.B. Hugging Face Transformers, PyTorch, LangChain, pandas, numpy).
Erfahrung mit Experimentdesign und Evaluationsmethoden für NLP-Modelle.

Weiterführende Quellen

Nach Absprache mit dem Betreuer.