Many-shot in-context Learning for Aspect-based sentiment analyisis
- Thema:
- Many-shot in-context learning for aspect-based sentiment analysis
- Art:
- BA, MA
- BetreuerIn:
- Nils Constantin Hellwig
- Status:
- ausgeschrieben
- Stichworte:
- LLM, Sentiment Analyse, NLP, ABSA
- angelegt:
- 2025-04-06
Hintergrund
Mit der zunehmenden Verbreitung großer Sprachmodelle (LLMs) hat sich das In-Context Learning (ICL) als eine leistungsfähige Methode zur Modellanpassung ohne explizite Gewichtsaktualisierungen etabliert. Während sich viele Arbeiten auf das Few-Shot ICL konzentrieren, eröffnet die Erweiterung der Kontextfenster aktueller LLMs die Möglichkeit auch große Mengen annotierter Beispiele (shots/demonstrations) in der Prompt bereitzustellen. Dieses Paradigma, “Many-shot in-context learning” wurde nun im Rahmen der NeurIPS 2024 von Goolge untersucht (https://proceedings.neurips.cc/paper_files/paper/2024/file/8cb564df771e9eacbfe9d72bd46a24a9-Paper-Conference.pdf). Leistungsgrenzen und Herausforderungen von Many-Shot ICL wurden bisher im Bereich der ABSA / Sentimentanalyse nicht umfassend erforscht.
Zielsetzung der Arbeit
Ziel dieser Arbeit ist es, das Potenzial von Many-Shot In-Context Learning für die (Aspekt-basierte) Sentimentanalyse systematisch zu untersuchen. Dabei soll (1.) der Einfluss der Menge an In-context Beispiele auf die Modellleistung analysiert werden. Des Weiteren (2.) untersucht werden, inwieweit Many-Shot ICL klassische, feingetunte Modelle in verschiedenen Sentimentanalyse-Aufgaben übertreffen kann und welche Faktoren die Effektivität dieser Methode beeinflussen. Dabei wird ein besonderer Fokus auf unterschiedliche Subtasks (z.B. klassische Sentimentklassifikation, aspektbasierte Sentimentanalyse) gelegt.
Konkrete Aufgaben
- Durchführung einer umfassenden Literaturrecherche zu Many-Shot ICL und Sentimentanalyse.
- Auswahl und Aufbereitung geeigneter Datensätze für Many-Shot ICL.
- Implementierung und Evaluierung von Many-Shot ICL-Ansätzen mit modernen Open-source LLMs.
- Vergleich der Modellleistung mit bestehenden Sentimentanalyse-Methoden (z. B. feingetunte Modelle, Few-Shot ICL).
Erwartete Vorkenntnisse
- Dringend erforderlich: Python
- Dringend erforderlich: Grundkenntnisse in natürlicher Sprachverarbeitung (NLP).
Nice to have:
- Erfahrung im Umgang mit LLM-Schnittstellen (z.B. OpenAI API, Ollama).
- Kenntnisse in NLP Python-Bibliotheken (z.B. Hugging Face Transformers, PyTorch, LangChain, pandas, numpy).
- Erfahrung mit Experimentdesign und Evaluationsmethoden für NLP-Modelle.
Weiterführende Quellen
Nach Absprache mit dem Betreuer.