CASoTex

Computergestützte Analyse Sozialwissenschaftlicher Texte mit Hilfe maschineller Lernverfahren – ein kooperatives Projekt des Instituts für E-Beratung, Fakultät Sozialwissenschaften, Prof. Robert Lehmann und der Fakultät für Informatik, Prof. Jens Albrecht. (Gefördert durch Vorlaufforschungsmittel der TH Nürnberg 2019)


Ziel war die Erforschung der Einsatzmöglichkeiten computerlinguistischer Methoden und maschineller Lernverfahren zur automatisierten Analyse sozialwissenschaftlicher Texte. Die Datengrundlage bildeten digital vorliegende Beiträge aus moderierten, sozialen Beratungsforen. Anhand konkreter sozialwissenschaftlicher Fragestellungen zu Wirkungszusammenhängen in der Onlineberatung sollte untersucht werden, inwiefern Computer-Linguistik und maschinelle Lernverfahren qualitative Analysen unterstützen bzw. ergänzen können, wo die Grenzen der Verfahren liegen und wie bei deren Einsatz vorzugehen ist. Im Projekt wurden erste konkrete Erkenntnisse generiert, der Forschungsverbund vergrößerte sich, Praxis-Forschungsprojekte wurden beantragt und es entstanden weitere Überlegungen zu größeren Forschungsprojekten. Die aktuellen Ergebnisse sind vielversprechend. Überwachte Lernverfahren können mit ausreichend vielen und gut vorbereiteten Trainingsdaten interpretierbare und verwertbare Erkenntnisse liefern.

Onlineberatung wird computervermittelt durchgeführt, somit sind alle Elemente des Beratungsprozesses digital vorhanden. Da Onlineberatung in den letzten Jahren bereits in vielen Kontexten eingesetzt wurde, liegen an verschiedenen Stellen große Mengen dieser Daten vor.
Damit entsteht die für Soziale Arbeit relativ einmalige Situation, dass das fachliche Handeln der BeraterInnen nahezu vollständig dokumentiert ist. Weiterhin bietet diese Tatsache die Chance, durch geeignete Datenanalyseverfahren ein tieferes Verständnis des Beratungsprozesses und der Wirkungszusammenhänge der beraterischen Interventionen zu erlangen. Bisher konnten diese Daten mit den klassischen Methoden der sozialwissenschaftlichen Text- und Inhaltsanalyse untersucht werden. Da diese Verfahren alle sehr aufwändig sind, konnten damit nie größere Datenbestände vollständig untersucht werden, sondern es mussten relativ kleine Stichproben gebildet werden. Mit Hilfe maschineller Lernverfahren aus den Bereichen Big Data, Text Mining und Natural Language Processing besteht nun die Möglichkeit, auch sehr großen Datenmengen wissenschaftlich zu analysieren.


Ergebnisse

Lehmann, Robert; Albrecht, Jens & Zauter, Sigrid (voraus. 2021): Die Computerunterstützte Analyse Sozialwissenschaftlicher Texte – Ergebnisse des Forschungsprojekts „Casotex“ in der psychosozialen Onlineberatung. In: Carolin Freier; Joachim König; Arne Manzeschke & Barbara Städtler-Mach (Hrsg.): Gegenwart und Zukunft sozialer Dienstleistungen. Wiesbaden: Springer.

Grandeit, Philipp; Haberkern, Carolyn; Lang, Maximiliane; Albrecht, Jens & Lehmann, Robert (2020): Using BERT for Qualitative Content Analysis in Psycho-Social Online Counseling. 4TH WORKSHOP ON NLP AND CSS at the EMNLP 2020 The 2020 Conference on Empirical Methods in Natural Language Processing. https://www.aclweb.org/anthology/2020.nlpcss-1.2/

Lehmann, Robert; Albrecht, Jens & Zauter, Sigrid (2020): CaSoTex, Computerunterstützte Analyse Sozialwissenschaftlicher Texte. E-Beratung, 2020 (1). doi: 10.34646/thn/ohmdok-619. https://opus4.kobv.de/opus4-ohm/files/619/CaSoTex-Abschlussbericht2.pdf (pdf 464 KB)


Studentische Arbeiten

Prof. Dr. Jens Albrecht an der Fakultät Informatik und Prof. Dr. Robert Lehmann an der Sozialwissenschaftlichen Fakultät bieten in Zusammenarbeit mit dem Institut für E-Beratung interessierten Bachelor- oder Masterstudierenden der TH Nürnberg Unterstützung bei studentischen Arbeiten an.

  • Konzeption und Implementierung einer Web-Applikation für die interaktive Visualisierung, Modellierung und Filterung textueller Daten, Kaan Götürmen (BA 2021, Informatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
  • Anwendung der Modelle für die Erkennung qualitativer Katogerien und Emotionen zur Erkennung von Mustern in Beratungskonversationen, Marco Reichart (BA 2021, Informatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
  • Emotionsanalyse von automatisch übersetzten Texten mithilfe maschineller Lernverfahren, Amelie Schmidt (BA 2020, Informatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
  • Implementierung einer erweiterbaren Webanwendung zur interaktiven Textvisualisierung, Philipp Jäger (BA 2020, Informatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
  • Untersuchung aktueller maschineller Lernverfahren zur Erkennung von Emotionen in Beratungsverläufen, Adam Konieczny (BA 2019, Informatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
  • Einsatz maschineller Lernverfahren zur automatischen Erkennung psycho-sozialer Kategorien in Forenbeiträgen, Anna Zvurska (BA 2019, Informatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
  • Anonymisierung von natürlichsprachigen Texten, Armin Bredow (MA 2019, Informatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
  • Erkennung forenübergreifender, psychosozialer Fragestellungen über computergestützte Textanalyse. Lena Kallenbach, Sandra Schumann, Saskia Spengler, Dominik Wagner, Valeria Wilhelm (IT-Projekt 2019, Informatik: Prof. Jens Albrecht, Institut für E-Beratung Prof. Robert Lehmann)
  • Parametrisierte Visualisierungsinstrumente von Ergebnissen automatisierter Inhaltsanalyse, Simona Pankatova, (BA 2019, Wirtschaftsinformatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
  • Qualitativen Inhaltsanalyse nach Mayring an Datensätzen zur psychosozialen Forenberatung: Erstellung eines prototypischen Kategoriensystems nach Mayring. Überprüfung des Kategoriensystems am Material. Übertragung des Kategoriensystems in die Casotex-Software. Kodieren möglichst großer Teile der Datenbasis. (Projektgruppe (WiSe 2018/19) aus dem Master Soziale Arbeit bei Prof. Lehmann)
  • Inhaltsanalyse von sozialen Beratungsforen mit maschinellen Lernverfahren, Jean-Pierre Widerhold, (BA 2018/19, Wirtschaftsinformatik: Prof. Jens Albrecht, Institut für E-Beratung: Prof. Robert Lehmann)
  • Analyse der bke Elternberatungsforums mit unüberwachten Lernverfahren. Viktor Schuller, Jean-Pierre Widerhold, Anna Zvurszka (Arbeitsgruppe (SoSe 2018) im Rahmen der Informatik Vorlesung „Text Analytics“ von Prof. Jens Albrecht)