Datensatz E-Beratung

Erstellung eines öffentlichen Datensatzes für die Untersuchung maschineller Lernverfahren in der psychosozialen Online-Beratung. Ein kooperatives Projekt der Fakultät für Informatik, Prof. Jens Albrecht und des Instituts für E-Beratung, Fakultät Sozialwissenschaften, Prof. Robert Lehmann. (Gefördert durch Vorlaufforschungsmittel der TH Nürnberg 2023)


Ziel des Projektes ist die Erstellung und Veröffentlichung eines ersten deutschsprachigen Datensatzes für die Inhaltsanalyse in der psychosozialen Beratung. Er soll frei verfügbaren Trainingsdaten bieten, mit denen entsprechende Modelle erforscht werden können. Daneben soll auch ein bereits trainiertes Klassifikationsmodell publiziert werden, das direkt für die Textkategorisierung eingesetzt und als Benchmark für andere Modelle genutzt werden kann. Dafür werden inhaltlichen Kategorien definiert, die erkannt werden können (z.B. „Mitgefühl“, „Reflektion“, „offene Frage“).

Dieser Datensatz wird nach Veröffentlichung den englischen Namen GECCo (German E-Counseling Conversations Dataset) tragen.

Veröffentlichungen

  • Konzeption und Aufbau eines Daten-Pools für Analyse- und Trainingsdaten einschließlich Möglichkeiten zur Datenkatalogisierung, Suche und rechtebasierter Zugriffsteuerung. Andreas Bendheimer (BA 2023, Wirtschaftsinformatik: Prof. Dr. Jens Albrecht)

Ähnliche Themen