KI-gestützte Sozialwissenschaft: Labeling-Methoden für TikTok News-Inhalte
Das Projekt untersuchte das Anwendungspotenzial von generativer KI als Methode für die Sozialwissenschaften kritisch.
Hintergrund
TikTok entwickelt sich zu einer zentralen Plattform für Nachrichten, Werbung, Politik, Online-Shopping und Unterhaltung mit über 20 Millionen monatlichen Nutzern in Deutschland. Vor allem bei jungen Menschen spielt TikTok eine immer größere Rolle in ihrem täglichen Informationsumfeld. Um die Mechanismen der Informationsverbreitung auf TikTok analysieren zu können, ist eine groß angelegte Inhaltsklassifizierung eine wichtige Voraussetzung für die sozialwissenschaftliche Forschung. Aufgrund des multimodalen Datentyps der TikTok-Inhalte (Video, Audio, Text) bleibt die Klassifizierung eine große Herausforderung. In diesem Projekt nahmen wir uns dieser Herausforderung an und erforschten neue methodische Möglichkeiten, um eine solche Klassifizierung in großem Umfang zu ermöglichen.
Ziel
Zunächst haben wir einen von Expertinnen und Experten kodierten Datensatz von über 8.000 TikTok-News-Videos aus dem Jahr 2023 bereitgestellt. Die Kodierung umfasste deskriptive Variablen über den formalen Charakter der Videos und theoretisch abgeleitete Konzepte aus den Kommunikationswissenschaften. Aufbauend auf diesem Datensatz haben wir die Fähigkeit generativer KI-Lösungen untersucht, multimodale Social-Media-Inhalte zu labeln.
Aktuelle Publikationen
-
Dataset Paper: News on TikTok: An Annotated Dataset of TikTok Videos from German-Speaking News Outlets in 2023. AAAI ICWSM Dataset Paper.
-
Dataset: News on TikTok: An Annotated Dataset of TikTok Videos from German-Speaking News Outlets in 2023 [Datensatz], GESIS datorium.
-
Blog Post: Tutorial: When and how to use the official TikTok API. Weizenbaum Methods Blog.