Social Media Monitoring mittels KI und Visual Analytics

Digitale Medien bieten zahlreiche Vorteile. Sie liefern z. B. öffentlich zugängliche Informationen, sind für jeden verfügbar und ermöglichen auch den Austausch von Informationen und Meinungen zwischen Nutzern. Zugleich sind sie durch die Flut an Informationen aber auch unübersichtlich und haben aufgrund intransparenter Algorithmen ihre eigene Verbreitungsdynamik. Das Fraunhofer FKIE hat mit NewsHawk® ein automatisiertes KI-Tool entwickelt, das das Monitoring der Sozialen Medien unterstützt. 

NewsHawk® – Automatisiertes Beobachtungs- und Analyse-Tool für Social Media

© © 123RF/stockbrocker
Die digitalen Medien bieten eine Vielzahl an Informations- und Kommunikationsmöglichkeiten. Sie erleichtern so auch die Verbreitung von Desinformation.

Die digitalen Medien bieten eine Vielzahl von Kanälen und Plattformen, über die sich der Nutzer informieren kann. Sie werden allerdings auch genutzt, um Meinungen und Ansichten darzulegen, und erleichtern so die Verbreitung von Desinformation.

Um Nutzer und Analysten dabei zu unterstützen, im Internet und in den Social Media für sie relevante Beiträge zu finden, hat das Fraunhofer FKIE das Tool NewsHawk entwickelt. Relevante Beiträge können für die Nutzer Informationen, aber auch Desinformationen sein, die etwa über die eigene Institution verbreitet werden. NewsHawk ist eine KI-basierte Monitoring- und Analyseplattform, die verschiedene Werkzeuge vereint. Sie sammelt die Beiträge, verarbeitet, kategorisiert und clustert sie, um sie dann mittels Visual Analytics intuitiv erfassbar darzustellen und so interaktive Analysen zu ermöglichen.

 

Die Datengrundlage für die Analyse bilden öffentlich zugängliche Beiträge aus den Sozialen Medien, zum Beispiel Twitter. Viele Beiträge enthalten Text bis hin zu Links. NewsHawk nutzt Texte und textartige Inhalte sowie verfügbare Metadaten als Grundlage sowohl für das Auffinden von relevanten Beiträgen als auch für deren Analyse.

Die Suche nach relevanten Beiträgen geht von einer Sammlung von Stichwörtern (oder Zeichenketten) aus. Der Nutzer stellt sie in einer Liste zusammen, priorisiert und verknüpft sie ggf. auch miteinander. Die gefundenen Beiträge werden in einer Datenbank abgelegt, dem Nutzer aber auch in Echtzeit angezeigt. Die Präsentation erfolgt in fortwährend aktualisierten Widgets. Diese arbeiten mit unterschiedlichen Priorisierungen und können vom Nutzer gemäß der eigenen Aufgabenstellung konfiguriert werden.

Auf den Datenbankinhalten operieren KI-Algorithmen aus dem Bereich des »Natural Language Processing«. So können die Daten in Clustern und Kategorien, je nach Benutzervorgaben, präsentiert werden. Die Algorithmen können zudem Netzwerke berechnen, die etwa anzeigen, welche Personen, Organisationen, Orte etc. in einem Beitrag zusammen genannt werden oder welche Beitragsautoren von welchen anderen Autoren Inhalte zitieren oder verbreiten. Gerade diese (interaktiven) Netzwerke erlauben Analysten tiefere Einblicke etwa dazu, welche Beitragsautoren Bots sein könnten.

© Fraunhofer FKIE
Oberfläche von NewsHawk: Schlagwörter werden in Abhängigkeit von ihrer Häufigkeit und ihrer Beziehung zu anderen Themen als Bubbles dargestellt.
© Fraunhofer FKIE
Wer zitiert wen: Interaktive Visualisierung von Netzwerkstrukturen in Sozialen Medien.
© Fraunhofer FKIE
Darstellung eines Follower-Netzwerks

pressrelations, NewsGuard und Fraunhofer FKIE kooperieren mit dem Ziel, die Aufdeckung von Desinformation mittels KI zu unterstützen.

Aufgrund der vielfältigen Anwendungsmöglichkeiten nutzen bereits Bundeswehr und Behörden NewsHawk mit unterschiedlicher Schwerpunktsetzung. Auch das Lagezentrum des Bundespresseamts hat die Plattform schon zur Beobachtung der medialen Berichterstattung eingesetzt. In ähnlicher Weise können Unternehmen NewsHawk nutzen, um zu überwachen, was bzw. wie in den Social Media über die eigenen Produkte gesprochen wird, was sich davon für die eigene Werbung eignet und welche Falschbehauptungen aufkommen.  

Seit dem 3. Mai 2021 ist NewsHawk als Marke eingetragen.

 

 

 

 

Das oben links abgebildete Netzwerk bezieht sich auf eine Auswertung, die auf Tweets beruht. Diese Tweets wurden seit dem 24. Februar 2022 gesammelt und beinhalten das Stichwort »Ukraine«. Für die Auswertung wurden deutschsprachige Tweets aus dem Zeitraum Mai 2022 verwendet, die zudem das Stichwort »Waffenlieferungen« nutzen.

Über den in der Abbildung hervorgehobenen zentralen Knoten werden Tweets weiterverbreitet, die sich gegen Waffenlieferungen aussprechen – egal, ob diese ursprünglich von Sahra Wagenknecht, Alice Weidel, »AfDimBundestag« oder anderen gepostet wurden. Dieser zentrale Knoten ist gut sichtbar stark vernetzt. Das führt dazu, dass diejenigen Tweets, die der zentrale Knoten weiterverbreitet, ergänzt um Hashtags oder Kommentare durch das Netzwerk eine sehr große Verbreitung erfahren. Ein großer Teil seines Netzwerks teilt dabei das, was der zentrale Knoten schickt, ohne weitere Kommentierung.

In der Abbildung links ist dies darüber zu erkennen, dass diese Knoten über eine ockerfarbene Verbindung mit dem zentralen Knoten verknüpft sind. Im Gegensatz dazu kommentieren die Knoten, die in der Abbildung über eine hellblaue Kante mit dem zentralen Knoten verbunden sind, dessen Tweets. Die Abbildung rechts zeigt die entsprechende Verteilung. Weiterführende Analysen zeigen, dass zahlreiche Knoten, die Tweets des zentralen Knotens einfach nur weiterleiten, erst in diesem Jahr als Account angelegt wurden, und dass sich diese Account-Knoten alle gegenseitig folgen. Eine solche Struktur weist auf Bot-Netze hin, sodass angenommen werden kann, dass über den zentralen Knoten Beeinflussungskampagnen laufen. Darauf weist auch ein weiterer zentraler Knoten hin, der ähnlich wie der hier gezeigte zentrale Knoten verknüpft ist. Dabei folgen sich auch die beiden zentralen Knoten gegenseitig und ihnen folgen dieselben Weiterverbreitungsknoten.

Die Selbstbeschreibung des zweiten zentralen Knotens lautet übrigens: »Řטsslдиð íšť иісћт ðęя Ғêіиð, ðәя циs טеяиíčћтей шíłł. Ðíé Цкяаіиө טěятәіðígт иіçђт טиšêяе Шөятө. Циsęяә éìgêиә Řөgìěяциg טēяяаäт циš ғüŕ амөяіқ. Ìñťęяęśśөи.«
 

Weitere Informationen zu der Auswertung stellen wir auf Anfrage gerne zur Verfügung.

Qualitative Analyse der Medienberichterstattung zum US-Wahlkampf 2020

Ein besonderer Use Case ergab sich aus der Zusammenarbeit mit pressrelations, einem internationalen Medienbeobachter, und mit NewsGuard, einem Unternehmen, das Nachrichten-Websites bewertet. Ausgewertet wurden in der Zusammenarbeit die Medienberichterstattung zum US-Wahlkampf 2020 und die zur Bundestagswahl 2021. Ein Ergebnis war, dass Donald Trump seine mediale Dominanz gegenüber Joe Biden vorrangig der Verbreitung von Fake News und Desinformation verdankte und dabei durch »nicht-vertrauenswürdige« Medien unterstützt wurde. Die Vertrauenswürdigkeit der Medien ergibt sich dabei aus den Analysen und der Bewertung durch NewsGuard. In Bezug auf die Bundestagswahl konnte festgehalten werden, dass sich Falschmeldungen nur dann verbreiten, wenn sie durch seriöse Medien aufgegriffen werden, auch wenn dies dem Ziel dient, die Falschmeldungen zu widerlegen. 

Anzahl der Beiträge zu Hunter Biden nach Veröffentlichung:  Die Grafik zeigt deutlich den Start der Kampagne am 14. Oktober 2020. Das Medieninteresse ebbte jedoch sehr schnell wieder ab und war bis zum Wahltag nicht mehr relevant.
Anzahl der Beiträge zu Hunter Biden: Die Grafik zeigt deutlich den Start der Kampagne am 14. Oktober 2020. Das Medieninteresse ebbte jedoch sehr schnell wieder ab und war bis zum Wahltag nicht mehr relevant.
KI-basierte Analyse durch das FKIE-Tool: Clustering nach Themen und deren Anteilen an Berichterstattung in vertrauenswürdigen/nicht-vertrauenswürdigen Medien. Säule 10 zeigt die Auswertung der Berichterstattung zum Thema Hunter Biden gemäß des mithilfe des FKIE-Tools durchgeführten Topic Modellings. Einbezogen ist hier zudem die Unterscheidung zwischen vertrauenswürdigen und nicht-vertrauenswürdigen Quellen anhand des NewsGuard-Scores. Der Anteil nicht-vertrauenswürdiger Medien lag bei fast 50 Prozent und damit überdurchschnittlich hoch.
Veröffentlichungen zum Hunter-Biden-Case nach Anzahl und Zeit der Beiträge sowie gesplittet in die fünf Vertrauenswürdigkeitskategorien der Medien gemäß NewsGuard-Score.

Pritzkau, A.; Schade, U. (2021). Vorsicht: mögliche „Fake News“ – ein technischer Ansatz zur frühen Erkennung. In: Klimczak, P.; Zoglauer, T. (eds). Wahrheit und Fake im postfaktisch-digitalen Zeitalter. ars digitalis. Springer Vieweg, Wiesbaden.

Automatisierte Jagd nach Desinformation. Analyse-Plattform »NewsHawk®« analysiert Social Media-Beiträge. Erschienen auf InnoVisions – Das Zukunfstmagazin des Fraunhofer-Verbunds IUK-Technologie.

Winkelholz, C.; Schade, U. (2020). NewsHawk zur Lagefeststellung – Beobachten und Analysieren im öffentlichen Informationsraum. Crisis Prevention, 3/2020, 62–64.

Schade, U. & Pritzkau, A. (2024). Social Media als OSINT-Quelle für Demonstrationslagen. In: Honekamp, W. & Labudde, D. (Hrsg.), Polizei-Informatik 2024 (S. 146-152). Remscheid: Rediroma-Verlag.

Pritzkau, A., Waldmüller, J., Blanc, O., Geierhos, M. & Schade, U. (2023). Current language models’ poor performance on pragmatic aspects of natural language. Forum for Information Retrieval Evaluation (FIRE 2023) – CLAIMSCAN 2023. Goa, Indien.

Pritzkau, A., Decher, S. & Schade, U. (2022). Enhancing trust in AI systems for text classification through quantification of training data, NATO IST-195-Symposium, Stockholm, Sweden.

Pritzkau, A., Blanc, O., Geierhos, M. & Schade, U. (2022). NLytics at CheckThat! 2022: Hierarchical multi-class fake news detection of news articles exploiting the topic structure. In Proceedings of the 13th International Conference of the CLEF Association: Information Access Evaluation meets Multilinguality, Multimodality, and Visualization (S. 629-648), Bologna, Italy.

Schade, U., Meißner, F., Pritzkau, A. & Verschitz, S. (2021). Prebunking als Möglichkeit zur Resilienzsteigerung gegenüber Falschinformationen in Online-Medien. In: Zowislo-Grünewald, N. & Wörmer, N. (Hrsg.), Kommunikation, Resilienz und Sicherheit (pp. 134-155). Berlin: Konrad-Adenauer-Stiftung.

»Unser Tool lässt sich für jeden Kunden individuell anpassen. Die Bedienung ist leicht, sodass jeder Nutzer seine eigenen Beispielbibliothken anlegen und die Klassifikation mit diesen trainieren kann.«

Prof. Dr. Ulrich Schade, Forschungsgruppenleiter »Informationsanalyse«