Platz Eins für UniBw- und Fraunhofer FKIE-Methode zum Erkennen und Bewerten von Behauptungen
Erneuter Erfolg für die Wissenschaftler des Fraunhofer FKIE in Wachtberg: Beim jüngsten Shared Task-Wettbewerb »CLAIMSCAN 2023«, ausgerufen vom Indian Institute of Technology Delhi, landete das System »NLytics« auf dem ersten Platz. Es ist Ergebnis eines gemeinsamen Forschungsprojekts mit der Universität der Bundeswehr München und hat zum Ziel, Beeinflussungs- und Desinformationskampagnen in sozialen Medien mithilfe von KI aufzuspüren.
»Der Siegeszug der sozialen Medien hat unser Kommunikations- und Medienverhalten disruptiv verändert und dazu geführt, dass immer mehr Inhalte unterschiedlichster Art erstellt und ausgetauscht werden«, erläutert FKIE-Projektleiter und CLAIMSCAN-Teilnehmer Albert Pritzkau. Eine nicht nur positive Entwicklung, da diese Plattformen auch den Boden bereiten können für die Verbreitung von Gerüchten, Fake News, Propaganda und Fehlinformationen. Allein die Menge dieser Informationen mache es aber unmöglich, sie effektiv zu identifizieren, so der Wissenschaftler. Die automatische Unterscheidung zwischen glaubwürdigen und falschen Behauptungen sei daher eine wichtige Forschungsaufgabe der Computerlinguistik.
Gelegenheit, den aktuellen Stand ihrer Methoden zu messen, hatten Forschende aus der ganzen Welt nun bei dem vom Indian Institute of Technology Delhi 2023 erstmals ausgerufenen Shared Task-Wettbewerb »CLAIMSCAN«. Als Gewinner ging dabei das deutsche System »NLytics« hervor, entwickelt in einem gemeinsamen Forschungsprojekt der Universität der Bundeswehr München und des Fraunhofer FKIE.
»Der Fokus im Projekt liegt auf der Identifikation gezielt manipulativer Falschmeldungen mithilfe von KI«, so Pritzkau. Der Wissenschaftler hat sich über das Projekt hinaus auch in seiner Promotion intensiv mit der Aufgabenstellung befasst. Mit »NLytics« entwickelte er einen neuen Ansatz, der ein modernes »Machine Learning«-System so erweitert, dass linguistische Merkmale beim Training besser berücksichtigt werden. Zudem verwendet Pritzkau »Explainable AI«, um die Trainingsdaten zu bereinigen. Denn, so der Forscher: »Bekanntlich sind KI-Systeme immer nur so gut wie die zu ihrem Training genutzten Daten.« Durch die Vorverarbeitung der Trainingsdaten nach seinem Ansatz verbessern sich Ergebnisse und Qualität des Systems um Größenordnungen.
»NLytics« sicherte dem Team den Sieg in einer der insgesamt zwei CLAIMSCAN-Teilaufgaben. Die hervorragende Platzierung bestätigt die Ergebnisse der Promotionsarbeit des Wissenschaftlers ein weiteres Mal: Bereits im vergangenen September schnitt Pritzkaus Ansatz beim Shared Task-Wettbewerb »DIPROMAT 2023«, ausgelobt vom Iberian Languages Forum (IberLEF) zur Identifikation von Propaganda, ebenfalls am besten in seiner Kategorie ab.