Hauptbild

Datensätze werden zum Gegenstand investigativer Recherchen für Journalisten

Christo Buschek, Mozilla 2025 Fellow

Von bahnbrechenden Innovationen bis hin zu kühnen Visionen – unsere 2025 Fellows teilen ihre Prognosen darüber, wohin die Technologie steuert und welche Auswirkungen sie auf die Welt haben könnte.

Vollständige Liste anzeigen →

Lange Zeit war der Diskurs rund um KI entweder „Oh nein, wir sind alle dem Untergang geweiht“ oder „Nur mit KI können wir Krebs heilen“. Aber hinter beiden Narrativen stehen die gleichen Leute, die gleichen Unternehmen und die gleichen Interessen. Im Jahr 2025 werden wir Journalisten die Berichterstattung über Datensätze nutzen, um unsere KI-Berichterstattung zu verbessern und die Interessen hinter der KI zur Rechenschaft zu ziehen.

Um es klar zu sagen: Wir Journalisten haben bei der Berichterstattung über KI lausig abgeschnitten. Anstatt ihr mit Skepsis, Genauigkeit und investigativer Neugier zu begegnen, waren viele von uns von ihr geblendet und entschieden uns dafür, Marketingmaterial nachzuplappern und sie wie ein cooles neues Gadget zu behandeln. Auf den Hype hereinzufallen, hat weder uns noch unserem Publikum einen Gefallen getan.

Ein weiterer Grund ist, dass wir den Satz „KI ist eine Blackbox“ verinnerlicht haben. Wir sagen das, geben auf und gehen weg. Aber wir können es besser machen. Wir müssen es besser machen, wenn wir KI-Systeme und die Unternehmen, die sie entwickeln, für ihre Auswirkungen auf die Welt zur Rechenschaft ziehen wollen.

Es stimmt zwar, dass Modelle nicht-deterministisch und unerklärlich sind, aber die Datensätze, die zum Trainieren dieser Systeme verwendet werden, sind es nicht. Datensätze zeigen, dass KI keine Blackbox ist, sondern eine Ansammlung verschiedener technischer Artefakte und Prozesse. Sie ist das Ergebnis von Entscheidungen und Werten und ein Produkt der Kultur, aus der sie stammt. Und wenn wir uns die Datensätze, die zum Trainieren dieser unglaublich komplexen Maschinen verwendet werden, genauer ansehen, erkennen wir tatsächlich die Modelle, die sie antreiben, und lernen die neuen Auswirkungen algorithmischer Systeme kennen.

Großartige Reporter beginnen bereits, die Bausteine von KI-Produkten zu untersuchen, um zu verstehen, wie sie hergestellt werden. Journalisten haben gezeigt, dass YouTube-Videos – die ohne die Zustimmung ihrer Urheber entwendet wurden – in KI-Trainingsdatensätzen zu finden sind. Sie deckten Communities und Unternehmen hinter Deepfake-Intimfotos ohne Zustimmung auf und identifizierten Nazi-Propaganda in Trainingsdatensätzen. Seit vielen Jahrzehnten hat sich die investigative Methode als ein mächtiges Werkzeug für Transparenz und Rechenschaftspflicht erwiesen, nicht nur für Journalisten. Es ist an der Zeit, diese Methode auf die komplexesten technologischen Systeme anzuwenden, die jemals von Menschen erdacht wurden.

Die Untersuchung von Datensätzen ist eine Methode, um KI-Systeme – die Daten, die Modelle und die Auswirkungen – ganzheitlich zu hinterfragen. Nur durch die Betrachtung von Datensätzen bekommen wir ein besseres Gefühl dafür, wie KI-Modelle funktionieren und welche Lücken, Fehler und Verzerrungen auftreten können.

Wir Journalisten müssen aus dem aktuellen Hype-Zug aussteigen. Nur dann können wir die Funktionen und Kompromisse dieser Technologie abwägen, fundierte Entscheidungen treffen, ob, wie und warum diese Technologie für uns selbst oder unser Publikum sinnvoll wäre, und kritisch über KI und ihre Auswirkungen berichten.

Bild von Christo Buschek

Christo Buschek ist ein 2025 Mozilla Fellow.

Von bahnbrechenden Innovationen bis hin zu kühnen Visionen – unsere 2025 Fellows teilen ihre Prognosen darüber, wohin die Technologie steuert und welche Auswirkungen sie auf die Welt haben könnte.

Vollständige Liste anzeigen →