top of page

Future Feed

Logo von 1E9 Denkfabrik GmbH

US-Medien stellen sich gemeinsam gegen Archivnutzung für KI-Training

Michael Förtsch

1. Mai 2026 um 13:06:40

Michael Förtsch

Mehrere US-Medienorganisationen – darunter CNN, NBC und USA Today sowie über 15 weitere – fordern gemeinsam, ihre Medieninhalte nicht für das Training von KI-Modellen zu nutzen. Damit richten sie sich auch an die Non-Profit-Organisation Common Crawl, die seit mehreren Jahren riesige Datensätze akkumuliert, indem sie öffentlich zugängliche Inhalte aus dem Internet zusammenträgt. Diese wurden ursprünglich vor allem von Forschern genutzt, inzwischen aber auch als Teil von Trainingsdaten für KI-Modelle eingesetzt.

 

Die Medienunternehmen fordern Common Crawl nun auf, ihre Websites und Archivinhalte nicht länger zu sammeln und in ihren Datenpaketen zu verarbeiten. Das Non-Profit-Unternehmen soll zudem die unautorisierte Nutzung durch KI-Firmen unterbinden. Zwar besteht schon die Möglichkeit, Common Crawl aufzufordern, bestimmte Adressen oder Inhalte hinter Paywalls nicht zu crawlen, doch dies wurde von der Organisation oft ignoriert. Bislang hat Common Crawl nicht auf die Forderung der Medienunternehmen reagiert.

!
Widget Didn’t Load
Check your internet and refresh this page.
If that doesn’t work, contact us.
bottom of page