Diese Bücher hat Meta "geklaut", um seine KI-Modelle zu trainieren
24. März 2025 um 04:58:14
Michael Förtsch
Um seine KI-Modelle zu trainieren, hat Meta nicht nur zahlreiche Artikel von Nachrichtenseiten, Wikipedia-Inhalte und freie Archive verwendet. Wie im Januar bekannt wurde, nutzte das Team auch die Inhalte der berüchtigten Online-Piratenbibliothek LibGen, die Romane, Sachbücher und auch wissenschaftliche Texte anbietet.
Mark Zuckerberg persönlich soll die Nutzung genehmigt haben. Das Online-Magazin The Atlantic hat nun eine Suchmaschine gestartet, mit der die Inhalte von LibGen durchsucht werden können, ohne direkt darauf zuzugreifen. Demnach befinden sich über 7,5 Millionen Bücher und 81 Millionen akademische Arbeiten in der Datenbank, die vermutlich fast alle für das KI-Training verwendet wurden.
Zahlreiche Autoren und Forscher haben sich bereits zu dieser Situation geäußert. Der Autor Justin Ling etwa argumentierte, er habe kein Problem damit, wenn jemand sein Buch von einer Plattform wie LibGen herunterlade, weil er gerade kein Geld habe. „Das Problem ist nicht, dass LibGen diese Inhalte zur Verfügung stellt“, so Ling, „das Problem ist, dass Meta sie stiehlt, um Profit zu machen“.