Daniel AJ Sokolov schreibt in »Copyright-Sammelklage gegen Anthropic« für heise.de

Die Klageschrift verweist auf ein von Anthropic-Mitarbeitern verfasstes Paper vom Dezember 2021, wonach 32 Prozent eines riesigen Trainingsdatensatzes aus “internet books” bestehe, was ein Codewort für illegal aus dem Internet geladene Bücher sei. Die Kläger beantragen die Zulassung als Sammelklage im Namen aller Autoren von Büchern, die beim US Copyright Office registriert sind und von Anthropic ohne Lizenz kopiert worden sind. Auf der Liste der Forderungen stehen eine Unterlassungsverfügung, Schadenersatz, Abschöpfung der Bereicherung, Verfahrenskosten und Zinsen. Entscheiden sollen Geschworene.

Es zeichnet sich ab, dass wir in Zukunft Fingerabdrücke für KI-generierte Texte benötigen werden.

Bereits jetzt ist ein Trend erkennbar: Hersteller von KI-Modellen lizenzieren zunehmend die Quellen ihrer Daten. Ob ein Text von einer KI erstellt wurde, die über die entsprechenden Rechte verfügt, kann nur durch einen speziellen Identifikator erkannt werden. Ähnlich wie gedruckte Dokumente dem jeweiligen Drucker zugeordnet werden können, wird dies auch bald für Texte möglich sein. Allerdings wird man diese Regelung voraussichtlich nur bei großen Anbietern durchsetzen können.

Hier ein paar Berichte zur zunehmenden Lizenzierung am Beispiel von OpenAI:

DatumArtikel
2024-01-05Millionen für KI-Trainingsmaterial: OpenAI verhandelt mit dutzenden Verlagen
2024-01-06OpenAI will Texte lizenzieren - doch Apple bietet das Vielfache
2024-01-11OpenAI führt wohl Lizenzgespräche mit CNN, Fox und Time
2024-03-16OpenAI führt laut eigenen Angaben Gespräche mit Dutzenden von Verlagen über die Lizenzierung von Inhalten
2024-04-29Financial Times und OpenAI unterzeichnen Partnerschaft zur Lizenzierung von Inhalte

Da viele Inhalte auf Texten basieren, werden umfassende Lizenzen notwendig sein. Dies betrifft nicht nur Bücher oder Foren wie Reddit, sondern auch Liedtexter, Programmierer, Drehbuchautoren und zahlreiche andere Branchen. Kleinere Autoren und Privatpersonen würden hingegen ungeschützt bleiben, es sei denn, sie schließen sich in Gewerkschaften oder ähnlichen Organisationen zusammen, um ihre Urheberrechte zu verteidigen.