Daniel AJ Sokolov schreibt in »Copyright-Sammelklage gegen Anthropic« für heise.de
Die Klageschrift verweist auf ein von Anthropic-Mitarbeitern verfasstes Paper vom Dezember 2021, wonach 32 Prozent eines riesigen Trainingsdatensatzes aus “internet books” bestehe, was ein Codewort für illegal aus dem Internet geladene Bücher sei. Die Kläger beantragen die Zulassung als Sammelklage im Namen aller Autoren von Büchern, die beim US Copyright Office registriert sind und von Anthropic ohne Lizenz kopiert worden sind. Auf der Liste der Forderungen stehen eine Unterlassungsverfügung, Schadenersatz, Abschöpfung der Bereicherung, Verfahrenskosten und Zinsen. Entscheiden sollen Geschworene.
Es zeichnet sich ab, dass wir in Zukunft Fingerabdrücke für KI-generierte Texte benötigen werden.
Bereits jetzt ist ein Trend erkennbar: Hersteller von KI-Modellen lizenzieren zunehmend die Quellen ihrer Daten. Ob ein Text von einer KI erstellt wurde, die über die entsprechenden Rechte verfügt, kann nur durch einen speziellen Identifikator erkannt werden. Ähnlich wie gedruckte Dokumente dem jeweiligen Drucker zugeordnet werden können, wird dies auch bald für Texte möglich sein. Allerdings wird man diese Regelung voraussichtlich nur bei großen Anbietern durchsetzen können.
Hier ein paar Berichte zur zunehmenden Lizenzierung am Beispiel von OpenAI:
Da viele Inhalte auf Texten basieren, werden umfassende Lizenzen notwendig sein. Dies betrifft nicht nur Bücher oder Foren wie Reddit, sondern auch Liedtexter, Programmierer, Drehbuchautoren und zahlreiche andere Branchen. Kleinere Autoren und Privatpersonen würden hingegen ungeschützt bleiben, es sei denn, sie schließen sich in Gewerkschaften oder ähnlichen Organisationen zusammen, um ihre Urheberrechte zu verteidigen.
Möchtest du mir antworten?
Schick mir eine Nachricht per E-Mail und lass uns ein Dialog beginnen. Du kannst mir auch per RSS oder Mastodon folgen.