News

KI-Economy und Copyright: Reichweite des Urheber­rechts auf dem Prüfstand

19.08.2024

I. Copyright in der KI-Economy: Github/Copilot, New York Times/OpenAI, Suno, Udio u. a.

Moderne generative KI ist weit verbreitet und bildet die Grundlage für eine Vielzahl von Diensten und Anwendungen. Die Entwickler haben die zugrunde liegenden neuronalen Netze in der Regel mit einer Vielzahl an Daten trainiert, die die KI nutzt, um neue Inhalte zu erzeugen, wie etwa Texte, Bilder, Musik oder andere Medien. Da diese Trainingsdaten nicht selten urheberrechtlich geschützt sind, beschäftigt die rechtmäßige Verwendung dieser Daten schon seit längerem die US-amerikanischen Gerichte.

1. Copilot/Github/OpenAI vs. Github-Nutzer

Vor dem United States District Court for the Northern District of California sehen sich GitHub, Microsoft und OpenAI derzeit mit einer Sammelklage konfrontiert. Die Kläger werfen GitHub und Microsoft vor, ihre Open-Source-Software ohne Zustimmung für das Training des KI-basierten Assistenten „Copilot“ genutzt zu haben. Die Anwendung schlage seinen Nutzern Code vor, der identisch oder ähnlich zu dem öffentlich verfügbaren Code der Kläger sei. Der Richter aus Kalifornien wies nun 20 der insgesamt 22 Ansprüche ab. Allerdings ließ das Gericht offen, ob in der Art und Weise, wie der Copilot Code generiert, eine Verletzung von Open-Source-Lizenzbedingungen liegt. Diese Lizenzen verlangen üblicherweise, dass der ursprüngliche Autor und der Lizenztext in jeder Verteilung oder Ableitung des Codes beibehalten werden.

2. New York Times vs. OpenAI

Die Zeitung New York Times war zunächst mit der Begründung gegen OpenAI vorgegangen, dass das Large Language Modell von OpenAI urheberrechtlich geschützte Texte aus Beiträgen der Zeitung wiedergegeben habe. OpenAI stellte daraufhin die Schutzfähigkeit der Texte als solche in Frage und verlangt nunmehr Zugang zu Recherchedokumenten, Entwürfen und anderen Materialen der Zeitung, vorgeblich zur Prüfung, ob tatsächlich ein urheberrechtlicher Schutz an den wiedergegebenen Texten besteht. Bislang vermied es OpenAI sich auf Fair-Use zu berufen. Diese US-amerikanische Rechtsdoktrin erlaubt es Nutzern, urheberrechtlich geschützte Werke ohne Erlaubnis des Urhebers zu verwenden, sofern die Nutzung als gerechtfertigt erscheint beispielsweise für Zwecke wie Kritik, Kommentar, Berichterstattung, Bildung und Forschung. Dahinter könnte der Gedanke stehen, eine gegebenenfalls negative Leitentscheidung zur Fair-Use-Doktrin im Zusammenhang mit dem Training von Large Language Modellen zu vermeiden, die sonst weitergehende Auswirkungen auf das Geschäftsmodell von KI-Anbietern zeitigen könnte.

3. Plattenlabels vs. Suno, Udio u.a.

Auch im Bereich der Musikindustrie zeichnen sich Rechtsstreitigkeiten zwischen KI‑Anbietern und Rechteinhabern ab, konkret etwa zwischen Audio-KI-Diensten wie Suno und Udio einerseits und Musiklabels wie Sony Music, Atlantic Records, Capitol Records und Warner Records andererseits. Die Musikgeneratoren Suno und Udio ermöglichen Nutzern verschiedene Musikstile per Textprompt zu generieren und greifen für diesen Output wohl auch auf urheberrechtlich geschützte Musiktitel zurück. Der Kern dieser Rechtsstreitigkeiten spielt damit (nach deutscher Dogmatik) an der Grenze zwischen erlaubten Bearbeitungen und Umgestaltungen (§ 23 UrhG) und eigenständigen Werken der Musik (§ 2 Abs. 1 Nr. 2 UrhG) und wirft damit klassisch urheberrechtliche Fragen wie die nach dem erforderlichen Abstand zwischen einer Neuschöpfung und dem Original auf.

II. De Lege Lata – welche Mittel bietet das IP-Recht gegen AI-Verwertungshandlungen?

Das Urheberrecht dient im KI-Kontext bislang insbesondere als Abwehrrecht der Rechteinhaber und etablierter Rechteverwerter gegenüber der Verwendung relevanter Materialien durch die neuen KI-Unternehmen.

Die Grenze des Schutzbereichs des Urheberrechts und die Bestimmung, ob eine relevante Schranke zu Gunsten des KI-Anbieters eingreift, sind in hohem Maße einzelfallabhängig. Sie bieten damit Anlass für Rechtsstreitigkeiten, die entsprechend auch bereits in einer Vielzahl von Märkten (betreffend etwa Software, Texte, Musik) zu beobachten sind. Nach deutschem Recht könnte insbesondere die Schranke des Data Minings (§ 44b UrhG) in den Fokus derartiger Streitigkeiten treten. Diese existiert erst seit 2021, basiert auf der europäischen DSM-Richtlinie und ermöglicht es grundsätzlich, dass zum Zwecke des maschinellen Lernens große Mengen an Daten herangezogen werden, ohne dass es der vorherigen Erlaubnis des Urhebers bedarf. Den Urhebern steht nach § 44b UrhG zwar ein Opt-Out-Recht zu, das technisch in Zukunft mittels eines maschinenlesbaren Vorbehalts ermöglicht werden soll. Dieses dürfte aber in vielen Fällen noch nicht umgesetzt sein.

Mit Blick auf die Frage, ob etwa das deutsche Recht und damit die Data-Mining-Schranke oder das US-Recht und damit etwa eine mögliche Fair-Use-Schranke greifen, ist auch das Schutzland-Prinzip zu beachten. Dieses findet im internationalem Urheberrecht Anwendung und knüpft das anwendbare Recht im Regelfall an den Ort, an dem die maßgebliche Benutzungshandlung (z. B. das Training einer KI) stattfindet. Bei Steuerung oder Verarbeitung dieser Vorgänge auf verschiedenen Servern an unterschiedlichen Orten ist daher grundsätzlich das Urheberrecht zu beachten, das jeweils an diesen Orten gilt, was dazu führen kann, dass eine Vielzahl urheberrechtlicher Regime gleichzeitig zu berücksichtigen sind.

III. Weiterführende Handlungsmöglichkeiten der KI-Nutzer

KI-Anwendungen und -Anbieter sind längst auf einer Vielzahl von Märkten angekommen. Auch wenn das Urheberrecht erhebliche Mittel zur Verteidigung gegen Verwendungen geschützter Materialien durch KI bietet, werden sich die neuen Nutzungsmöglichkeiten, die KI bietet, perspektivisch mit hoher Wahrscheinlichkeit am Markt bewähren können.

Eine ideale Lösung entsprechender Streitigkeiten dürfte damit in vielen Fällen über das Vertragsrecht zu finden sein. Im Bereich der Musikindustrie geht insbesondere das Unternehmen Landr einen gangbaren Weg. Musiker können ihre urheberrechtlich geschützten Werke auf der Plattform des Unternehmens explizit auch zum Training von AI-Tools hochladen und werden für diese Rechteeinräumung im Gegenzug an den Gewinnen, die durch die Tools erzielt werden, direkt beteiligt.

Beispielhaft für die vertragsrechtliche Lösung der bestehenden Rechtsunsicherheiten lässt sich ferner auch die strategische Partnerschaft der amerikanischen Zeitschrift Time mit dem AI-Unternehmen OpenAI heranziehen. Time ermöglicht OpenAI Zugang zu gegenwärtigen und historischen Daten und Inhalten der Zeitschrift. Diese Daten dienen einerseits zur Verbesserung der KI von OpenAI, andererseits sollen sie der Zeitschrift helfen, ihre journalistischen Produkte durch ChatGPT und andere OpenAI-Produkte zu verbessern und KI‑optimierte Produkte zu entwickeln. Es handelt sich also um ein klassisches Win-Win-Modell.

Ob sich diese oder andere vertragsrechtliche Lösungen durchsetzen, bleibt abzuwarten. In jedem Fall lohnt sich für alle Unternehmen in urheberrechtsnahen Branchen, seien es Software, Musik, Texte oder andere Gegenstände, die nähere Befassung mit der Frage, ob und wie sie derzeit vertraglich und rechtlich gegen KI-Verwendungen ihrer Materialien abgesichert sind und ob und wie sie die Fragen, die sich etwa im Kontext des Data Minings nach § 44b UrhG stellen, bereits für sich beantwortet haben.