ChatGPT und Urheberrecht

Marcus von Welser

Dr. Marcus von Welser LL.M. ist Rechtsanwalt in München, Fachanwalt für gewerblichen Rechtsschutz und Lehrbeauftragter an der Humboldt-Universität zu Berlin und an der Hochschule für Technik und Wirtschaft Berlin. Seine Tätigkeitsschwerpunkte sind: Recht des geistigen Eigentums, Medienrecht, Prozessführung und Vertragsgestaltung.

Am 30. November 2022 machte das Unternehmen OpenAI den Chatbot ChatGPT der Öffentlichkeit zugänglich. ChatGPT ist in der Lage, nahezu jede Frage mit einem algorithmisch erzeugten, sprachlich korrekten Text zu beantworten. Nachfolgend wird überblicksweise dargestellt, welche urheberrechtlichen Fragen sich bei der Weiterverwendung des ChatGPT-Outputs stellen. Nicht Gegenstand des Beitrags sind der Schutz der Software, der Trainingsdaten und des Inputs.

Printausgabe mediendiskurs: 27. Jg., 3/2023 (Ausgabe 105), S. 76-79

Vollständiger Beitrag als:

I. Überblick

Die erste Version von ChatGPT basierte auf einem sogenannten Large Language Model mit dem Namen GPT‑3.5 (Generative Pre-trained Transformer). GPT‑3.5 ist eine leicht modifizierte Version von GPT‑3, einem im Jahr 2020 vorgestellten Sprachmodell (Brown u. a., Language Models are Few-Shot Learners). GPT‑3 ist ein autoregressives und aufgabenunabhängiges Sprachmodell mit rund 175 Mrd. trainierbaren Parametern. Nach Angaben der Entwickler von OpenAI, einer Limited Liability Company mit Sitz in San Francisco, wurde GPT‑3 mit 45 Terabyte (TB) Textdaten aus verschiedenen Quellen, beispielsweise Wikipedia, trainiert. Dabei wurden zwei Methoden des maschinellen Lernens verwendet, nämlich RLHF (Reinforcement Learning from Human Feedback) und PPO (Proximal Policy Optimization). Die Trainingsdaten von ChatGPT stammen aus dem Jahr 2021 und davor. Allerdings arbeitet OpenAI bereits an Anwendungen, die auf aktuelle Internetinformationen zugreifen können.

Sprachmodelle sind statistische Werkzeuge zur Vorhersage der nächstfolgenden Wörter in einer Sequenz. Sie bestimmen dafür die Wahrscheinlichkeit von Wörtern in einer Abfolge von Wörtern. Neben ChatGPT gibt es bereits eine Reihe weiterer generativer Sprachmodelle, beispielsweise das von Google entwickelte Modell LaMDA (Language Model for Dialogue Applications), das Schlagzeilen machte, als ein Google-Ingenieur in einem Interview mit der „Washington Post“ behauptete, LaMDA habe Bewusstsein erlangt.

Gibt man Wörter in die Eingabemaske von ChatGPT ein, so initialisiert ChatGPT eine Wahrscheinlichkeitsberechnung für die Ausgabe. In einem touristischen Kontext wird beispielsweise auf das Wort „New“ häufig das Wort „York“ folgen, in einem Text über die Anfänge des Internets eher das Wort „Economy“.

Obwohl der diffuse Begriff „künstliche Intelligenz“ (KI) möglicherweise andere Erwartungen weckt, liefert ChatGPT oft inhaltlich unrichtige Texte. Bei rechtlichen Fragen beispielsweise sind viele Antworten unvollständig und teilweise schlicht unzutreffend. ChatGPT kann auch Programmcode verfassen, allerdings ist auch dieser häufig fehlerhaft. Die Softwareentwicklerplattform Stack Overflow verbietet es daher beispielsweise Nutzern, von ChatGPT verfassten Programmcode auf die Plattform hochzuladen (https://stackoverflow.com/help/gpt-policy).

Urheberrechtliche Fragen ergeben sich auch bei KI-Bildgeneratoren wie DALL‑E (ebenfalls von OpenAI), Midjourney und Stable Diffusion (Stability AI). So hat beispielsweise Getty Images das Unternehmen Stability AI wegen Urheberrechtsverletzung verklagt, da Stability AI unerlaubt Bilder für Trainingszwecke verwendet haben soll (https://newsroom.gettyimages.com/en/getty-images/getty-images-statement). Auch diese Bildgeneratoren sind nicht Gegenstand des vorliegenden Beitrags.

II. Vertragliche Situation

Abschnitt 3a) der Nutzungsbedingungen von OpenAI in der Fassung vom 13. Dezember 2022 (https://openai.com/terms) sieht unter der Überschrift „Ihr Inhalt“ („Your Content“) vor, dass OpenAI vorbehaltlich der Einhaltung der Nutzungsbedingungen alle Rechte, Titel und Interessen am Output auf den Nutzer überträgt („OpenAI hereby assigns to you all its right, title and interest in and to Output.“). Nach Abschnitt 9k) der Nutzungsbedingungen gilt hierfür kalifornisches Recht. Da das deutsche Recht eine Übertragung von Urheberrechten nicht kennt (§ 29 I UrhG), müsste die Regelung von deutschen Gerichten so ausgelegt werden, dass Nutzungsrechte eingeräumt werden, sofern tatsächlich Urheberrechte am Output entstehen sollten (LG München, Urteil vom 14.05.2012, Aktenzeichen 21 O 14914/09 – Seekarten; LG Hamburg, Urteil vom 20.07.2012, Aktenzeichen 308 O 76/11 – Der Zauberer von Oz; v. Welser, Urheberrecht im Prozess, 2022, Rn. 369). Abschnitt 3c) sieht vor, dass der gesamte Inhalt – also der Output und der Input – von OpenAI weiterverwendet werden darf, sofern nicht von der Möglichkeit eines Opt-out Gebrauch gemacht wird.

OpenAI stellt dann in Abschnitt 3b) klar, dass der Output bei gleichen Fragen unterschiedlicher Nutzer identisch ausfallen kann. Antworten, die von anderen Nutzern angefordert und für diese generiert werden, gelten nicht als der Inhalt eines bestimmten Nutzers. Abschnitt 3d) sieht die Möglichkeit für Beschwerden wegen Urheberrechtsverletzungen vor. Abschnitt 2c) enthält diverse Verbote, u. a. darf der Nutzer nicht fälschlich behaupten, dass der Output von einem Menschen generiert wurde.

III. Rechte von dritten Urhebern

Die Antwort auf die Frage, ob und wie der Output von ChatGPT weiterverwendet werden darf, hängt u. a. von der urheberrechtlichen Einordnung des erzeugten Textes ab. Hierbei sind verschiedene Konstellationen zu unterscheiden. In einigen Konstellationen bestehen Rechte an den Trainingsdaten oder an dem Input (sogenannten „prompts“) fort.

1. Reine Reproduktionen und Übersetzungen

Fordert man ChatGPT beispielsweise auf, einen Songtext wiederzugeben und erhält dann einen noch nicht gemeinfreien Songtext, so bestehen an diesem die Rechte des Originalurhebers fort. Nicht anders ist die Situation, wenn man einen urheberrechtlich geschützten Text von ChatGPT in eine andere Sprache übersetzen lässt. Auch hier bleiben die Rechte des Urhebers des Originaltextes bestehen (§ 23 UrhG). Der Text kann also nicht frei verwertet werden.

2. Umgestaltungen

Fordert man ChatGPT auf, eine vorbestehende Filmszene umzuschreiben, so können auch dabei Rechte des Originalurhebers bestehen. Fiktionale Figuren können urheberrechtlich geschützt sein. Einzelne Charaktere eines Film- oder Sprachwerkes genießen selbstständigen Urheberrechtsschutz, sofern sie sich durch eine unverwechselbare Kombination von äußeren Merkmalen, Charaktereigenschaften, Fähigkeiten und typischen Verhaltensweisen auszeichnen (v. Welser, Urheberrecht im Prozess, 2022, Rn. 71). Ob eine Urheberrechtsverletzung vorliegt, hängt davon ab, wie viel vom Original sich im ChatGPT-Output wiederfindet.

3. Fachtexte

Besteht der ChatGPT-Output aus einem informativen Fachtext, ist eine Urheberrechtsverletzung eher unwahrscheinlich. Dies liegt einerseits daran, dass die Schutzanforderungen bei Fachtexten nach Meinung des EuGH relativ streng sind. Zwar können nach der Rechtsprechung des EuGH bereits elf aufeinander folgende Wörter eine eigene geistige Schöpfung zum Ausdruck bringen (EuGH GRUR 2009, 1041 Rn. 48 – Infopaq). Bei Texten, deren Inhalt wesentlich durch die in ihnen enthaltenen Informationen bestimmt wird, geht der EuGH jedoch davon aus, dass es dem Urheber bei der Ausarbeitung nicht möglich war, seinen schöpferischen Geist in origineller Weise zum Ausdruck zu bringen (EuGH GRUR 2019, 934 Rn. 24 – Afghanistan Papiere). Andererseits besteht der Output von ChatGPT nicht aus Textbausteinen oder Satzfragmenten, sondern er wird neu und autonom von der KI formuliert.

IV. Eigenständiger Schutz des Outputs

Von der Frage, ob der Output Urheberrechte von dritten Personen verletzt, ist die Frage zu trennen, ob das Urheberrecht ein eigenes Recht für von ChatGPT autonom produzierten Output gewährt. Im Bereich „KI und Urheberrecht“ werden in der Literatur vor allem die Werkeigenschaft und Rechtszuordnung (Urheberschaft) diskutiert. Verneint man bereits die Werkeigenschaft, so stellt sich die Frage der Zuordnung nicht mehr.

1. Werkbegriff im deutschen und im EU-Recht

Bereits die Frage nach der Werkeigenschaft wird auf Grundlage der derzeit geltenden Rechtslage überwiegend verneint. Der von einer selbstständig arbeitenden künstlichen Intelligenz verfasste Output ist nach der derzeitigen Rechtslage in Deutschland nicht als Werk urheberrechtlich schutzfähig (vgl. Dornis GRUR 2021, 784, 790; Lauber-Rönsberg GRUR 2019, 244, 246). Nur ein Mensch kommt als Schöpfer in Betracht. Das ist eine Folge der anthropozentrischen Konzeption des deutschen Urheberrechts. Auch Erfinder nach § 37 I PatG kann nur eine natürliche Person sein (BPatG GRUR 2022, 1213 – Food Container).

Nach der Rechtsprechung des EuGH kommt es entscheidend darauf an, dass der Urheber tatsächlich frei kreative Entscheidungen treffen konnte (EuGH GRUR 2019, 934 Rn. 23 – Afghanistan Papiere). Im Hinblick auf den Schutz von Porträtfotos hat der EuGH festgestellt, dass der Fotograf auf mehrfache Weise und zu unterschiedlichen Zeitpunkten frei kreative Entscheidungen treffen kann (EuGH GRUR 2012, 166 Rn. 90 – Painer). In der Vorbereitungsphase könne der Urheber über die Gestaltung, die Haltung der zu fotografierenden Person oder die Beleuchtung entscheiden. Bei der Aufnahme von Porträts könne er den Bildausschnitt, den Blickwinkel oder auch die Atmosphäre wählen. Schließlich könne er bei der Herstellung des Abzugs unter den verschiedenen bestehenden Entwicklungstechniken diejenige wählen, die er einsetzen möchte, oder gegebenenfalls Software verwenden (EuGH GRUR 2012, 166 Rn. 91 – Painer). Eine von der EU-Kommission in Auftrag gegebene Studie kommt zu der Einschätzung, dass dieser Prüfungsmaßstab auch bei der Verwendung von KI zugrunde gelegt werden kann (vgl. Hartmann/Allan/Hugenholtz/Quintais/Gervais, Trends and Developments in Artificial Intelligence Challenges to the Intellectual Property Rights Framework, 2020, S. 79).

Bei der Verwendung von ChatGPT kommt es allerdings in keiner Phase (Konzeption, Ausführung, Redigierung) zu einer hinreichend kreativen Entscheidung des Verwenders. Das Verfassen des Inputs kann zwar eine urheberrechtlich geschützte Leistung sein, führt aber nicht zum Schutz am Output. Auf die eigentliche maschinelle Durchführung, das eigentliche Produzieren des Textes, hat der Verwender keinen Einfluss. Auch die weitere Redaktion durch den Verwender wird in aller Regel zu keinem Schutz führen. Zwar kann der Verwender den Text durch einen einfachen Klick auf den Button „Regenerate Answer“ neu erstellen lassen. Dies allein ist aber keine ausreichende kreative Leistung.

Auch Stellungnahmen zum US-amerikanischen Recht gehen davon aus, dass es sich im Fall des kreativen Schaffens einer KI, bei der Programmierer der KI und der Verfasser des Inputs nicht gezielt zusammenarbeiten, um nicht geschützten Output handelt (vgl. Ginsburg/Budiardjo, Authors and Machines, Berkeley Technology Law Journal 2019 (Band 34) 343, 446 mwN).

Das Rechtsverständnis ist nicht in allen EU-Ländern einheitlich. So enthält beispielsweise das irische Urheberrecht (Copyright and Related Rights Act, 2000) folgende Regelungen: „In this Act, ‚author‘ means the person who creates a work and includes: […] in the case of a work which is computer-generated, the person by whom the arrangements necessary for the creation of the work are undertaken“ sowie „‚Computer-generated‘, in relation to a work, means that the work is generated by computer in circumstances where the author of the work is not an individual“. Diese Bestimmungen schaffen eine rechtliche Fiktion der Urheberschaft, durch die das Urheberrecht einer Person zusteht, die kein Urheber im eigentlichen Sinne ist (vgl. Bridy Stanford Technology Law Review, 2012 (Band 5) 1, 26; Scannell When Irish AIs are smiling: could Ireland’s legislative approach be a model for resolving AI authorship for EU member states, Journal of Intellectual Property Law & Practice 2022 (Band 17) S. 727, 734). Die irische Regelung lässt sich kaum in Einklang mit der EuGH-Rechtsprechung bringen (vgl. Hartmann/Allan/Hugenholtz/Quintais/Gervais, Trends and Developments in Artificial Intelligence Challenges to the Intellectual Property Rights Framework, 2020, S. 88). Ob irische Gerichte diese Vorschriften auf ChatGPT-Output anwenden würden, ist nicht absehbar. Sofern ein irisches Gericht letztinstanzlich darüber entscheidet, ist eine Vorlage an den EuGH 267 III AEUV erforderlich.

Die Auswirkungen eines Urheberrechtsschutzes für KI-Output in Irland wären nicht auf dortige Verwender beschränkt. Nach dem Territorialitätsprinzip besteht kein weltweit einheitliches Urheberrecht, sondern ein Bündel nationaler Schutzrechte. Zwar kann ein irisches Urheberrecht grundsätzlich nur in Irland verletzt werden. Bei grenzüberschreitenden Handlungen – beispielsweise Onlinewiedergaben – lokalisiert der EuGH die Onlinenutzung allerdings überall dort, wo gezielt Mitglieder der Öffentlichkeit angesprochen werden (EuGH GRUR 2012, 1245 – Football Dataco). Sofern sich also eine Website in englischer Sprache an ein weltweites Publikum wendet, unterliegt sie in aller Regel auch dem irischen Recht.

Nach den derzeitigen Nutzungsbedingungen von OpenAI, wonach etwaige Rechte am Output auf den Nutzer übertragen werden, stünde auch ein irisches Urheberrecht von OpenAI einer Nutzung durch den Verwender nicht entgegen.

2. Leistungsschutzrechte

In Betracht kommen für einen Schutz des Outputs auch Leistungsschutzrechte, wie etwa das Datenbankherstellerrecht. Allerdings werden die Schutzvoraussetzungen häufig fehlen. § 87a I 1 UrhG definiert Datenbanken als Sammlungen von Werken, Daten oder anderen unabhängigen Elementen, die systematisch oder methodisch angeordnet und einzeln mit Hilfe elektronischer Mittel oder auf andere Weise zugänglich sind. Voraussetzungen für dieses Schutzrecht sui generis ist eine nach Art und Umfang wesentliche Investition in die Beschaffung, Überprüfung oder Darstellung der Daten. Die Erzeugung der Daten führt noch nicht zu diesem Investitionsschutz. Der Output erfüllt in aller Regel nicht die Voraussetzungen des Datenbankherstellerrechts. Gleiches gilt für das Presseverlegerrecht.

Für andere KI-Anwendungen können weitere Leistungsschutzrechte, wie beispielsweise das Tonträger- und das Filmherstellerrecht, in Betracht kommen.

V. Handlungsbedarf

Die Frage, wie mit dem KI-Output umgegangen werden soll, bedarf einer breiten Diskussion und möglicherweise einer gesetzgeberischen Tätigkeit. Die Fähigkeit von ChatGPT, Text und Programmcode zu schreiben, wird die Arbeit nicht nur in der Kultur- und Kreativwirtschaft, sondern auch in der Softwareindustrie stark verändern. Nicht nur OpenAI, sondern auch andere Unternehmen arbeiten an Sprachmodellen, die der jetzigen Version von ChatGPT überlegen sein werden.

Der KI-Verordnungsentwurf der EU-Kommission vom 21. April 2021 (COM/2021/206 final) äußert sich zum Urheberrecht nicht. Die EU-Kommission hatte einen Vorschlag für eine Verordnung zur Festlegung harmonisierter Vorschriften für künstliche Intelligenz (Gesetz über künstliche Intelligenz; KI‑VO‑E) veröffentlicht. Art. 3 Nr. 1 KI‑VO‑E definiert u. a. den Begriff „System der künstlichen Intelligenz“ (vgl. Steege MMR 2022, 926).

VI. Praxishinweis

Die Weiterverwendung von ChatGPT-Output wirft noch viele weitere rechtliche Fragen auf, beispielsweise persönlichkeitsrechtliche. Der Musiker und Schriftsteller Nick Cave hatte, nachdem er mit einem ChatGPT-Song „in the style of Nick Cave“ konfrontiert worden war, in seinem Blog den Unterschied zwischen einem menschlichen Urheber und ChatGPT dargestellt und den von ChatGPT verfassten Songtext als „a grotesque mockery of what it is to be human“ bezeichnet (www.theredhandfiles.com/chat-gpt-what-do-you-think). Ein bestimmter Stil ist zwar urheberrechtlich nicht geschützt. Werkfälschungen können allerdings das allgemeine Persönlichkeitsrecht der Person verletzen, denen sie zugeschrieben werden (BGH NJW 1990, 1986, 1988 – Emil Nolde). Es kann also Persönlichkeitsrechte verletzen, Texte im Stil einer bestimmten Person von ChatGPT verfassen zu lassen und dann zu verbreiten.

Der Artikel ist erstmalig in der Zeitschrift „GRUR-Prax“ (3/2023/15, S. 57 – 59) erschienen.