Seit dem Launch von ChatGPT ist das Interesse an dem Chatbot ungebrochen. Für viele Menschen ist ChatGPT sogar der erste Kontakt mit Künstlicher Intelligenz (KI). Keine Frage: Die Antworten der KI sind erstaunlich gut und neben dem Verfassen reiner Texte kann der Chatbot auch Quellcode für Software schreiben und viele weitere Aufgaben übernehmen.
Doch mit steigender Nutzung haben Datenschutzbehörden in mehreren Ländern begonnen, auf Probleme beim ChatGPT Datenschutz und ChatGPT Urheberrecht hinzuweisen. Wir schauen in diesem Blogbeitrag auf die wichtigsten Fragen rund um die Nutzung von ChatGPT und erstelltem ChatGPT Content.
Woher nimmt ChatGPT die Informationen?
Woher nimmt ChatGPT die Informationen?
Die Daten, mit denen ChatGPT trainiert wurde, stammen hauptsächlich aus Internetquellen wie Wikipedia, Nachrichtenseiten und Portalen für wissenschaftliche Fachartikel. Insgesamt umfasst der dem Sprachmodell zugrunde liegende Textkorpus etwa 500 Milliarden Wörtern (SWR).
Bild: Gülfer ERGİN über Unsplash
Die Trainingsmethode, mit der ChatGPT seine Daten und Informationen erhält, nennt man Webscrapping. Darunter versteht man das automatische Auslesen von Website-Inhalten. Legal ist der Einsatz von Webscrapping jedoch nur, wenn – laut einem Urteil des Bundesgerichtshofs (Hubspot) – Daten und Informationen ausgelesen werden, die ausschließlich frei zugänglich auf einer Website sind. Ebenfalls verboten ist die Extraktion von Daten, die durch eine Firewall oder ähnliche Maßnahmen geschützt sind.
Beachtet ChatGPT Copyright Bestimmungen?
Beachtet ChatGPT Copyright Bestimmungen?
Aus Sicht des Urheberrechts ist ChatGPT in zweifacher Weise betroffen (Chip): Es ist zu klären, ob die Antworten von ChatGPT auf urheberrechtlich geschütztes Material zurückgreifen und ob diese Antworten wiederum selbst als zu schützende Werke nach dem Urheberrecht gelten.
Nach der derzeitigen Rechtslage können sich ausschließlich natürliche Personen auf das Urheberrecht beziehen. Unter diesem Gesichtspunkt können KI-erstellte Texte nicht geschützt werden. Es ist eh schwierig zu klären, bis zu welchem Grad bei KI-Werken noch der Mensch als Urheber in Frage kommt.
Die einzige Einflussnahme für den Menschen ergibt sich durch die Eingabebefehle (den Prompts). Mit diesen Befehlen lassen sich die Ergebnisse zwar indirekt steuern, welche die neuronalen Netze hervorbringen. Aber den Schreibprozess und die eigentliche Texterstellung übernimmt die KI. In diesem Prozess nimmt der Mensch nur eine unterstützende Rolle ein. In den meisten Fällen zu wenig, um die resultierenden Texte als urheberrechtlich zu schützendes Material zu deklarieren (Jonas Leschke und Peter Salden, Ruhr-Universität Bochum, 2023).
Bild: Scott Graham über Unsplash
Die Urheberrechtsfrage ist auch Teil der aktuell in der EU verhandelten europäischen KI-Regulierung. Bereits im Jahr 2021 hat die Europäische Kommission einen entsprechenden Verordnungsentwurf vorgelegt (DIHK).
Nach den jüngsten Plänen der EU (Golem) sollen KI-Systeme gesetzlich verpflichtet sein, offenzulegen, ob urheberrechtlich geschütztes Material Teil ihrer jeweiligen Trainingsdaten ist. Hier bleibt ChatGPT bislang recht vage und gibt keine eindeutige Auskunft, ob zu wirklich allen Trainingsdaten ChatGPT Rechte für deren Nutzung vorliegen (Härting Rechtsanwälte PartGmbB) und die Antworten keine Urheberrechtsverletzung darstellen.
Kann ChatGPT Quellen angeben?
ChatGPT selbst gibt kaum seine Quellen an. Auch mit entsprechenden Befehlen (Prompts) lassen sich die jeweiligen Quellen nur schwer ermitteln. Neben der offenen Frage, woher ChatGPT die Vorlagen für seine Antworten nimmt, liegt dies auch an der Art und Weise, wie ChatGPT auf Eingaben reagiert.
Was sind Prompts und wie kannst du sie erfolgreich für dein Unternehmen einsetzen? Erfahre mehr über die vielfältigen Möglichkeiten von Künstlicher Intelligenz im Lehrgang KI-Manager (IHK)!
Welche Daten sammelt ChatGPT?
Das Sprachmodell von ChatGPT ähnelt herkömmlichen Chatbots. Seine Antworten sind jedoch nicht auf wenige vorgefertigte Antworten beschränkt, die oft zu einem sich wiederholenden Gesprächsverlauf führen. ChatGPT ist in der Lage, vollständige Konversationen zu führen und innerhalb von Sekundenbruchteilen passende Antworten zu liefern.
Dazu nimmt ChatGPT vornehmlich Daten aus seinem Textkorpus, die Aufschluss über Muster in der menschlichen Sprache geben. Um zu verstehen, wie ChatGPT auf Eingaben antwortet, muss man wissen, wie ChatGPT seine Antworten zusammenstellt.
ChatGPT antwortet nicht wie Menschen in ganzen Sätzen, sondern Wort für Wort. Nach jedem Wort berechnet ChatGPT, welches Wort am wahrscheinlichsten auf das vorhergehende folgt. So erstellt ChatGPT seine Antworten, die aus ganzen Sätzen bis hin zu einem vollständigen Text bestehen können.
Um an die benötigten Daten zu gelangen, verwendet ChatGPT Deep-Learning-Technologie, deren Algorithmen auf die Analyse der menschlichen Sprache ausgerichtet sind. Wie funktioniert sie, welche Unterschiede bestehen zwischen dem geschriebenen und gesprochenen Wort oder wie werden aus einfachen Wörtern ganze Sätze? ChatGPT verwendet alle Daten, die dem KI Chat Bot helfen, mehr über die Grundlagen natürlicher Sprache zu erfahren.
Diese Art der Informationsgewinnung lässt sich deshalb als künstliches neuronales Netz in Analogie zum menschlichen Nervensystem beschreiben. So betrachtet möchte ChatGPT lernen und denken wie unser Gehirn. Aus diesem Grund zitiert ChatGPT seine Quellen nicht direkt, sondern nur einzelne Worte, Zusammenhänge oder Muster und versucht diese entsprechend seiner Funktionsweise nach Wahrscheinlichkeiten sinnvoll zu neuen Sätzen und Texten anzuordnen.
Ist ChatGPT DSGVO konform?
Für das Training nutzt ChatGPT neben seinem Textkorpus auch sämtliche Daten aus den Benutzereingaben. Dabei ist nicht auszuschließen, dass die Anwenderinnen und Anwender auch persönliche und sensible Informationen in den Chat eingeben (Datenschutzexperte.de).
Dieser Umstand führte in Italien bereits zu einer Sperrung von ChatGPT (Tagesschau). Nach Ansicht der dortigen Datenschutzaufsichtsbehörde fehlen bei ChatGPT eine Auflistung der verwendeten Datenquellen, Informationen über die Algorithmen und Klarheit darüber, ob Dritte für kommerzielle Zwecke Einsicht in die Daten erhalten (Datenschutzexperte.de).
Diese Auffassung teilen auch die Datenschutzbehörden der deutschen Bundesländer. Außerdem bemängelt die italienische Datenschutzbehörde das Fehlen eines Filters zur Verhinderung der Nutzung durch Kinder unter 13 Jahren, die das Tool nach den Geschäftsbedingungen von ChatGPT und der ChatGPT Privacy Policy gar nicht nutzen dürften (Tagesschau).
Weitere Bedenken ergeben sich aus der Tatsache, dass bei der Eingabe vermutlich Daten in die USA übermittelt werden: Die USA sind der Sitz des hinter Chat GPT stehenden Unternehmens OpenAI und gelten im Sinne der europäischen Datenschutzgrundverordnung als ein Drittland außerhalb der EU.
Derzeit besteht allerdings kein Datenschutzabkommen zwischen der EU und den USA (Datenschutzexperte.de), weshalb Daten nur unter hohen Anforderungen in die USA übertragen werden dürfen. Ob ChatGPT bzw. OpenAI diese datenschutzrechtlichen Anforderungen erfüllen, lässt sich im Moment nicht abschließend beurteilen.
Bild: Conny Schneider über Unsplash
Ist die Nutzung von ChatGPT Datenschutz-konform und sicher?
Aufgrund dieser Mängel und fehlender Transparenz ist aktuell (Stand Mai 2023) keine vollständige datenschutzkonforme Nutzung von ChatGPT zu gewährleisten. Open AI selbst garantiert nicht die Sicherheit der von den Nutzerinnen und Nutzer eingegebenen Daten und Informationen (Chip). Gerade Unternehmen, die ChatGPT für ihre Zwecke nutzen wollen oder planen, ChatGPT in ihre Dienste zu integrieren, sollten dies berücksichtigen.
Für die private Nutzung sollten die Nutzerinnen und Nutzer für einen angemessen ChatGPT Datenschutz idealerweise selbst einige Sicherheitsmaßnahmen treffen. Dazu gehören die Vermeidung von persönlichen sowie sensiblen Daten und Informationen, die Nutzung des Inkognito/Privat-Modus ihres jeweiligen Browsers oder auch die Nutzung eines VPN-Clients.
Dadurch werden Browserverlauf und -daten nicht gespeichert und der Zugriff von ChatGPT Cookies auf Informationen aus dem genutzten Browser bleibt verwehrt. Außerdem empfiehlt es sich, ChatGPT nur über eine sichere Internetverbindung aufzurufen und einen Browser zu verwenden, der Surfen über eine verschlüsselte HTTPS-Verbindung ermöglicht.