Chat GPT Fakten – Datenschutz und Urheberrecht

Seit dem Launch von ChatGPT ist das Interesse an dem Chatbot ungebrochen. Für viele Menschen ist ChatGPT sogar der erste Kontakt mit Künstlicher Intelligenz (KI). Keine Frage: Die Antworten der KI sind erstaunlich gut und neben dem Verfassen reiner Texte kann der Chatbot auch Quellcode für Software schreiben und viele weitere Aufgaben übernehmen.

Person, die ein Dokument mit der Hand schreibt

Seit dem Launch von ChatGPT ist das Interesse an dem Chatbot ungebrochen. Für viele Menschen ist ChatGPT sogar der erste Kontakt mit Künstlicher Intelligenz (KI). Keine Frage: Die Antworten der KI sind erstaunlich gut und neben dem Verfassen reiner Texte kann der Chatbot auch Quellcode für Software schreiben und viele weitere Aufgaben übernehmen.

Doch mit steigender Nutzung haben Datenschutzbehörden in mehreren Ländern begonnen, auf Probleme beim ChatGPT Datenschutz und ChatGPT Urheberrecht hinzuweisen. Wir schauen in diesem Blogbeitrag auf die wichtigsten Fragen rund um die Nutzung von ChatGPT und erstelltem ChatGPT Content.

Woher nimmt ChatGPT die Informationen?

Die Daten, mit denen ChatGPT trainiert wurde, stammen hauptsächlich aus Internetquellen wie Wikipedia, Nachrichtenseiten und Portalen für wissenschaftliche Fachartikel. Insgesamt umfasst der dem Sprachmodell zugrunde liegende Textkorpus etwa 500 Milliarden Wörtern (SWR).

Zufällig gestapelte offene Bücher

Bild: Gülfer ERGİN über Unsplash

Die Trainingsmethode, mit der ChatGPT seine Daten und Informationen erhält, nennt man Webscrapping. Darunter versteht man das automatische Auslesen von Website-Inhalten. Legal ist der Einsatz von Webscrapping jedoch nur, wenn – laut einem Urteil des Bundesgerichtshofs (Hubspot) – Daten und Informationen ausgelesen werden, die ausschließlich frei zugänglich auf einer Website sind. Ebenfalls verboten ist die Extraktion von Daten, die durch eine Firewall oder ähnliche Maßnahmen geschützt sind.

Kann ChatGPT Quellen angeben?

ChatGPT selbst gibt kaum seine Quellen an. Auch mit entsprechenden Befehlen (Prompts) lassen sich die jeweiligen Quellen nur schwer ermitteln. Neben der offenen Frage, woher ChatGPT die Vorlagen für seine Antworten nimmt, liegt dies auch an der Art und Weise, wie ChatGPT auf Eingaben reagiert.

Was sind Prompts und wie kannst du sie erfolgreich für dein Unternehmen einsetzen? Erfahre mehr über die vielfältigen Möglichkeiten von Künstlicher Intelligenz im Lehrgang KI-Manager (IHK)!

Welche Daten sammelt ChatGPT?

Das Sprachmodell von ChatGPT ähnelt herkömmlichen Chatbots. Seine Antworten sind jedoch nicht auf wenige vorgefertigte Antworten beschränkt, die oft zu einem sich wiederholenden Gesprächsverlauf führen. ChatGPT ist in der Lage, vollständige Konversationen zu führen und innerhalb von Sekundenbruchteilen passende Antworten zu liefern.

Dazu nimmt ChatGPT vornehmlich Daten aus seinem Textkorpus, die Aufschluss über Muster in der menschlichen Sprache geben. Um zu verstehen, wie ChatGPT auf Eingaben antwortet, muss man wissen, wie ChatGPT seine Antworten zusammenstellt.

Abstraktes neuronales Netzwerk auf schwarzem Hintergrund

Bild: Uriel SC über Unsplash

ChatGPT antwortet nicht wie Menschen in ganzen Sätzen, sondern Wort für Wort. Nach jedem Wort berechnet ChatGPT, welches Wort am wahrscheinlichsten auf das vorhergehende folgt. So erstellt ChatGPT seine Antworten, die aus ganzen Sätzen bis hin zu einem vollständigen Text bestehen können.

Um an die benötigten Daten zu gelangen, verwendet ChatGPT Deep-Learning-Technologie, deren Algorithmen auf die Analyse der menschlichen Sprache ausgerichtet sind. Wie funktioniert sie, welche Unterschiede bestehen zwischen dem geschriebenen und gesprochenen Wort oder wie werden aus einfachen Wörtern ganze Sätze? ChatGPT verwendet alle Daten, die dem KI Chat Bot helfen, mehr über die Grundlagen natürlicher Sprache zu erfahren.

Diese Art der Informationsgewinnung lässt sich deshalb als künstliches neuronales Netz in Analogie zum menschlichen Nervensystem beschreiben. So betrachtet möchte ChatGPT lernen und denken wie unser Gehirn. Aus diesem Grund zitiert ChatGPT seine Quellen nicht direkt, sondern nur einzelne Worte, Zusammenhänge oder Muster und versucht diese entsprechend seiner Funktionsweise nach Wahrscheinlichkeiten sinnvoll zu neuen Sätzen und Texten anzuordnen.

Ist ChatGPT DSGVO konform?

Für das Training nutzt ChatGPT neben seinem Textkorpus auch sämtliche Daten aus den Benutzereingaben. Dabei ist nicht auszuschließen, dass die Anwenderinnen und Anwender auch persönliche und sensible Informationen in den Chat eingeben (Datenschutzexperte.de).

Dieser Umstand führte in Italien bereits zu einer Sperrung von ChatGPT (Tagesschau). Nach Ansicht der dortigen Datenschutzaufsichtsbehörde fehlen bei ChatGPT eine Auflistung der verwendeten Datenquellen, Informationen über die Algorithmen und Klarheit darüber, ob Dritte für kommerzielle Zwecke Einsicht in die Daten erhalten (Datenschutzexperte.de).

Diese Auffassung teilen auch die Datenschutzbehörden der deutschen Bundesländer. Außerdem bemängelt die italienische Datenschutzbehörde das Fehlen eines Filters zur Verhinderung der Nutzung durch Kinder unter 13 Jahren, die das Tool nach den Geschäftsbedingungen von ChatGPT und der ChatGPT Privacy Policy gar nicht nutzen dürften (Tagesschau).

Weitere Bedenken ergeben sich aus der Tatsache, dass bei der Eingabe vermutlich Daten in die USA übermittelt werden: Die USA sind der Sitz des hinter Chat GPT stehenden Unternehmens OpenAI und gelten im Sinne der europäischen Datenschutzgrundverordnung als ein Drittland außerhalb der EU.

Derzeit besteht allerdings kein Datenschutzabkommen zwischen der EU und den USA (Datenschutzexperte.de), weshalb Daten nur unter hohen Anforderungen in die USA übertragen werden dürfen. Ob ChatGPT bzw. OpenAI diese datenschutzrechtlichen Anforderungen erfüllen, lässt sich im Moment nicht abschließend beurteilen.

Virtueller Richterhammer als 3D-Gittermodell

Ist die Nutzung von ChatGPT Datenschutz-konform und sicher?

Aufgrund dieser Mängel und fehlender Transparenz ist aktuell (Stand Mai 2023) keine vollständige datenschutzkonforme Nutzung von ChatGPT zu gewährleisten. Open AI selbst garantiert nicht die Sicherheit der von den Nutzerinnen und Nutzer eingegebenen Daten und Informationen (Chip). Gerade Unternehmen, die ChatGPT für ihre Zwecke nutzen wollen oder planen, ChatGPT in ihre Dienste zu integrieren, sollten dies berücksichtigen.

Für die private Nutzung sollten die Nutzerinnen und Nutzer für einen angemessen ChatGPT Datenschutz idealerweise selbst einige Sicherheitsmaßnahmen treffen. Dazu gehören die Vermeidung von persönlichen sowie sensiblen Daten und Informationen, die Nutzung des Inkognito/Privat-Modus ihres jeweiligen Browsers oder auch die Nutzung eines VPN-Clients.

Dadurch werden Browserverlauf und -daten nicht gespeichert und der Zugriff von ChatGPT Cookies auf Informationen aus dem genutzten Browser bleibt verwehrt. Außerdem empfiehlt es sich, ChatGPT nur über eine sichere Internetverbindung aufzurufen und einen Browser zu verwenden, der Surfen über eine verschlüsselte HTTPS-Verbindung ermöglicht.