Billige KI … zu welchem Preis? DeepSeek an der Leine: Fragwürdige Zensur, undurchsichtige Datensicherheit und chinesische KI-Mitbewerber

Von Susanne Braun 5 min Lesedauer

Anbieter zum Thema

DeepSeek beherrscht die Finanzmärkte und treibt etablierte US-KI-Unternehmen mit Effizienzversprechen vor sich her. Doch nicht alles ist Gold, was glänzt. Bei DeepSeek müssen Fragen zur Datenqualität, Datensicherheit und zu staatlicher Zensur beantwortet werden. Und aus China kommen Modelle, die noch effektiver sein sollen: Qwen von der Alibaba Group und Doubao von ByteDance.

Günstige KI, die zudem effizienter und stromsparender arbeitet kann die Zukunft der Technologie darstellen. Doch was ist mit Datenschutz und Zensur?(Bild:  Dall-E / KI-generiert)
Günstige KI, die zudem effizienter und stromsparender arbeitet kann die Zukunft der Technologie darstellen. Doch was ist mit Datenschutz und Zensur?
(Bild: Dall-E / KI-generiert)

Die Modelle des chinesischen Unternehmens DeepSeek mischen die von US-amerikanischen Konzernen dominierte KI-Welt gehörig auf. Nach der Ankündigung des effizientesten Logik-Modells DeepSeek-R1 gaben die Marktwerte von Nvidia, Oracle, Microsoft und Co. kräftig nach. Das Versprechen von DeepSeek: KI-Modelle mithilfe neuer Algorithmen effizienter zu trainieren und zu betreiben. Das freut nicht nur Fans der Energieeffizienz, sondern auch Anhänger günstiger Angebote.

In einem ersten Bericht haben wir für Sie bereits zusammengefasst, welchen disruptiven Prozess DeepSeek in der KI-Welt ausgelöst hat.

Nachfolgend widmen wir uns Fragen nach dem Datenschutz und Datensicherheit, nach Zensur bestimmter Themen in der Volksrepublik China und den Modellen aus dem eigenen Land, die DeepSeek-R1 und DeepSeek-V3 bereits jetzt unter Druck setzen wollen.

KI an der Leine: Zensur in China

DeepSeek-R1 ist ein im Januar 2025 veröffentlichtes KI-Modell, das auf logisches Denken und die Hochgeschwindigkeitsdatenverarbeitung mit bis zu 70 Milliarden Parametern ausgerichtet ist. DeepSeek-V3 hingegen ist ein universell einsetzbares Mehrzweck-Large-Language-Model mit bis zu 671 Milliarden Parametern und wurde am 20. Dezember 2024 veröffentlicht.

Bei beiden KI-Systemen wurde bereits beobachtet, dass Antworten auf die Prompts zensiert oder nicht ausgegeben werden, wenn sich die Antworten um Themen drehen, die der chinesischen Regierung eher unliebsam sind. Das ist bei einem Modell von chinesischen Entwicklern wenig überraschend, denn es ist davon auszugehen, dass DeepSeek ebenfalls von Chinas massiven Subventionen in die heimische fortschrittliche Technologie-Infrastruktur profitiert. Zudem muss jedes Unternehmen, das Dienste in China anbietet, die Anforderungen der Regierung erfüllen.

Sensible Themen wie die Kommunistische Partei der Volksrepublik, Präsident Xi Jinping oder historische Ereignisse wie die studentischen Proteste am Tiananmenplatz und deren Folgen werden ausweichend oder mit Propaganda beantwortet. Oder die Prompts werden ignoriert. Ähnliches konnten wir beobachten: Antworten zum Status von Taiwan wurden in Echtzeit von Nachrichten überschrieben, dass die KI auf dieses Thema nicht antworten könne.

Solche Maßnahmen lassen dann freilich die Frage zur Qualität der Daten aufkommen, mit denen die Modelle von DeepSeek trainiert wurden – denn irgendwo müssen die „anderen Wahrheiten“ herrühren und als „richtig“ klassifiziert werden. Entsprechend gibt es Bedenken, dass der chinesische Regierungsapparat DeepSeek-Modelle zur Einflussnahme, Desinformation, Überwachung und gar zur Entwicklung von Cyberwaffen nutzen könnte.  Zensierte Antworten – und der Schutz der eingegebenen Daten – scheinen eine Vielzahl an Interessierten an DeepSeek nicht abzuschrecken, denn in kürzester Zeit avancierte die DeepSeek-App etwa in den USA im iOS-Universum zur Nummer 1.

Datensicherheit: Das Kleingedruckte bei DeepSeek

Es ist kein Geheimnis, dass viele LLMs die eingegebenen Daten der Prompts für das Training benutzen. Bei OpenAI gibt es Ausnahmen. Non-API-Content sind Inhalte von Consumer-Diensten, API-Content entsteht bei den Business-Diensten. Alle über das Web zugänglichen Interfaces von ChatGPT und DALL:E sind sogenannter Non-API-Content. All die dort eingegebenen Inhalte werden für eigene Zwecke, sprich zur Weiterentwicklung und Verbesserung des Angebots, genutzt. Die API-Inhalte werden nicht weiterverwendet, außer der Nutzer stimmt dem ausdrücklich zu – wovon aber abzuraten ist.

Bedeutet also, dass jeglicher Inhalt, den Sie in der ChatGPT-App oder im Browser beim Prompten verwenden, von OpenAI weiterverwendet wird. Aber: Diese Option kann in jedem OpenAI-Account deaktiviert werden. Gehen Sie dafür auf Ihr Profil, wählen Sie Einstellungen und deaktivieren Sie dann das Training mit Ihren Prompts unter der Option Datenkontrollen → Das Modell für alle verbessern.

Datenschutzrechtlich sind konsumentenbasierte Chatbots ebenfalls heikel, denn für ein Produkt wie ChatGPT inklusive Datenübertragung auf Server in den USA, und dann auch Datenspeicherung, liegt gemäß Artikel 44 ff. der DSGVO keine Grundlage für personenbezogene Daten vor. Die reichlich billige und damit auch unsichere Lösung: Inkludieren Sie keine personenbezogenen Daten in Ihre Prompts. Darauf sollten Sie die Nutzer in einem beruflichen wie privaten Umfeld trainieren.

Wie sieht es im Vergleich dazu mit der Datensicherheit bei DeepSeek aus? DeepSeek speichert alle Prompts und Daten zu Benutzerinteraktionen wie die Tastaturanschlagsgeschwindigkeit, berichten die Autoren von Keyed. Zudem ist unter dem Blickwinkel der DSGVO unklar, wo DeepSeek personenbezogene Daten verarbeitet. Es ist wahrscheinlich, dass das außerhalb der EU geschieht, doch offizielle Angaben gibt es dazu nicht. Nutzerdaten aber, das geht aus den Nutzungsbedingungen hervor, werden auf Servern in China gespeichert. „DeepSeek bietet keine transparente Datenschutzerklärung, die den Anforderungen der DSGVO entspricht. Unternehmen, die DeepSeek nutzen möchten, benötigen eine AVV gemäß Art. 28 DSGVO. Eine solche Vereinbarung ist jedoch nicht vorhanden, was eine rechtskonforme Nutzung im Unternehmenskontext unmöglich macht“, so Keyed.

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

Ein großes Datenschutzproblem besteht auch im Standort DeepSeeks. Das Unternehmen unterliegt chinesischem Recht. Aufgrund chinesischer Sicherheitsregularien kann der Staat von DeepSeek die Herausgabe von Daten fordern und dieser Forderung muss ein chinesisches Unternehmen nachkommen. Übrigens wurde die DeepSeek-App unter anderem in Italien vorerst aus den Google- und Apple-Stores geworfen, weil diverse Fragen zum Schutz personenbezogener Daten bislang unbeantwortet waren. Auch Irlands Datenschutzbeauftragter hat eine entsprechende Anfrage an DeepSeek gestellt (via Reuters). Es ist also nicht so, als bemühten sich Regulatoren nicht um wichtige Antworten für die Nutzer der DeepSeek-Angebote.

Kurios ist da die Nachricht, dass Mitarbeiter des US-Verteidigungsministeriums auf die Datensicherheit wohl eher pfeifen (via TechCrunch). Die Administration des Pentagons musste demnach Anfragen an DeepSeek-Server aus dem eigenen Netzwerk blockieren. Taiwan teilt Regierungsbeamten mit, dass es aufgrund von Sicherheitsbedenken nicht ratsam wäre, DeepSeek zu nutzen.

Macht das DeepSeek unsicher? Das kommt ganz darauf an, wie Sie die Tools des Unternehmens nutzen wollen – so wie das auf die meisten KI-Modelle für Konsumenten zutrifft. Für allgemeine Anfragen und technische Anwendungen können Sie R1 wie V3 vermutlich sicher nutzen. Sensible, personenbezogene Daten und geschäftskritische Anwendungen sollten Sie vorerst besser nicht in Kontakt mit DeepSeek-Modellen bringen. Und auch nicht mit anderen.

DeepSeeks Konkurrenz aus China: Qwen und Doubao

Der Name Qwen ist im ersten Teil unseres Überblicks zu DeepSeek schon einmal gefallen. Die KI-Konkurrenz aus der Volksrepublik China schläft nicht. Qwen ist ein Modell von Amazon-Konkurrent Alibaba, das in der Version Qwen 2.5-Max (laut eigenen Angaben) fast durchweg DeepSeek-V3 übertreffe – und damit entsprechend auch die aktuellsten Versionen von ChatGPT und Llama.

Der Eindruck, den DeepSeek bei westlichen Medien und Investoren hinterlassen hat, hat auch bei den Alibaba-Entwicklern deutlich gewirkt, die Qwen 2-5-Max eher untypisch zum chinesischen Neujahr gelauncht haben. Gleiches gilt übrigens für die KI-Entwickler beim Konzern ByteDance, der hinter TikTok steht. Am 22. Januar 2025 startete ByteDance das Modell Doubao-1.5-pro, das ebenfalls OpenAIs Reasoning-Modelle im Benchmark AIME deklassieren soll. (sb)

(ID:50305814)