Zum Inhalt springen

DeepSeek: Was steckt hinter dem chinesischen KI-Modell?

DeepSeek schockierte Anfang 2025 die KI-Welt. Was das Modell technisch besonders macht, welche Datenschutzfragen offen sind und wann es sinnvoll einsetzbar ist.

DeepSeek: Was steckt hinter dem chinesischen KI-Modell?

Am 20. Januar 2025 veröffentlichte ein chinesisches KI-Labor ein neues Modell. Innerhalb von Tagen war die KI-Welt in Aufruhr, die Aktien amerikanischer KI-Unternehmen brachen ein, und in Tech-Kreisen war kaum ein anderes Thema. Was war passiert?

DeepSeek R1 hatte auf Standard-Benchmarks mit ChatGPT (GPT-4) und Claude gleichgezogen, und das für einen Bruchteil der Trainingskosten. Das traf eine Grundannahme der westlichen KI-Industrie direkt im Kern: dass Qualität proportional zu Investitionen ist, und dass chinesische Anbieter durch US-Exportkontrollen auf Chips deutlich im Nachteil sind.

Beide Annahmen stimmten an diesem Tag nicht mehr.


Was DeepSeek technisch besonders macht

DeepSeek wurde von einem chinesischen Quant-Hedgefonds namens High-Flyer gegründet, der seit Jahren in KI-Forschung investiert. Die Forschungsgruppe hat sich auf Trainingseffizienz spezialisiert: Wie holt man mehr Leistung aus weniger Rechenkapazität heraus?

Das Ergebnis war ein Modell mit einer ungewöhnlichen Architektur: Mixture of Experts (MoE) kombiniert mit innovativen Trainingstechniken, die den Speicherbedarf stark reduzierten. Statt wie üblich tausende teure Nvidia H100-Chips zu benötigen, trainierte DeepSeek auf älteren, durch Exportbeschränkungen verfügbaren Hardware-Generationen.

Die gemeldeten Trainingskosten von unter 6 Millionen US-Dollar (verglichen mit Milliarden bei GPT-4) wurden von einigen Experten skeptisch kommentiert. Vorarbeiten sowie Infrastrukturkosten dürften nicht vollständig eingerechnet worden sein. Aber selbst mit großzügigen Korrekturen war die Kosteneffizienz außergewöhnlich.

DeepSeek veröffentlichte die Gewichte als Open Source. Das Modell lässt sich also herunterladen und selbst betreiben. Das ist ein wichtiger Punkt, auf den wir zurückkommen.


Warum das für die globale KI-Entwicklung relevant ist

Die USA hatten über Jahre versucht, den Vorsprung chinesischer KI-Entwicklung durch Exportkontrollen auf Hochleistungschips einzuschränken. DeepSeek zeigte, dass dieser Ansatz begrenzt greift, wenn Unternehmen an der Effizienz statt an der schieren Rechenleistung arbeiten.

Das hat industriepolitische Konsequenzen weit über China hinaus: Wenn hochwertige LLMs mit geringerem Ressourceneinsatz trainiert werden können, sinken die Barrieren für weitere Akteure weltweit. Das ist für die Idee europäischer Sprachmodelle, wie sie etwa Aleph Alpha verfolgt, potenziell eine gute Nachricht.


Die Datenschutzfragen, ehrlich bewertet

Wer die deutsche oder europäische Version von deepseek.com nutzt, sendet seine Eingaben an Server in China. Das ist das zentrale Datenschutzproblem, und es ist real.

China hat kein Datenschutzrecht, das mit der DSGVO vergleichbar wäre. Das chinesische Cybersicherheitsgesetz und das Datensicherheitsgesetz verpflichten Unternehmen unter bestimmten Umständen zur Kooperation mit staatlichen Behörden. In welchem Umfang das in der Praxis für DeepSeeks Server gilt, ist von außen nicht überprüfbar.

Dazu kommen Hinweise aus Sicherheitsanalysen: Mehrere Forscher dokumentierten kurz nach dem Launch, dass die App auf einigen Plattformen Nutzerdaten an Dritte übertrug, darunter ByteDance-Infrastruktur. Ob das an mangelnder Sorgfalt oder an Absicht lag, ist unklar. Transparenz sieht anders aus.

Für europäische Unternehmen bedeutet das: Wer DeepSeek über die offizielle Webseite oder App nutzt und dabei Kundendaten, Personaldaten oder andere personenbezogene Informationen eingibt, verstößt wahrscheinlich gegen die DSGVO. Ein AVV mit einem chinesischen Anbieter, der chinesischem Recht unterliegt, erfüllt die DSGVO-Anforderungen nicht.

Das ist keine politische Aussage. Das ist eine rechtliche.


Die Open-Source-Option ändert das Bild

Hier kommt der wichtige Unterschied: DeepSeek hat die Modellgewichte veröffentlicht.

Das bedeutet, du kannst DeepSeek-Modelle auf deiner eigenen Infrastruktur betreiben: in einem deutschen Rechenzentrum, auf einem eigenen Server, in einer europäischen Cloud. In diesem Szenario verlässt kein Datum deine Infrastruktur. Es gibt keine Verbindung zu chinesischen Servern. Die Datenschutzfragen stellen sich nicht.

Self-hosted DeepSeek ist technisch anspruchsvoller als die Nutzung einer API, aber für viele Unternehmen ab mittlerer Größe ein praktikabler Weg. Anbieter wie Hetzner oder IONOS bieten die Rechenkapazität dafür. Tools wie Ollama vereinfachen das lokale Ausführen kleinerer Modellvarianten erheblich.

Für Entwickler, die mit Code-Assistenz arbeiten: DeepSeek-Coder gilt als eines der stärksten öffentlichen Modelle für Programmieraufgaben. Selbst gehostet und ohne Personenbezug im Prompt: ein legitimer Einsatz. Einen strukturierten Blick auf KI im Entwickleralltag bietet unser Use Case KI-gestützter Entwicklungsassistent.


Wann DeepSeek sinnvoll ist, und wann nicht

Sinnvoll: Technische Aufgaben ohne Personenbezug, selbst gehostet auf europäischer Infrastruktur. Für Entwickler und Forscher, die das Modell lokal evaluieren wollen. Als Benchmark-Vergleich zum Verständnis des State of the Art.

Vorsicht: Nutzung über die offizielle Plattform (deepseek.com) mit geschäftlichen oder personenbezogenen Daten. Enterprise-Einsatz über die Cloud-API ohne geklärte Datenschutzgrundlage. In regulierten Branchen wie Gesundheit oder Finanzen generell ohne intensive Vorprüfung. In der Rechtsberatung etwa, wo KI für Vertragsanalyse eingesetzt wird, ist die Datenlokation ein zentrales Kriterium.

Finger weg: Wenn du keine Möglichkeit hast, die Datenflüsse zu kontrollieren, und trotzdem Kundendaten oder andere sensible Informationen verarbeiten willst.


Was der DeepSeek-Moment für die KI-Branche bedeutet

Die Branche hat nach dem Januar-2025-Schock begonnen, ihre Annahmen zu hinterfragen. Das Ergebnis war nicht, dass alle zu DeepSeek gewechselt sind, sondern dass alle angefangen haben, Effizienz ernstzunehmen.

OpenAI und Anthropic haben daraufhin eigene “thinking”-Modelle mit ähnlichen Ansätzen veröffentlicht. Die Trainingskosten für neue Modellgenerationen sind gesunken. Die Idee, dass nur milliardenschwere Investments zu frontier-Modellen führen, ist weniger selbstverständlich als zuvor.

Das ist eine positive Entwicklung. Mehr Akteure und niedrigere Einstiegsbarrieren: Das ist das eigentliche Erbe des DeepSeek-Moments. Mehr über den Stand der wichtigsten Modelle findest du im Vergleichsartikel Claude, ChatGPT, Gemini: Welches KI-Modell passt zu dir?.


Fazit ohne Schwarzweißdenken

DeepSeek ist ein beeindruckend effizientes Modell von einem ernstzunehmenden Forschungsteam. Die Datenschutzbedenken bei der Nutzung über chinesische Server sind real und nicht wegzureden.

Das bedeutet nicht, dass das Modell tabu ist. Es bedeutet, dass der Einsatz Sorgfalt erfordert. Self-Hosting ist für viele Anwendungsfälle die richtige Antwort.

Wer KI-Tools unter Datenschutzgesichtspunkten bewertet, sollte DeepSeek nicht anders behandeln als andere Anbieter: Wo laufen die Server? Was passiert mit meinen Daten? Gibt es vertragliche Grundlagen?

Bei DeepSeek über die eigene gehostete Instanz: meistens ja. Bei deepseek.com mit Unternehmensdaten: meistens nein.

Wenn du regelmäßige Einschätzungen zu KI-Tools ohne Hysterie und ohne Werbung bekommen möchtest, findest du sie in unserem Newsletter.

Mehr KI-Wissen

KI-Wochenbriefing: jeden Freitag KI-News, Praxistipps und Tools

Kostenlos abonnieren, jederzeit abmeldbar, kein Spam.

Diesen Artikel teilen:

Autor und Redaktion

Prof. Dr. Daniel Sonnet

Prof. Dr. Daniel Sonnet

Gründer von KI-Syndikat, Professor an der Hochschule Fresenius

Daniel ist Data- und KI-Experte, Hochschullehrer an der Hochschule Fresenius (Professur Quantitative Methoden und Data Science) und Mitgründer der Gerabo GmbH in Hamburg. Er verbindet über ein Jahrzehnt Hochschullehre mit unternehmerischer Praxis und bringt KI-Wissen direkt in die Community.

Zum Profil

Freddie Feder

KI-Assistent und Lektor

Hat diesen Artikel mit recherchiert und geschrieben und ihn danach Satz für Satz lektoriert: Fakten geprüft, Ton geglättet und alles rausgeworfen, was klingt, als hätte es eine Maschine gebaut. Die inhaltliche Verantwortung liegt bei den menschlichen Autoren.

Mehr über unser Team

Das könnte dich auch interessieren

Wenn die KI sich erinnert, gehört das Wissen plötzlich nicht mehr dem Unternehmen

Persistentes KI-Gedächtnis ist keine Komfortfunktion, sondern eine neue Asset-Klasse. Sie entsteht zwischen Mitarbeiter und Modell. Und in den AGB von OpenAI, Anthropic und Google gehört sie weder dem Arbeitgeber noch dem Anbieter.

6 Min.

Precision Farming gibt Bauern mehr Kontrolle, oder doch nicht?

KI-gestützte Landwirtschaft verspricht Effizienz und Autonomie. Doch wer die Felddaten eines modernen Betriebs wirklich kontrolliert, ist eine unbequeme Antwort.

5 Min.

Open Source vs. Closed Source KI: Was passt zu deinem Unternehmen?

Open Source oder Closed Source KI? Für DSGVO-sensible Unternehmen ist Managed Open Source meist die einzig sinnvolle Wahl – warum, zeigt dieser Entscheidungsrahmen.

5 Min.

Lokale KI mit Ollama: Warum manche Unternehmen KI ohne Cloud betreiben

Was mit deinen Daten passiert, wenn du ChatGPT nutzt – und wann lokale KI mit Ollama die sinnvollere Alternative ist.

5 Min.

DSGVO-konforme KI-Tools: Europäische Alternativen 2026

DSGVO-konforme KI-Tools im Überblick: welche europäischen Anbieter es gibt, was datenschutzkonform wirklich heißt und welche Fragen du stellen solltest.

6 Min.

Gelöscht ist nicht vergessen: Warum KI-Datenschutz nicht erst bei der Löschfrist beginnt

Der Vorstoß zur KI-Nutzung mit echten Steuerdaten zeigt ein Grundproblem professioneller KI-Projekte: Wer personenbezogene Trainingsdaten später löscht, hat damit noch nicht geklärt, was ein Modell daraus gelernt, verdichtet oder memorisiert hat.

12 Min.

Kommentare

Kommentare werden in Kürze freigeschaltet. Bis dahin freuen wir uns über dein Feedback per E-Mail an kontakt@ki-syndikat.de.

Kostenloser Newsletter

Bleib auf dem neuesten
Stand der KI

Wähle deine Themen und erhalte relevante KI-News, Praxistipps und exklusive Inhalte direkt in dein Postfach – kein Spam, jederzeit abmeldbar.

Was interessiert dich? Wähle 1–4 Themen, du bekommst nur Inhalte dazu.

Mit der Anmeldung stimmst du unserer Datenschutzerklärung zu. Jederzeit abmeldbar.

Kostenlos
Kein Spam
Jederzeit abmeldbar