China: „Hochzeit“ zwischen LLM und Chips Deepseek optimiert neues KI-Modell für chinesische Halbleiter

Von Henrik Bork 3 min Lesedauer

Anbieter zum Thema

Das chinesische Start-up Deepseek hat mit „V3.1“ eine erweiterte Version seines Flaggschiffmodells vorgestellt. Erstmals wird das System auf heimische Chiptechnologien zugeschnitten – ein Schritt, der als Signal für Chinas Bestrebungen nach technologischer Unabhängigkeit gilt.

Das Start-up Deepseek präsentiert mit Version 3.1 Berichten zufolge ein KI-Modell, das speziell auf chinesische Halbleiter zugeschnitten ist.(Bild:  Deepseek)
Das Start-up Deepseek präsentiert mit Version 3.1 Berichten zufolge ein KI-Modell, das speziell auf chinesische Halbleiter zugeschnitten ist.
(Bild: Deepseek)

Das chinesische KI-Start-up Deepseek hat eine erweiterte Version seines Flaggschiff-Modells V3 vorgestellt. Die neue Version namens „Deepseek-V3.1“ verfüge über eine Funktion, die speziell für in China gefertigte Chips optimiert ist und höhere Verarbeitungsgeschwindigkeiten ermögliche, berichtet die Nachrichtenagentur Reuters.

Die Fokussierung auf einheimische Halbleiter wird von Insidern als Signal dafür gewertet, dass Deepseek seine KI-Modelle jetzt auf Chinas eigenes Halbleiter-Ökosystem zuschneidet. Die Regierung in Peking drängt als Reaktion auf Exportbeschränkungen aus Washington notgedrungen immer stärker auf den Einsatz heimischer Technologien.

Deepseek selbst schreibt auf seinem WeChat-Kanal, das neue Präzisionsformat „UE8M0 FP8“ des Modells sei für „bald erscheinende inländische Chips der nächsten Generation“ ausgelegt. Konkrete Chipmodelle nennt Deepseek bisher nicht. Diese neue Integration von Software und Hardware aus chinesischer Produktion stärke die „inländische Rechenleistungskette“, schreibt dazu ein Analyst des chinesischen Wertpapierhauses Huatai Securities. Die Verzahnung von in China selbst entwickelter Software und heimischer Chiptechnik ermögliche schnellere Fortschritte.

Schritt zur Selbstversorgung

Anfang des Jahres hatte das Unternehmen Deepseek weltweit erstmals für Schlagzeilen gesorgt, als es ein KI-Modell präsentierte, das es mit ChatGPT aufnehmen kann, allerdings zu wesentlich geringeren Entwicklungskosten. In China ist das KI-Modell inzwischen ähnlich populär wie der Rivale von OpenAI im Westen. Das nun vorgestellte Update ist bereits die dritte Modell-Aktualisierung in diesem Jahr.

Im Mai hat das System R1 ein Upgrade erhalten. Im März war schon die Erweiterung Deepseek V3 veröffentlicht worden. Das Herzstück der jüngsten Version Deepseek-V3.1 ist ein spezielles Zahlenformat für KI-Berechnungen. 

FP8 steht für Floating Point 8, also Gleitkomma-Zahlen mit 8-Bit-Länge. Das ist ein Datenformat, das KI-Modelle effizienter macht, weil es weniger Speicher und Bandbreite benötigt und so schneller arbeiten kann. Die von Deepseek gewählte Variante UE8M0 setzt dabei auf einen äußerst großen Wertebereich („range first“) und verzichtet weitgehend auf Nachkommagenauigkeit. Dadurch läuft das Modell auch auf chinesischen KI-Prozessoren stabil, die im Gegensatz zu Nvidias Hochleistungs-Grafikprozessoren noch keine speziellen Optimierungen für FP8 bieten.

Chip War als Hintergrund

Die Entwicklung erfolgt vor dem Hintergrund des anhaltenden „Chip War“ mit den USA und der parallel dazu verhängten Restriktionen beim Export von Lithografie-Maschinen und anderen Ausrüstungen nach China. Erst kürzlich haben chinesische Behörden den US-Chiphersteller Nvidia vorgeladen, um Erklärungen zu angeblichen „Sicherheitsrisiken“ seines neuen H20-Chips einzufordern.

China will langfristig seine Abhängigkeit von amerikanischer Hardware verringern und eigene Halbleiterlösungen vorantreiben. Deepseek selbst hatte kürzlich die Folgen dieser Technologie-Rivalität zwischen Washington und Peking zu spüren bekommen. Das Unternehmen hatte Medienberichten zufolge den Marktstart seines nächsten KI-Modells (Codename R2) verschieben müssen, offenbar nachdem es beim Training mit Ascend-Prozessoren des chinesischen Chipherstellers Huawei zu technischen Problemen gekommen war, wie die Financial Times berichtete.

Verzögerung bei R2-Start

Deepseek hatte angeblich auf Drängen der Regierung versucht, das Modell nicht mit 2.048 Nvidia-H800-Grafikchips zu trainieren, sondern mit Huaweis KI-Chips. Schließlich habe sich das Team jedoch gezwungen gesehen, wieder Nvidia-Hardware für das Training einzusetzen und den Huawei-Chip lediglich für die Inferenzphase zu verwenden, hieß es in den Medienberichten. Diese Umstellung wurde als Hauptgrund dafür genannt, dass sich der ursprünglich für Mai geplante R2-Start von Deepseek verzögert hat.

Schritt zur Selbstversorgung

Ein eng verzahntes Ökosystem aus Hardware und Software „Made in China“ wäre ein wichtiger Schritt in Richtung „Selbstversorgung“, also der Unabhängigkeit von US-amerikanischen Lieferanten. „Das ist eine Art ,gegenseitiger Erfolg‘ von Software und Hardware. Modellentwickler sind bereit, etwas Detailgenauigkeit zu opfern, damit einheimische Chips stabiler laufen, und Chiphersteller können durch diese Kooperation schrittweise ein eigenes FP8-Ökosystem aufbauen“, urteilt das chinesische Tech-Portal 36Kr. (sb)

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

(ID:50538614)