Der immense Rechenhunger moderner KI-Anwendungen treibt nicht nur die Entwicklung von GPUs voran, sondern zwingt auch die Speicherindustrie zu einem architektonischen Umdenken. Neue Formfaktoren, extreme Packdichten und unkonventionelle Kühlkonzepte werden zum Standard.
Cold-Plate-Kühlung im Detail: Für komplett lüfterlose Serverumgebungen hat Solidigm ein flüssigkeitsgekühltes SSD-Design entwickelt, das die extreme Abwärme hochverdichteter KI-Speichersysteme per Direktkontakt (Direct-to-Chip) abführt.
(Bild: Solidigm)
Wer heute den Aufbau von KI-Rechenzentren oder leistungsstarken Edge-Infrastrukturen plant, stößt schnell an harte physikalische Grenzen. Platzbedarf, thermische Belastung und vor allem die verfügbare elektrische Leistung limitieren den Ausbau massiv. In diesem Umfeld spielt das Hardware-Design von Speichermedien eine unerwartet zentrale Rolle, wie Scott Shadley, Director of Leadership Narrative & Evangelist beim Speicherhersteller Solidigm, Mitte Juni auf dem Storage Event „Technology Live“ von A3 Communication in München verdeutlichte. Bei Solidigm handelt es sich um den Spin-off von Intels Speichersparte. SK Hynix hatte diese aufgekauft, um 2021 daraus ein eigenes US-Tochterunternehmen zu formen.
Neue Leitwährungen: Energieeffizienz und Quality of Service
Historisch gesehen war der Preis pro Speicherkapazität die wichtigste Kennzahl bei der Beschaffung. Diese Zeiten sind im High-Performance-Computing vorbei. „Früher war es der Dollar pro Gigabyte. Darum kümmert sich heute eigentlich niemand mehr“, erklärt Shadley. „Alles wird heute in erster Linie von einer Stromverbrauchszahl diktiert.“
In Automatisierungs- und KI-Infrastrukturen limitiert der verfügbare Strom am Standort die Anzahl der nutzbaren Rechenbeschleuniger (GPUs). Jedes Watt, das beim Speicher eingespart wird, steht potenziell für zusätzliche Rechenleistung zur Verfügung. Die Lösung liegt in hochverdichteten Solid-State-Drives (SSDs) mit Kapazitäten von bis zu 122 Terabyte. Solidigm rechnet vor, dass ein konventioneller Storage-Cluster aus neun Racks mit 54 kW Leistungsaufnahme durch den Einsatz von High-Density-SSDs auf ein einziges Rack mit nur 1,7 kW komprimiert werden kann.
Dichte SSDs sparen Platz und Strom: Ein einziges Rack mit 122-TB-SSDs ersetzt neun herkömmliche HDD-Racks bei einem Bruchteil des Energiebedarfs.
(Bild: Solidigm)
Neben dem Stromverbrauch wandelt sich auch die Leistungsbewertung grundlegend. Früher prahlten Hersteller mit maximalen IOPS-Werten (Input/Output Operations Per Second). Für KI-Architekturen ist das jedoch nicht mehr die Leitmetrik. Entscheidend ist heute die Vorhersagbarkeit, die sogenannte Quality of Service (QoS). SSDs müssen garantieren, dass Daten mit extrem hoher Zuverlässigkeit (99,999 Prozent) in einem exakten, minimalen Zeitfenster geliefert werden. Wenn Daten in unregelmäßigen Wellen ankommen, wartet die GPU auf den Datensatz. Diese immens teure „Idle Time“ der Prozessoren gilt es durch einen flachen, kontinuierlichen Datenstrom zwingend zu vermeiden.
„Wegwerf-Daten“ und das Ende der Verschleiß-Sorge
Diese Notwendigkeit eines schnellen, kontinuierlichen Datenstroms bricht die klassische Speicherpyramide auf. Die Industrie definiert derzeit eine komplett neue Zwischenschicht im Server-Rack – oft als „G3.5-Schicht“ bezeichnet. Hier geht es nicht um klassischen, persistenten Langzeitspeicher. Diese SSD-Schicht dient ausschließlich dazu, gewaltige Datenblöcke für die KI-Inferenz (etwa den KV-Cache von Large Language Models) rasend schnell lesen und schreiben zu können. Da die Persistenz hier zweitrangig ist, spricht man von flüchtigen „Wegwerf-Daten“ (Ephemeral Storage). Geht etwas verloren, baut das System den Cache einfach neu auf.
Die neue Speicherhierarchie: Komplexe KI-Workloads sprengen traditionelle Architekturkonzepte und erzwingen die Einführung neuer Zwischenschichten (wie die G3.5-Ebene) für schnellen, flüchtigen Speiche
(Bild: Solidigm)
Wer bei solchen Dauer-Schreiblasten auf Flash-Speicher blickt, hat als Hardware-Entwickler sofort das Thema Lebensdauer aufgrund begrenzter Schreibzyklen im Kopf. Doch hier liefert die Branche eine überraschende Erkenntnis: Obwohl für diese Hyper-Density-Speicher aus Kostengründen auf QLC-NAND (Quad-Level Cell) gesetzt wird, ist die Flash-Abnutzung mathematisch irrelevant geworden. Shadley rechnet vor, dass man Laufwerke mit 122 Terabyte innerhalb eines typischen Server-Lebenszyklus von fünf Jahren schlichtweg nicht „kaputtschreiben“ kann. Die heutigen Schnittstellen können die Datenmengen gar nicht schnell genug anliefern, um alle Zellen in dieser Zeit an ihr Limit zu überschreiben.
Das Ende alter Bauformen und die Herausforderung der Signalintegrität
Um diese enormen Packdichten und die damit verbundenen thermischen Anforderungen auf Leiterplatten-Ebene zu erfüllen, muss sich die Mechanik der SSDs radikal ändern. Altbekannte Standards haben ausgedient. „Der U.2-Formfaktor wurde aus einem 2,5-Zoll-Festplattengehäuse abgeleitet“, rekapituliert Shadley. „Das ist das letzte auf Festplatten basierende SSD-Produkt, das heute noch existiert.“
Speicherarchitektur für KI: Eine typische Aufteilung in extrem schnelle, flüssigkeitsgekühlte Speicherebenen (Hot/DAS) am Compute-Knoten und netzwerkangebundene, hochverdichtete Speicher-Racks (Warm/NAS).
(Bild: Solidigm)
Zukünftige Designs orientieren sich ausschließlich an den Erfordernissen der Flash-Technologie. Die Industrie schwenkt daher auf dedizierte Formfaktoren wie E1.S und E3.S um. Diese bieten Entwicklern mehr Platz auf der Platine für Bauteile und sind flacher, was eine effizientere Kühlung und eine höhere Packdichte im Server ermöglicht.
Ein weiterer technischer Treiber für diesen Wechsel ist die Signalintegrität bei steigenden Datenraten. Die kommenden Generationen des PCI-Express-Standards dulden keine Kompromisse bei den physikalischen Steckverbindern. „Wenn wir insbesondere zu PCIe Gen 6 und Gen 7 kommen, brauchen wir aufgrund der Signalintegrität einen Edge-Connector, keinen physischen Standardsteckverbinder. Deshalb wird U.2 bei PCIe Gen 6 allmählich verschwinden“, so Shadley.
Stand: 08.12.2025
Es ist für uns eine Selbstverständlichkeit, dass wir verantwortungsvoll mit Ihren personenbezogenen Daten umgehen. Sofern wir personenbezogene Daten von Ihnen erheben, verarbeiten wir diese unter Beachtung der geltenden Datenschutzvorschriften. Detaillierte Informationen finden Sie in unserer Datenschutzerklärung.
Einwilligung in die Verwendung von Daten zu Werbezwecken
Ich bin damit einverstanden, dass die Vogel Communications Group GmbH & Co. KG, Max-Planckstr. 7-9, 97082 Würzburg einschließlich aller mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen (im weiteren: Vogel Communications Group) meine E-Mail-Adresse für die Zusendung von redaktionellen Newslettern nutzt. Auflistungen der jeweils zugehörigen Unternehmen können hier abgerufen werden.
Der Newsletterinhalt erstreckt sich dabei auf Produkte und Dienstleistungen aller zuvor genannten Unternehmen, darunter beispielsweise Fachzeitschriften und Fachbücher, Veranstaltungen und Messen sowie veranstaltungsbezogene Produkte und Dienstleistungen, Print- und Digital-Mediaangebote und Services wie weitere (redaktionelle) Newsletter, Gewinnspiele, Lead-Kampagnen, Marktforschung im Online- und Offline-Bereich, fachspezifische Webportale und E-Learning-Angebote. Wenn auch meine persönliche Telefonnummer erhoben wurde, darf diese für die Unterbreitung von Angeboten der vorgenannten Produkte und Dienstleistungen der vorgenannten Unternehmen und Marktforschung genutzt werden.
Meine Einwilligung umfasst zudem die Verarbeitung meiner E-Mail-Adresse und Telefonnummer für den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern wie z.B. LinkedIN, Google und Meta. Hierfür darf die Vogel Communications Group die genannten Daten gehasht an Werbepartner übermitteln, die diese Daten dann nutzen, um feststellen zu können, ob ich ebenfalls Mitglied auf den besagten Werbepartnerportalen bin. Die Vogel Communications Group nutzt diese Funktion zu Zwecken des Retargeting (Upselling, Crossselling und Kundenbindung), der Generierung von sog. Lookalike Audiences zur Neukundengewinnung und als Ausschlussgrundlage für laufende Werbekampagnen. Weitere Informationen kann ich dem Abschnitt „Datenabgleich zu Marketingzwecken“ in der Datenschutzerklärung entnehmen.
Falls ich im Internet auf Portalen der Vogel Communications Group einschließlich deren mit ihr im Sinne der §§ 15 ff. AktG verbundenen Unternehmen geschützte Inhalte abrufe, muss ich mich mit weiteren Daten für den Zugang zu diesen Inhalten registrieren. Im Gegenzug für diesen gebührenlosen Zugang zu redaktionellen Inhalten dürfen meine Daten im Sinne dieser Einwilligung für die hier genannten Zwecke verwendet werden. Dies gilt nicht für den Datenabgleich zu Marketingzwecken.
Recht auf Widerruf
Mir ist bewusst, dass ich diese Einwilligung jederzeit für die Zukunft widerrufen kann. Durch meinen Widerruf wird die Rechtmäßigkeit der aufgrund meiner Einwilligung bis zum Widerruf erfolgten Verarbeitung nicht berührt. Um meinen Widerruf zu erklären, kann ich als eine Möglichkeit das unter https://contact.vogel.de abrufbare Kontaktformular nutzen. Sofern ich einzelne von mir abonnierte Newsletter nicht mehr erhalten möchte, kann ich darüber hinaus auch den am Ende eines Newsletters eingebundenen Abmeldelink anklicken. Weitere Informationen zu meinem Widerrufsrecht und dessen Ausübung sowie zu den Folgen meines Widerrufs finde ich in der Datenschutzerklärung, Abschnitt Redaktionelle Newsletter.
Kühlkonzepte am Limit: Immersion Cooling in der Praxis
Eine der größten Herausforderungen bleibt das Thermomanagement. Klassische Luftkühlung in Serverräumen bedeutet Ohrenbetäubung durch massiv hochdrehende Lüfter und stößt an ihre physikalischen Grenzen. Zudem verschwendet die klassische Luftkühlung über Chiller-Systeme im Vergleich zur Flüssigkeitskühlung enorme Mengen an Wasser.
Kühlkonzepte am Limit: Neben der klassischen Luftkühlung werden SSDs zunehmend für Cold-Plate-Systeme und komplette Tauchkühlungen (Immersion Cooling) in nichtleitenden Flüssigkeiten ausgelegt.
(Bild: Solidigm)
Die Industrie bewegt sich daher in Richtung Cold-Plate- und Flüssigkeitskühlung. Da Speicherlaufwerke in der Regel Hot-Plug-fähig, also im laufenden Betrieb austauschbar bleiben müssen, erfordert dies spezielle Konstruktionen. Für lüfterlose Serverumgebungen wurden daher bereits flüssigkeitsgekühlte SSD-Lösungen entwickelt, die direkt an die Kühlkreisläufe angebunden werden können.
Der nächste konsequente Schritt ist das „Immersion Cooling“, also die vollständige Tauchkühlung der Elektronik in nichtleitenden Flüssigkeiten (z.B. speziellen Ölen). Während die Halbleiterkomponenten dieses Tauchbad heute problemlos überstehen, lauern die Tücken für die Ingenieure oft in unerwarteten Details.
Shadley teilte hierzu eine Weisheit aus dem Laboralltag: „Eines der interessantesten Dinge, auf die wir in der Tauchkühlungs-Umgebung stießen, hatte nichts mit den Komponenten oder den funktionalen Aspekten des Laufwerks zu tun. Es ging tatsächlich darum, das Etikett auf dem Laufwerk zu behalten. Anscheinend löst diese Flüssigkeit den Kleber sehr gut auf.“ Die unkonventionelle, aber pragmatische Lösung der Hardware-Entwickler: Transparenter Nagellack zur Fixierung der Beschriftung verhinderte, dass die Etiketten im Kühlbad abfielen.
Bald wassergekühlt für Edge-IT?
Diese tiefgreifenden architektonischen Veränderungen sind keineswegs auf gigantische Rechenzentren der Hyperscaler beschränkt. Gerade kompakte, Flash-optimierte Formfaktoren und lüfterlose oder flüssigkeitsbasierte Kühlkonzepte sind exakt die Bausteine, die für raue Edge-Inferencing-Umgebungen benötigt werden. Wenn KI-Modelle in Zukunft direkt an Telekommunikationsmasten, in der industriellen Fertigung oder in vernetzten Automatisierungsanlagen berechnet werden, sind kompakte Bauweise, maximale Energieeffizienz und Ausfallsicherheit unter schwierigen klimatischen Bedingungen entscheidend. Die Tage des Festplatten-Gehäuses sind damit auch in der Industrie-Hardware gezählt. (mc)