Software-Defined Storage NVMe-Speicher kontert KI-Hardwarekrise mit Kernel-Bypass

Von Manuel Christa 3 min Lesedauer

Anbieter zum Thema

Der globale KI-Boom saugt den Markt für Speicherkomponenten leer. In diesem Spannungsfeld präsentiert NGX Storage aus Ankara mit „NGX ExaScale“ ein neues Scale-out-System. Es kombiniert eine geopolitische Preisstrategie mit tiefgreifenden Architektur-Optimierungen auf Block-Ebene.

Zentrale in Ankara: Der Hauptsitz von NGX Storage befindet sich in der türkischen Hauptstadt.(Bild:  NGX Storage)
Zentrale in Ankara: Der Hauptsitz von NGX Storage befindet sich in der türkischen Hauptstadt.
(Bild: NGX Storage)

Der Speichermarkt steht im Frühjahr 2026 unter massivem Druck. Einerseits explodieren die Datenmengen durch KI-Training und Big Data, andererseits sorgen extreme Lieferengpässe für angespannte IT-Budgets. Genau hier positioniert sich der türkische Hersteller NGX Storage als alternative Kraft zu den etablierten US-Giganten und asiatischen Anbietern. Auf dem Presse-Event „Technology Live“ der Storage-Agentur A3 Communications in Paris stellten CEO Beyhan Çalışkan und CTO Pradeep Ganesan dem Fachpublikum nun detailliert vor, wie sie dieses Ziel erreichen wollen.

Beyhan Çalışkan benennt die aktuelle Marktdynamik schonungslos: „Die USA und die Hyperscaler verbrauchen massiv NAND und DRAM für ihre KI-Infrastruktur. Dadurch erhöhen andere Unternehmen ihre Preise drastisch.“ Anstatt diesen Trend mitzugehen, drosselt NGX laut Çalışkan bewusst die eigenen Margen, um die Preise zu stabilisieren und bei großen europäischen Ausschreibungen kompetitiv zu bleiben. Das Konzept: NGX liefert als reiner Software-Entwickler die Storage-Intelligenz, während Kunden standardisierte Server-Hardware nutzen können. Eine enge technologische Partnerschaft mit NAND-Fertigern wie Kioxia und Western Digital stellt dabei die Kompatibilität sicher und verhindert den berüchtigten Vendor-Lock-in durch proprietäre Appliances.

Deep Tech: Latenzvermeidung durch Kernel-Bypass

(Bild:  NGX Storage)
(Bild: NGX Storage)

Neben der Marktstrategie ist es jedoch vor allem die Architektur unter der Haube, die Systemarchitekten aufhorchen lässt. NGX ExaScale verzichtet komplett auf ein klassisches Dateisystem und operiert als reines Scale-out-Block-Storage. Das technologische Herzstück bildet dabei die radikale Umgehung des Betriebssystems.

Knoten-Aufbau im Detail: Jeder physische Server fungiert als Host für einen virtuellen Knoten (Shard), der einen eigenen In-Memory-Metadaten-Cache sowie ein Write-Ahead-Log und den RAID-6-Speicher verwaltet.(Bild:  NGX Storage)
Knoten-Aufbau im Detail: Jeder physische Server fungiert als Host für einen virtuellen Knoten (Shard), der einen eigenen In-Memory-Metadaten-Cache sowie ein Write-Ahead-Log und den RAID-6-Speicher verwaltet.
(Bild: NGX Storage)

Pradeep Ganesan, Engineering Director bei NGX, erklärte die Mechanik bei der Produktvorstellung: „Da die NVMe-Treiber im User-Space liegen, können wir den Kernel komplett umgehen. Das reduziert die Latenz und den Overhead, der mit dem Kernel einhergeht, enorm.“ Durch die Nutzung von SPDK (Storage Performance Development Kit) kommuniziert die Software direkt mit den PCIe-Lanes der NVMe-SSDs. Für den clusterinternen „East-West-Traffic“ zwischen den Speicherknoten kommt RDMA (Remote Direct Memory Access) zum Einsatz, während Clients wahlweise über NVMe-over-TCP oder ebenfalls über RDMA auf die Volumes zugreifen. Die Architektur ist dabei gezielt auf zwei Extreme getrimmt: massive 128K-Sequential-Throughputs für das KI-Training sowie 4K-Random-I/O-Workloads mit Sub-Millisekunden-Latenz.

Hybrid-Sicherung: SCM-Write-Cache und RAID 6

Sicherungskonzept im Node-Pool: Eingehende Daten werden im schnellen Cache über drei Knoten hinweg repliziert (3-Way-Replication), bevor sie effizient in das per RAID 6 geschützte Kapazitäts-Tier verschoben werden.(Bild:  NGX Storage)
Sicherungskonzept im Node-Pool: Eingehende Daten werden im schnellen Cache über drei Knoten hinweg repliziert (3-Way-Replication), bevor sie effizient in das per RAID 6 geschützte Kapazitäts-Tier verschoben werden.
(Bild: NGX Storage)

Besonderes Augenmerk legten die Entwickler auf den Datenfluss. Um die Performance-Ziele bei extremen IOPS zu garantieren, nutzt ExaScale eine zweistufige Speicherarchitektur, die teure High-End-Speicher mit kosteneffizientem Massenspeicher mischt.

Eingehende Schreibzugriffe landen zunächst in einem designierten Write-Cache. Dieser besteht aus extrem ausdauerndem Storage Class Memory (SCM) und fungiert als sequenzielles Write-Ahead-Log. Hier greift eine 3-Wege-Replikation über die Speicherknoten hinweg, um Datenverlust bei Hardwareausfällen zu verhindern. Erst im Hintergrund wandern die Daten in das eigentliche Kapazitäts-Tier, für das NGX ein kostenoptimiertes QLC-NAND-Tier nutzt. Hier wird aus Effizienzgründen ein anderes Schutzkonzept verwendet. „Im Capacity-Tier verwenden wir stattdessen RAID 6“, so Ganesan. „Es ist ganz auf den Schutz fokussiert und stellt vier Daten-Disks und zwei Paritäts-Disks bereit.“

Dezentrale Metadaten und Virtual Sharding

Eine der größten Herausforderungen massiv skalierender Systeme ist der „Metadata Sprawl“ . Also das Problem, dass zentrale Metadaten-Server bei Exabyte-Dimensionen zum Flaschenhals werden. NGX löst dies durch strikte Dezentralisierung und sogenanntes „Sharding“.

Automatischer Failover: Bei einem Hardware-Ausfall (hier Node 0) wandert der betroffene logische Shard nahtlos auf einen verbleibenden, gesunden Knoten, ohne dass der Datenzugriff für die Clients abbricht.(Bild:  NGX Storage)
Automatischer Failover: Bei einem Hardware-Ausfall (hier Node 0) wandert der betroffene logische Shard nahtlos auf einen verbleibenden, gesunden Knoten, ohne dass der Datenzugriff für die Clients abbricht.
(Bild: NGX Storage)

Das System unterteilt die physischen Speicherknoten logisch in virtuelle Knoten (Shard). Jeder Shard besitzt seinen eigenen In-Memory-Metadaten-Cache, der exklusiv für die Datenbausteine dieses spezifischen Shards zuständig ist. Ein zentraler Metadaten-Controller existiert nicht. Bei Ausfällen wandert ein solcher „Virtual Node“ transparent auf einen gesunden Knoten, ohne dass Clients den Zugriff verlieren.

Das System startet minimal mit drei Knoten (einem Node-Pool). Erweitert ein Unternehmen die Kapazität, muss immer ein vollständiger 3er-Pool hinzugefügt werden. Der Clou: Da Storage, Compute, Netzwerk und Metadaten-Management pro Knoten gekoppelt sind, skaliert die Gesamtleistung des Clusters nach dem automatischen Rebalancing linear mit der hinzugefügten Speicherkapazität. (mc)

(ID:50798027)

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung