KI-Inferenz mittels CPU Warum für autonome KI-Agenten reine GPU-Systeme nicht mehr ausreichen

Von Manuel Christa 2 min Lesedauer

Anbieter zum Thema

KI-Anwendungen arbeiten zunehmend selbstständig. Dafür stoßen reine Grafikprozessoren jedoch an ihre Grenzen. Intel und Sambanova entwickeln nun eine Architektur, die verschiedene Chip-Typen kombiniert.

Infrastruktur für KI-Agenten: Intel und Sambanova teilen Rechenlast auf drei Prozessortypen auf(Bild:  Gemini / KI-generiert)
Infrastruktur für KI-Agenten: Intel und Sambanova teilen Rechenlast auf drei Prozessortypen auf
(Bild: Gemini / KI-generiert)

Wenn KI nicht mehr nur Texte generiert, sondern als Agent selbstständig Code schreibt und Datenbanken abfragt, geraten bisherige Hardware-Strukturen ins Stocken. KI-Systeme auf Basis von Grafikprozessoren (GPUs) arbeiten bei diesen komplexen Aufgaben ineffizient. Um diesen Engpass aufzulösen, haben Intel und Sambanova einen Bauplan für künftige Server-Infrastrukturen vorgestellt. Ab der zweiten Jahreshälfte 2026 wollen sie Rechenzentren und Cloud-Anbietern eine Hardware anbieten, die sich die Rechenarbeit gezielt aufteilt.

Das Konzept setzt auf eine heterogene Architektur. Anstatt einen einzigen Chip-Typ mit allen Phasen der KI-Berechnung zu belasten, weisen die Partner jedem Schritt den passenden Prozessor zu.

Spezielle Chips für jede Rechenphase

Der Entwurf sieht eine exakte Aufgabenteilung vor. GPUs übernehmen den Startschuss: Sie verarbeiten in der Prefill-Phase lange Eingabetexte zu nutzbaren Datensätzen. Danach übernehmen die spezialisierten RDU-Chips von Sambanova. Sie generieren die Antworten der Sprachmodelle und sorgen für einen hohen Datendurchsatz bei der Dekodierung.

Intel steuert die Server-CPU Xeon 6 als Schaltstelle bei. Diese koordiniert die Aufgaben der KI-Agenten und verteilt die Arbeitslast. Gleichzeitig agiert der Intel-Chip als ausführendes Element, das Code kompiliert und überprüft. Rodrigo Liang, Chef von Sambanova, fasst zusammen: „Agenten-KI geht in die Produktion – und das Erfolgsmuster, das wir sehen, sind GPUs, um den Job zu starten, Intel Xeon 6, um ihn auszuführen, und Sambanova RDUs, um ihn schnell zu beenden.“

Software-Kompatibilität als Basis

Ein wesentlicher Vorteil der Architektur ist die Kompatibilität. Da Intel die Host-Prozessoren liefert, können Unternehmen ihre x86-Software-Umgebung ohne Anpassungen weiternutzen. Keine einzelne Chip-Art sei mehr optimal für jede Phase eines Arbeitsablaufs. Der Bauplan von Intel und Sambanova falle auf, weil er hohe Leistung mit weniger Chips und voller Kompatibilität zum bestehenden Software-Ökosystem verbinde.

Systeme im Vergleich: Laut Herstellerangaben benötigt die Architektur von Intel und Sambanova für große KI-Modelle deutlich weniger Chips sowie Strom als Konkurrenzlösungen und lässt sich leichter in bestehende Rechenzentren integrieren.(Bild:  Sambanova)
Systeme im Vergleich: Laut Herstellerangaben benötigt die Architektur von Intel und Sambanova für große KI-Modelle deutlich weniger Chips sowie Strom als Konkurrenzlösungen und lässt sich leichter in bestehende Rechenzentren integrieren.
(Bild: Sambanova)

Eigene Messungen von Sambanova stützen diesen Ansatz. Den Unternehmensdaten zufolge kompiliert der Xeon 6 den Code mehr als 50 Prozent schneller als Server-CPUs auf Basis der Arm-Architektur. Auch bei Vektordatenbanken arbeite der Intel-Chip bis zu 70 Prozent flotter als vergleichbare Konkurrenzprodukte aus dem x86-Lager. Die Kooperation der beiden Unternehmen markiert damit einen deutlichen Schritt von reinen Machbarkeitsstudien hin zum breiten kommerziellen Einsatz von KI-Agenten in Rechenzentren. (mc)

(ID:50810743)

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung