Künstliche Intelligenz und Datenzentren Der Preis für einen KI-Chip – hätten Sie’s gewusst?

Von Susanne Braun 4 min Lesedauer

Anbieter zum Thema

Im Rahmen der Computex startet Intel einen Angriff auf den führenden KI-Chip-Anbieter Nvidia und versucht bei der Kundschaft mit Transparenz zu punkten. Diese Transparenz enthüllt, wie teuer KI-Beschleuniger, die in rauen Mengen in KI-Datenzentren verbaut werden, eigentlich sind.

Intel zeigt sich bei den Kosten für die Gaudi-Beschleuniger-Racks transparent.(Bild:  Intel Corp.)
Intel zeigt sich bei den Kosten für die Gaudi-Beschleuniger-Racks transparent.
(Bild: Intel Corp.)

Künstliche Intelligenz ist in aller Munde, in der breiten Bevölkerung wie in der Industrie und den meisten ist bislang nicht einmal bewusst, dass sie KI bei ihren alltäglichen Handlungen nutzen. Das KI-Erwachen soll in allen Lebenslagen für Komfort und Effizienz sorgen und die vierte industrielle Revolution darstellen. Vielerorts wird aber auch mit dem Thema gehadert. Wie lassen sich künstliche Intelligenz und maschinelles Lernen sinnvoll einsetzen – und wie teuer kommt uns das tatsächlich zu stehen?

Denn die Datenzentren, in denen große Sprachmodelle trainiert und zur Nutzung zur Verfügung gestellt werden, etwa ChatGPT von OpenAI, müssen nicht nur mit der entsprechenden Technik versorgt werden, sondern auch mit Energie für den Betrieb und Wasser für die Kühlung. Aktuellen Schätzungen zufolge verbrauchen KI-Datenzentren rund zwei Prozent des jährlichen weltweiten Strombedarfs; in wenigen Jahren könnte dieser Prozentsatz auf sieben bis zehn Prozent anwachsen. Für die Kühlung der verbauten Technologie werden bei großen Datenzentren zudem Hunderttausende Liter Wasser am Tag benötigt (via NPR). Stellt sich angesichts dieser Herausforderungen, die jetzt und in Zukunft im Blick behalten werden müssen, noch überhaupt die Frage, wie teuer so ein Rack mit KI-Beschleunigern eigentlich ist? Vielleicht nicht, aber interessant sind diese Preise doch allemal, nicht wahr?

Intel zieht den Vorhang zurück

Im Rahmen der Computex 2024 haben die führenden Unternehmen in der Herstellung von KI-Chips, Nvidia und AMD, versucht, einander mit ihren mittelfristigen Produktplänen zu überbieten. Ein weiterer Anbieter im Bunde, der von der großen KI-Schnitte auch gerne ein Stück ab hätte, hat versucht, die potenzielle Kundschaft auf anderem Wege zu überzeugen. Pat Gelsinger, CEO von Intel, hat während seiner Computex-Keynote hervorgehoben, dass die KI-Beschleuniger-Kits Gaudi primär beim Thema Preis punkten.

„Als einzige MLPerf-Benchmark-Alternative zu Nvidia H100 für das Training und die Inferenz von großen Sprachmodellen (LLM) bietet die Gaudi-Architektur den Kunden die gewünschte GenAI-Leistung mit einem Preis-Leistungs-Vorteil, der eine große Auswahl und schnelle Einsatzzeiten bei geringeren Gesamtbetriebskosten ermöglicht“, verspricht Intel. Und was heißt das in Zahlen?

Für ein Standard-Kit mit acht Gaudi-2-Beschleunigern auf einem Universal Baseboard (UBB) werden 65.000 US-Dollar abgerufen – was laut Intels Angaben nur ein Drittel der Kosten sein soll, die Wettbewerber für gleichartige Plattformen abrufen. Ein Standard-Kit mit acht Gaudi-3-Beschleunigern auf einem UBB hingegen kostet 125.000 US-Dollar – etwa zwei Drittel des Preises, den der Wettbewerb für gleichwertige Technologie verlangt.

„Intel Gaudi 3 in einem Cluster mit 8.192 Beschleunigern soll eine bis zu 40 % schnellere Zeit bis zum Training im Vergleich zu einem Nvidia H100 GPU-Cluster gleicher Größe und einen bis zu 15 % schnelleren Trainingsdurchsatz für einen Cluster mit 64 Beschleunigern im Vergleich zu Nvidia H100 auf dem Llama2-70B-Modell bieten“, so Intel. „Darüber hinaus wird prognostiziert, dass Intel Gaudi 3 im Vergleich zu Nvidia H100 durchschnittlich bis zu zweimal schnelleres Inferencing bietet, wobei beliebte LLMs wie Llama-70B und Mistral-7B ausgeführt werden.“

Was kostet schon die KI-Welt?

Es ist wenig verwunderlich, dass Nvidia im Q1 des Fiskaljahres 2025 ein großes Wachstum im Datacenter-Geschäft zu verzeichnen hatte, denn das Unternehmen verdient mit dem Verkauf der Superchips (in dem Fall die Kombination aus einer Grace-CPU und zwei Blackwell-GPU) viel. Im Mai 2024 wurde von Brancheninsidern geschätzt, dass der GB200-Superchip mit bis zu 60.000 bis 70.000 US-Dollar bepreist werden könnte, während Nvidias H100 etwa 30.000 bis 35.000 US-Dollar kostet – das Blackwell-Einstiegsmodell B100 wird ähnlich geschätzt.

„Nvidia könnte eher geneigt sein, Server zu verkaufen, die auf den Blackwell-GPUs basieren, als die Chips separat zu verkaufen, hauptsächlich angesichts der Tatsache, dass die B200-NVL72-Server voraussichtlich bis zu 3 Millionen US-Dollar pro Stück kosten werden“, schrieb im Mai Anton Shilov von Tom's Hardware. Ein solcher Server enthält 72 Superchips, also de facto 36 CPUs und 72 GPUs. Freilich muss man bei diesen Preisen berücksichtigen, dass Verträge meist individuell ausgehandelt werden und entsprechend variieren können. Großabnehmer wie Google und Amazon werden hinsichtlich der georderten Mengen sehr wahrscheinlich einen Rabatt erhalten.

Der Preis für die Beschleuniger der Instinct-Serie von AMD, MI300X und MI325X, soll unbestätigten Gerüchten zufolge zwischen 50.000 und 60.000 US-Dollar liegen; Techpowerup hat Anfang des Jahres gemutmaßt, dass etwa 10.000 bis 15.000 US-Dollar für eine einzelne MI300X-Einheit veranschlagt werden. Von den Preisen für die Chips abgesehen, fallen bei der Einrichtung eines Datacenters freilich noch weitere Kosten an, für die Stromversorgung, Wandler und Motherboards etwa – die sind allerdings im Vergleich zu den CPUs und GPUs längst nicht so hoch. (sb)

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung. Die Einwilligungserklärung bezieht sich u. a. auf die Zusendung von redaktionellen Newslettern per E-Mail und auf den Datenabgleich zu Marketingzwecken mit ausgewählten Werbepartnern (z. B. LinkedIn, Google, Meta).

Aufklappen für Details zu Ihrer Einwilligung

(ID:50054194)