Arm stellt neue Prozessor-IP-Blöcke für 5G-Ära vor

Von Richard Oed

Anbieter zum Thema

Neben der Arm Cortex-A78-CPU präsentiert Arm mit der Mali-78-GPU und der Ethos-N78-NPU Weiterentwicklungen bei den IP-Blöcken für Grafikverarbeitung und das Maschinelle Lernen.

ARMs neue Prozessor-Generation: Arm Cortex-A78 CPU, Mali-G78-GPU sowie die neuronale Verarbeitungseinheit Ethos-N78. Sie baut auf den im letzten Jahr vorgestellten IPs für General-Purpose-CPUs, Grafikprozessoren und Prozessoren für das Maschinelle Lernen auf.
ARMs neue Prozessor-Generation: Arm Cortex-A78 CPU, Mali-G78-GPU sowie die neuronale Verarbeitungseinheit Ethos-N78. Sie baut auf den im letzten Jahr vorgestellten IPs für General-Purpose-CPUs, Grafikprozessoren und Prozessoren für das Maschinelle Lernen auf.
(Bild: ARM)
  • Arm bringt seine nächsten Prozessor-Generationen auf den Markt
  • Schwerpunkt sind Mobilgeräte der 5G-Ära mit Fokus auf kleineren Chipflächen, geringerem Stromverbrauch sowie höherer Leistung
  • Die Arm Cortex-A78-CPU für Smartphones bedient die Nachfrage nach mehr Performance bei höherer Effizienz von Leistung und Fläche
  • Mit der Mali-G78-GPU (Graphics Processing Unit) stellt Arm die zweite Generation von Grafikprozessoren auf Basis der Valhall-Architektur vor. Sie eignet sich auch für Anwendungen des Maschinellen Lernens.
  • Um den wachsenden Märkten für das Maschinelle Lernen (ML) gerecht zu werden, fügt Arm seinem Portfolio die neuronale Verarbeitungseinheit Ethos-N78 hinzu.
  • Das Cortex-X Custom Programm ermöglicht Arm-Partnern die Anpassung und Differenzierung über die traditionelle Roadmap der Arm Cortex-Produkte hinaus.

Aufbauend auf den im letzten Jahr vorgestellten IPs für General-Purpose-CPUs, Grafikprozessoren und Prozessoren für das Maschinelle Lernen bringt Arm nunmehr seine nächsten Generationen auf den Markt. Schwerpunkt der Weiterentwicklungen sind Lösungen für Mobilgeräte der 5G-Ära, wobei das Hauptaugenmerk auf kleineren Chipflächen, geringerem Stromverbrauch sowie höherer Leistung, gerade bei Anwendungen der Augmented Reality (AR) und des Maschinenlernens. Zusätzlich präsentierte Arm das Arm Cortex-X Custom Programm. Es ermöglicht Kunden, IP-Blöcke über den von Arm vorgegebenen Rahmen hinaus anzupassen.

Arm Cortex-A78-CPU für rechenintensive Aufgaben

Die Arm Cortex-A78-CPU kommt der Notwendigkeit nach einer Steigerung der Performance bei einer gleichzeitig höheren Effizienz von Leistung und Fläche nach. Sie baut auf die erfolgreichen Cortex-A76 und Cortex-A77 auf, deren Architektur die CPU übernimmt. Außerdem wurden einige mikroarchitektonische Merkmale hinzugefügt, die bei gleicher Prozessorleistung zu einem verringerten Platzbedarf und einer geringeren Stromaufnahme führen. So wurde beispielsweise die Branch-Prediction verändert, um eine größere Bandbreite und Genauigkeit zu erreichen, und zusätzliche Möglichkeiten zur Fusion von Befehlen geschaffen. Diese Verbesserungen der Mikroarchitektur ermöglichen beim Cortex-A78 eine 7%ige Steigerung der Single-Thread-Leistung gegenüber dem Cortex-A77.

Außerdem wurde die Effizienz verbessert, indem Strukturen mit geringer Performance und Fläche verkleinert wurden, wie bei den L1-Instruktions- und Daten-Caches. Ebenfalls energieoptimiert wurden andere bestehende Strukturen, beispielsweise diejenigen zur Branch-Prediction. Allein damit wurde im Vergleich zum Cortex-A77 eine um 4% geringere Leistung bei der Performance pro mW und 5% weniger Fläche bei der Leistung pro mm2 erreicht.

Insgesamt bietet die Arm Cortex-A78-CPU innerhalb eines 1-Watt-Energiebudgets eine um 20% höhere Dauerleistung gegenüber der Arm Cortex-A77-CPU, beziehungsweise bei gleicher Performance eine Energieersparnis von 50%. Zielapplikationen der Cortex-A78-CPU sind rechenintensive Aufgaben und Maschinelles Lernen auf Mobilgeräten, einschließlich der neuesten Generationen mit mehreren, größeren oder faltbaren Bildschirmen.

Das Arm Cortex-X Custom Programm ermöglicht kundenspezifische Anpassungen

Das Cortex-X Custom Programm ermöglicht Partnern von Arm eine Anpassung und Differenzierung über die traditionelle Roadmap der Arm Cortex-Produkte hinaus. Die Partner definieren dabei die für ihre Anwendung wichtigen Eckpunkte in Bezug auf Leistung, Energieverbrauch und Chipfläche. Die sich daraus ergebende kundenspezifische CPU wird dann von Arm entwickelt und gefertigt und unter der Marke Cortex-X ausgeliefert.

Die erste CPU des Programms ist die Arm Cortex-X1-CPU, die laut Herstelleraussage die bisher leistungsstärkste Cortex-CPU ist. Mit einer 30%igen Steigerung der Spitzenleistung und einer Verdopplung der Performance beim Maschinellen Lernen gegenüber dem Cortex-A77 bietet die CPU eine wettbewerbsfähige Lösung für High-End-Smartphones und Geräten mit großem Bildschirm.

Im Vergleich zum Cortex-A78 besitzt die Cortex-X1-CPU eine um 22% höhere Leistung bei single-thread Integer-Operationen. Zusätzlich wurden im Verhältnis zur Cortex-A78-CPU die Caches der Level 1 bis 3 vergrößert und die Anzahl der NEON-Engines von zwei auf vier verdoppelt.

Arm Mali-G78-GPU für schnellere Bildverarbeitung

Mit der Mali-G78-GPU (Graphics Processing Unit) stellt Arm die zweite Generation von Grafikprozessoren auf Basis der Valhall-Architektur vor. Gegenüber der auf der gleichen Architektur aufbauenden und im letzten Jahr vorgestellten Mali-G77-GPU bietet die Mali-G78-GPU eine um 25% höhere Grafikleistung. Die neue GPU kann bis zu 24 Kerne unterstützen und besitzt einen asynchronen Top-Level, einer Technik, die nach Ansicht von Arm eine disruptive Technologie hinsichtlich der Leistungsfähigkeit darstellt. Dabei kann bei gleichbleibender Bildfrequenz die Taktrate verringert werden, was Energie einspart. Zusätzliche Verbesserungen betreffen die Verarbeitung von Kacheln und die Verfolgung von Fragmentabhängigkeiten. Beide Elemente beeinflussen Spiele auf Mobilgeräten, die komplexe Spielszenen mit Rauch, Bäumen oder Gras beinhalten. Abhängig vom Einzelbild gibt Arm eine Steigerung der Performance um bis zu 17% gegenüber der Mali-G77-GPU an.

Obwohl der Prozessor in erster Linie für die Grafikverarbeitung gedacht ist, ermöglicht die parallele Datenverarbeitung der Mali-G78-GPU auch Anwendungen des Maschinellen Lernens. Damit ist sie auch für Applikationen wie Gerätesicherheit, spezielle Video-Modes und Anwendungen mit Augmented Reality geeignet. Um Programme schnell für Mali-GPUs zu optimieren, bietet Arm für Entwickler zusätzliche Tools wie den Performance Advisor an, der es ermöglicht, Engpässe rasch zu erkennen und zu beheben.

Jetzt Newsletter abonnieren

Verpassen Sie nicht unsere besten Inhalte

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Aufgrund von Kundenanfragen führt Arm neben der Mali-G78-GPU auch eine neue Sub-Premium-Klasse von GPUs ein. Der erste Grafikprozessor in dieser Reihe ist die Arm Mali-G68-GPU, die bis zu 6 Kerne unterstützt und alle neuen Funktionen der Mali-G78-GPU übernimmt.

Arm Ethos-N78-NPU: Unterstützung für Neurale Netzwerke und Maschinelles Lernen

Um den wachsenden Märkten für das Maschinelle Lernen (ML) gerecht zu werden, die von aktuellen AR-basierten Smartphone-Anwendungen bis hin zu Smart-Home-Hubs reichen, ergänzt Arm sein Portfolio um die die neuronale Verarbeitungseinheit (NPU / Neural Processing Unit) Ethos-N78. Diese neue hochskalierbare und energieeffiziente NPU der zweiten Generation baut auf der Ethos-N77-NPU auf und bietet verbesserte ML-Fähigkeiten und eine bis zu 25% höhere Leistungseffizienz. Die NPU ist in einem Bereich von 1 TOPS bis 10 TOPS erhältlich und unterstützt sowohl vorkonfigurierte als auch kundenspezifische Versionen. Die Ethos-N78-NPU ist bis zu 30% kleiner und verbraucht pro Inferenz bis zu 40% weniger DRAM-Daten als die Vorgängergeneration, was zu einer geringeren Stromaufnahme führt.

Softwareseitig bietet der Ethos-N78-Software-Stack die Wahl zwischen zwei Arbeitsabläufen: einmal die Offline-Compilierung auf der Basis des TVM-Compilers, sowie einen Interpreter basierten Ablauf unter Verwendung des Android Neural Networks API’s auf der Basis von Arm NN. Beide Abläufe funktionieren einheitlich über alle Ziel-Hardware-IPs von Arm hinweg (CPU, GPU, NPU). Unterstützt werden alle gängigen Frameworks, einschließlich TensorFlow, TensorFlow Lite, PyTorch und ONNX, womit Entwickler mit ihrem bevorzugten Framework weiterarbeiten können.

Ingenieure können zur Verkürzung der Markteinführungszeit das Ethos-N Static Performance Analyzer Tool verwenden, das ihnen ermöglicht, ihre Netzwerke bereits vor der Verfügbarkeit von Silizium zu profilieren und abzustimmen.

//

(ID:46637806)