Die dritte Spezifikation des Compute Express Link CXL 3.0 verändert die Bauart von Computern, Clustern und von Rechenzentren

Von Ulrike Ostler

Anbieter zum Thema

Der „Compute Express Link“, abgekürzt CXL, bekommt mit 3.0 eine neues Version. Nach Ansicht des zuständigen Standardisierungsgremiums könnten sich damit Engpässe beseitigen lassen werden, die bisher die Rechenleistung in Datacenter bremsen und zugleich die Art und Weise verändern, wie diese für Supercomputer bis Unternehmensrechenzentren gebaut werden.

CXL 3.0 erlaubt das Zusammenfügen von Speichern, RAM und Compute über Decives und Rechenzentren hinweg, kann die Ressourcen aber auch auseinander dividieren.
CXL 3.0 erlaubt das Zusammenfügen von Speichern, RAM und Compute über Decives und Rechenzentren hinweg, kann die Ressourcen aber auch auseinander dividieren.
(Bild: CXL/gemeinfrei)

Das CXL-Konsortium hat die 3.0-Version in der vergangenen Woche angekündigt. Cloud-Anbieter und Chip-Hersteller haben ihre Unterstützung signalisiert. So geht nun „OpenCAPI“, ein von IBM unterstützter Interconnect-Standard, in dem CXL-Konsortium auf, wie ebenfalls in der vergangenen Woche bekannt wurde. „Gen-Z“ war dieses Schicksal schon 2020 beschieden.

Die Version 1.0 der CXL-Spezifikation wurde im Jahr 2019 veröffentlicht. Die Version 2.0 unterstützte dann alsbald PCIe 5.0, das etwa in „Intel Sapphire Rapids“ und „Nvidia Hopper“ sowie „AMD Genoa“ zu finden ist. CXL 3.0- basiert mit seinen bis zu 64 Gigatransfers pro Sekunde auf PCIe 6.0, das im Januar dieses Jahres fertiggestellt wurde.

Wie die Vorgängerversion CXL 2.0 spezifiziert die jüngste Variante die Kommunikationsverbindung - Bandbreite und Kapazität - zwischen Chips, Arbeitsspeichern und Storage-Systemen, ist aber doppelt so schnell. Zudem bietet CXL 3.0 auch Verbesserungen für eine gemeinsame Nutzung von Rechenressourcen, etwa für Anwendungen der Künstlichen Intelligenz.

Als Highlights zählt das CXL-Konsortium Folgendes auf:

  • Fabric-Fähigkeiten
    - Unterstützung für Multi-headed und Fabric Attached Devices
    - verbessertes Fabric-Management
    - zusammensetzbare, disaggregierte Infrastruktur
  • Skalierbarkeit und besserte Ressourcennutzung
    - verbessertes Speicher-Pooling
    - mehrstufiges Switching
    - verbesserte Kohärenzfunktionen
    - erweiterte Softwarefunktionen
  • Verdoppelung der Bandbreite auf 64GTs
  • keine zusätzliche Latenzzeit gegenüber CXL 2.0
  • vollständige Abwärtskompatibilität mit CXL 2.0, CXL 1.1 und CXL 1.0

Generell könnten also Rechen-, Speicher- und Storage-Ressourcen besser, will heißen granularer, verwaltet werden, so die Protagonisten. Außerdem lassen sich auch Chips, Speicher und Arbeitsspeicher miteinander verbinden, die sich an entfernt an anderen Orten befinden. Das erlaubt diverse Rechenzentren zu einem einziges riesigen System zu verbinden.

Siamak Tavallaei, Präsident des CXL-Konsortiums, erläutert: „Moderne Rechenzentren benötigen heterogene und zusammensetzbare Architekturen, um rechenintensive Arbeitslasten für Anwendungen wie künstliche Intelligenz und maschinelles Lernen zu unterstützen - und wir entwickeln die CXL-Technologie weiter, um die Anforderungen der Branche zu erfüllen. Die von unseren engagierten technischen Arbeitsgruppenmitgliedern entwickelte CXL 3.0-Spezifikation wird neue Nutzungsmodelle in einer zusammensetzbaren disaggregierten Infrastruktur ermöglichen.“

Das CXL-Logo
Das CXL-Logo
(Bild: CXL Consortium)

Die Zusammenlegung und Zuweisung von Speicherressourcen wird von einer Software mit der Bezeichnung „Fabric Manager“ verwaltet. Die Software ist überall im System oder auf den Hosts eingesetzbar, um den Speicher zu kontrollieren und zuzuweisen. Kurt Lender, Mitglied im CXL-Konsortium-Vorstand und Senior Ecosystem Enabling Manager der Data Center Group bei Intel, fügt hinzu: „Und jetzt kann man mit der ... Fabric-Technologie, die wir mit CXL 3.0 eingeführt haben, tatsächlich über Racks hinweg gehen, System zusammensetzen oder auseinander dividieren.“

Die Verbesserungen in CXL 3.0 bieten also im Vergleich zu früheren Spezifikationen mehr Flexibilität und Optionen beim Umschalten von Ressourcen. Normalerweise verfügen Server über eine CPU, einen Speicher. Zudem können Eingabe und Ausgabe-Mechanismus begrenzt sein. In einer disaggregierten Infrastruktur lässt sich über ein CXL-Protokoll ein Kabel zu einem separaten Speicherfach führen, ohne sich auf den DDR-Bus zu verlassen. So lassen sich auf der Rack-Ebene CPU- oder Speicherfächer als separate Systeme einrichten.

Mit CXL 3.0 bekommen Kunden unter Umständen auch das Problem der Überprovisionierung vor allem beim Storage in den Griff; denn sie haben die Möglichkeit, Ressourcen von einem Knoten zu einem anderen zu verschieben. Sie können besser denn je ihre Systeme wachsen lassen und sie über eine Fabric und CXL miteinander verbinden. Dabei bieten das 3.0er Protokoll mehr Kanäle und Ressourcen für neue Arten von Datacenter-Chips wie SmartNICs, FPGAs und IPUs. Es kann bis zu 4.096 Knoten unterstützen.

Die Beschleunigung

CXL 3.0 ermöglicht Peer-to-Peer-Verbindungen zwischen Knoten und Endpunkten in einer einzigen Domäne. Dadurch wird quasi eine Mauer errichtet, in der sich der Datenverkehr isolieren lässt, so dass er nur zwischen miteinander verbundenen Knoten fließt. Dies ermöglicht zugleich eine schnellere Datenübertragung von Beschleuniger zu Beschleuniger oder von Gerät zu Gerät., denn die Informationen müssen nicht mehr über eine CPU laufen, können stattdessen direkt von Akzelerator zu Akzelerator laufen. Trotzdem ‚wisse‘ der Hauptprozessor, was vor sich gehe und sei kohärent, erläutert Lender.

Jetzt Newsletter abonnieren

Täglich die wichtigsten Infos zu RZ- und Server-Technik

Mit Klick auf „Newsletter abonnieren“ erkläre ich mich mit der Verarbeitung und Nutzung meiner Daten gemäß Einwilligungserklärung (bitte aufklappen für Details) einverstanden und akzeptiere die Nutzungsbedingungen. Weitere Informationen finde ich in unserer Datenschutzerklärung.

Aufklappen für Details zu Ihrer Einwilligung

Trotz des riesigen Fortschritts, den die CLCL-Version 3.0 bedeutet, könnte es noch zwei bis vier Jahre dauern, bis Anbieter CXL 3.0-Produkte auf den Markt bringen; denn die CPUs müssen CXL 3.0 erst einmal beherrschen. Intel hat gerade einmal die Unterstützung für CXL 1.1 in seine Sapphire Rapids-Chip integriert. Und die werden voraussichtlich erst in diesem Jahr in großen Stückzahlen ausgeliefert.

Artikelfiles und Artikellinks

(ID:48527705)