Technische Flüssigkeitskühlung: Ein Leitfaden für den Einsatz von Direct-to-Chip- und Cold-Plate-Systemen in Rechenzentren

Da künstliche Intelligenz (KI) und Hochleistungsrechner (HPC) Antriebsstangen-Dichten über 50 kW, Die herkömmliche Luftkühlung stößt an ihre physikalischen und wirtschaftlichen Grenzen. Flüssigkeitskühlung – insbesondere Direkt auf Chip (D2C) oder Kaltplatte Technologie – hat sich als Standardlösung für die Wärmeabfuhr in modernen Rechenzentren etabliert. Der Wechsel von Luft zu Flüssigkeit bringt jedoch komplexe Herausforderungen in den Bereichen Hydraulik, Wasserchemie und Leckagevermeidung mit sich. Dieser Leitfaden beschreibt die kritischen technischen Parameter, Ausfallmodi und Betriebsstandards, die für die Implementierung eines zuverlässigen Flüssigkeitskühlkreislaufs erforderlich sind.

CDU

Inhaltsübersicht

1. Der Umfang: Definition der modernen Flüssigkeitskühlung

Während Immersionskühlung zunehmend an Bedeutung gewinnt, ist der aktuelle Industriestandard für hochdichtes Silizium (wie z. B. NVIDIA HGX H100/Blackwell) ist Direkt auf Chip (D2C).

In einer D2C-Architektur befindet sich eine Kühlplatte direkt über den wärmeerzeugenden Komponenten (CPUs, GPUs und Speicher mit hoher Bandbreite). Das Kühlmittel fließt durch Mikrokanäle innerhalb der Platte, absorbiert Wärme und transportiert sie zu einem Kühlmittelverteilereinheit (CDU). Die CDU fungiert als kritische Schnittstelle – das “Herzstück” des Systems –, die den Wärmeaustausch zwischen dem geschlossenen Technologiestromkreis (Sekundärkreislauf) und der Wasserversorgung der Anlage (Primärkreislauf) übernimmt.

Der Erfolg bei der D2C-Bereitstellung hängt nicht vom Kauf der besten Kühlplatte ab, sondern davon, dass man die Integration auf Systemebene von Durchfluss-, Druck- und Temperaturregelungen durch globale Gremien wie ASHRAE Technischer Ausschuss 9.9.

2. Die technische "Wahrheitstabelle": Kritische Konstruktionsparameter

Die Flüssigkeitskühlung erfordert eine genaue Abstimmung zwischen der IT-Ausstattung und der Infrastruktur der Einrichtung. Wenn diese Parameter nicht im Service Level Agreement (SLA) oder in den Owner Project Requirements (OPR) festgelegt sind, ist das System zwangsläufig instabil.

Verwenden Sie die folgende Tabelle, um IT-Anbieter, CDU-Hersteller und Anlagenbetreiber aufeinander abzustimmen:

3. Die "drei großen" technischen Herausforderungen bewältigen

Die Implementierung von Flüssigkeitskühlung führt zu Ausfallmodi, die in luftgekühlten Umgebungen nicht auftreten. Hier erfahren Sie, wie Sie diese vermeiden können.

Verteilte CDU-Layout-Einheiten
Verteilte CDU-Layout-Einheiten
Zentrale CDU-Layout-Einheit
Zentrale CDU-Layout-Einheit

3.1 Hydraulik: Lösung des Verteilungsproblems

Eines der häufigsten Probleme bei neuen Bereitstellungen ist Durchflussmangel. In einem Rack mit mehr als 40 parallel geschalteten Kühlplatten folgt die Flüssigkeit naturgemäß dem Weg des geringsten Widerstands. Ohne eine sorgfältige hydraulische Auslegung können die Server, die der CDU am nächsten sind, einen übermäßigen Durchfluss erhalten, während die Server am oberen Ende oder am anderen Ende der Reihe überhitzen.

Die Lösung:

● Druckunabhängige Steuerung: Verwenden Sie Verteiler mit Durchflussausgleichsventilen oder Öffnungen, die unabhängig von der Position der Abzweigungen eine gleichmäßige Verteilung gewährleisten.

● Definieren Sie Δ.P Budget: Die Beschaffung muss ein maximales Druckabfallbudget festlegen. Beispiel: “Der Rechenblade darf bei Nenndurchfluss einen Druckabfall von 100 kPa nicht überschreiten.” Dies zwingt IT-Anbieter dazu, eine effiziente interne Verrohrung zu entwickeln.

● Inbetriebnahme Validierung: Führen Sie während der Standortabnahmeprüfung (SAT) einen “Worst-Case Branch”-Test durch. Instrumentieren Sie den hydraulisch am weitesten entfernten Knotenpunkt und überprüfen Sie, ob er die Mindestdurchflussanforderungen (l/min) erfüllt, wenn das System unter Volllast läuft.

3.2 Wasserchemie: Der stille Killer

Im Gegensatz zu Luft ist Wasser ein chemisch aktives Medium. Eine schlechte Wasserqualität führt zu drei Hauptproblemen: Skalierung (Isolierung der Kühlplatte), Verschmutzung (Verstopfen von Filtern/Lamellen) und Korrosion (Zerstörung der Rohrwände).

Die Lösung:

● Strenge Materialverträglichkeit: Verwenden Sie nach Möglichkeit “monometallische” Materialien (z. B. ausschließlich Kupfer/Messing oder ausschließlich Edelstahl). Wenn die Verwendung verschiedener Metalle unvermeidbar ist, muss ein Korrosionsschutzmittel verwendet werden.

● Filtrationsstrategie: Installieren Sie Nebenstromfilter, um Partikel kontinuierlich zu entfernen. Bei Mikrokanal-Kühlplatten ist häufig eine Filterung bis zu einer Größe von 50 Mikrometern oder weniger erforderlich, um Verstopfungen zu vermeiden.

● Biologische Bekämpfung: Warmes Wasser ist ein Nährboden für Bakterien. Verwenden Sie UV-Behandlung oder automatische Biozid-Dosierung im CDU-Kreislauf, um die Bildung von Biofilmen zu verhindern, die den hydraulischen Widerstand drastisch erhöhen.

3.3 Leckagerisiko: Konstruktion im Hinblick auf Wartungsfreundlichkeit

Die Angst vor Wasserschäden an teuren Elektronikgeräten ist die größte psychologische Barriere für die Einführung. Statistiken zeigen jedoch, dass katastrophale Rohrbrüche selten sind; die meisten Lecks treten auf bei Verbindungsstücke während der Wartung.

Die Lösung:

● Blind-Mate- und tropffreie Steckverbinder: Vorschreiben Sie Schnellkupplungen (QDs), die als “tropffrei” eingestuft sind (Auslaufen < 1 ml pro Trennung). Blindsteckverbinder ermöglichen es, Server in das Rack zu schieben und automatisch an die Wasserversorgung anzuschließen, wodurch das Risiko menschlicher Fehler beim Festziehen von Schläuchen entfällt.

● Isolationsarchitektur: Entwerfen Sie den Verteiler mit Absperrventilen auf Rack- oder Reihenebene. Dadurch können die Facility-Teams ein einzelnes Rack zur Wartung entleeren, ohne den gesamten Pod offline nehmen zu müssen.

● Leckageerkennungszonen: Verlegen Sie Sensorkabel (Seilleckdetektoren) entlang der Unterseite des Gestells und am tiefsten Punkt des Verteilers. Integrieren Sie diese direkt in das Gebäudemanagementsystem (BMS), um ein automatisches Schließen des Absperrventils auszulösen.

4. Temperaturstrategie: Der Wechsel zu warmem Wasser

Ein großer Vorteil der Flüssigkeitskühlung ist die Möglichkeit, bei höheren Temperaturen zu arbeiten. Da Wasser pro Volumen etwa 3.500 Mal effektiver Wärme aufnehmen kann als Luft, benötigen wir kein “kaltes” Wasser, um einen Chip zu kühlen.

Wir kategorisieren die Vorlauftemperaturen häufig anhand von ASHRAE-Kurse zum Thema Flüssigkeitskühlung:

  • W1/W2 (17 °C – 27 °C): Erfordert in den meisten Klimazonen eine mechanische Kühlung. Ähnlich wie bei älteren Systemen.
  • W3 (2 °C – 32 °C): Der “Sweet Spot” für viele moderne Betreiber. Ermöglicht eine erhebliche Anzahl von Freikühlstunden durch den Einsatz von Trockenkühlern oder adiabatischen Türmen.
  • W4 (2 °C – 45 °C): “Warmwasser”-Kühlung. In diesem Bereich können mechanische Kältemaschinen oft vollständig entfallen, selbst in heißen Klimazonen, da ausschließlich die Wärmeabgabe an die Atmosphäre genutzt wird.

Strategische Beratung: Planen Sie für die höchste Temperatur, die Ihre IT-Geräte unterstützen (W3 oder W4). Dadurch werden die Investitionskosten (CAPEX) für Kältemaschinen und die Betriebskosten (OPEX) für Strom drastisch reduziert.

5. Effizienz messen: PUE und darüber hinaus

Um den Return on Investment (ROI) der Flüssigkeitskühlung zu validieren, müssen Sie über Marketing-Schlagworte hinausgehen und Standardkennzahlen verwenden.

Die primäre Branchenkennzahl bleibt unverändert. PUE (Stromverbrauchseffektivität):

pue berechnen

Flüssigkeitskühlung verbessert (senkt) die PUE auf zwei Arten:

1. Reduzierung der Lüfterleistung: Das Entfernen von Hochgeschwindigkeitslüftern aus Servern reduziert die “IT-Last” (obwohl dies technisch gesehen die PUE-Berechnung beeinträchtigt, reduziert es insgesamt Energie).

2. Kühlerentlastung: Höhere Vorlauftemperaturen bedeuten, dass der Kühler seltener läuft.

Ingenieure sollten jedoch auch Folgendes verfolgen TUE (Gesamtnutzungseffizienz). TUE berücksichtigt den Energieverbrauch der Pumpen in den CDUs und den Kühlplatten, der bei einer falschen Kategorisierung durch PUE möglicherweise übersehen wird. Ein gut abgestimmtes Flüssigkeitskühlsystem sollte eine PUE von 1,15 oder weniger, im Vergleich zu 1,3–1,4 bei typischen luftgekühlten Altanlagen.

6. Beschaffung: Die Checkliste "Mindestanforderungen"

Bei der Ausschreibung von flüssigkeitsgekühlten Racks oder CDUs führen vage Anforderungen zu kostspieligen Änderungsaufträgen. Fügen Sie diese spezifischen Positionen hinzu, um Ihr Projekt zu schützen:

Zusammenfassung

Flüssigkeitskühlung ist nicht mehr experimentell, sondern eine Voraussetzung für das KI-Zeitalter. Allerdings verschiebt sie das Risikoprofil von Rechenzentren von Wärmemanagement (Luftbewegung) zu Strömungslehre und Chemie.

Durch die genaue Definition Ihrer “Wahrheitstabelle” mit Parametern, die Auslegung auf hydraulisches Gleichgewicht, die Aufrechterhaltung einer strengen Wasserqualität und die Wahl der richtigen Temperaturklasse (W3/W4) können Sie die Flüssigkeitskühlung von einer beängstigenden Komplexität in eine massive Effizienzsteigerung verwandeln. Die Technologie ist bereit; die Herausforderung liegt in der Disziplin der technischen Integration.

Erhalten Sie eine kostenlose Beratung
mit Ingenieur

Weitere Fragen stellen