La revolución de la refrigeración líquida: Guía del lector sobre soluciones de refrigeración de CPU y GPU a gran escala

A medida que la IA y la computación de alta potencia empujan las cargas de los bastidores a 30 kW o incluso 100 kW en clústeres avanzados, la refrigeración por aire a la antigua usanza toca techo a unos 20 kW. Las temperaturas descontroladas no sólo derrochan energía y aumentan el PUE, sino que también acortan la vida útil de los chips, provocan ralentizaciones y merman el rendimiento y el presupuesto. Al utilizar fluidos con una absorción y transferencia de calor superiores, la refrigeración líquida reduce el PUE a 1,1-1,2, disminuye el consumo de energía en 20-30% y se está convirtiendo rápidamente en un elemento imprescindible para los centros de datos modernos.

Los centros de datos actuales mantienen frías las CPU y GPU, sin necesidad de grandes reformas, combinando la refrigeración líquida de placa fría con opciones como intercambiadores directos al chip, de inmersión y de puerta trasera. Resultado: Las CPU y GPU se mantienen a menos de 65 °C, el PUE desciende hasta 1,1 y el coste de la actualización se amortiza en sólo tres años. Este es el nuevo estándar.

Pero, ¿qué tipos de refrigeración líquida existen? ¿Y por qué superan a las soluciones de aire en potencia, coste y fiabilidad? Vamos a responder a todo esto -además de consejos prácticos de implantación y perspectivas de mercado- en las seis secciones siguientes, que constituyen una guía completa de la era de la refrigeración líquida.

Índice

Refrigeración líquida: ¿Qué tipo se adapta a su centro de datos?

La "refrigeración líquida" no es una sola cosa: es un espectro que va desde las puertas de agua caliente hasta las máquinas de "baño" totalmente sumergidas.

Existen cuatro tipos principales: placa fría, inmersión monofásica, inmersión bifásica y refrigeración directa del chip. Las placas frías están a la cabeza gracias a su eficacia probada: se utilizan en 90% de los proyectos.

Tecnología

Transferencia de calor
(W/cm²-K)

Tamaño de la infraestructura

TDP típico
(W)

Notas

Refrigeración líquida por placa fría
≈25
Estándar
350-700
El más maduro, elegido por 90% de los centros de datos
Inmersión monofásica
10-15
1/3 más pequeño
500-1000
Mayor dificultad para controlar el flujo de fluidos
Inmersión bifásica
≥ 30
1/3 más pequeño
> 1000
Disputas sobre el PCA y la fiabilidad
Refrigeración directa al chip
≈ 25
1/3 más pequeño
350-700
Utiliza microcanales o microchorros

Las placas frías son el pilar, pero la refrigeración por inmersión y por chorro son fundamentales para escenarios extremos de alta potencia.

Por qué mandan las placas frías?

La refrigeración por placa fría se ha convertido en la opción preferida de los centros de datos por su estabilidad a prueba de crisis, su precio asequible y su fácil adaptación.

Para un rack de 30 kW, el coste de la placa fría es de unos 21.000 RMB/IT kW y el gasto operativo mensual es de sólo 685 RMB/IT kW, menos que la refrigeración por aire o la inmersión.

Las placas frías de cobre o aluminio, formadas con ranuras o microcanales, proporcionan unos 25 W/cm²-K. Como el refrigerante nunca entra en contacto con los componentes electrónicos, la adaptación es sencilla: basta con añadir una CDU y algunas tuberías. La serie Datacom de ASHRAE, el Código de Conducta de la UE y el DOE de EE.UU. especifican la pureza del agua y la temperatura de las placas frías. ¿Y en el mundo real? Cuando Equinix cambió sus GPU A100 de refrigeración por aire a refrigeración por placas frías, el PUE cayó de 1,6 a 1,15, ahorrando 30% en energía, y duplicó la densidad por rack a 30 kW.

Refrigeración por inmersión y por chorro: Para los chips más calientes

Cuando las GPU empiezan a bombear 800 W o incluso 1 kW cada una, hasta las placas frías empiezan a sudar.

La inmersión monofásica enfría fácilmente GPU de 1 kW. La inmersión bifásica y la refrigeración por chorro aumentan aún más los límites de gestión del calor (más de 300 W/cm²-K).

La refrigeración por inmersión sumerge completamente los servidores en fluido dieléctrico, eliminando el "espacio de aire" de los diseños tradicionales. Los bastidores de flujo inferior para GPU de Hypertec, combinados con radiadores personalizados, refrigeran eficazmente GPU de 1.000 W sin interrupción. La inmersión bifásica aprovecha el cambio de fase para obtener grandes ganancias, pero se enfrenta a obstáculos relacionados con los costes del refrigerante y la seguridad. La refrigeración por chorro, que consiste en rociar los chips con una niebla de refrigerante, ofrece la mayor eliminación de calor teórica posible, pero sólo se utiliza en investigación debido a su complejidad. En la actualidad, estas tecnologías tienen un uso limitado en I+D de IA y defensa, pero su precio y la falta de estándares maduros impiden su adopción generalizada.

Coste, eficiencia, retorno de la inversión: Las matemáticas del mundo real

Todo proyecto vive y muere en función de tres preguntas: ¿Cuánto va a costar? ¿En cuánto tiempo se amortiza? ¿Ahorrará realmente?

Para un rack típico de 30 kW, el coste total de propiedad de la placa fría es de sólo 1.057 RMB/IT kW-mes, superando a la refrigeración por aire en 14%. La inmersión monofásica, con un coste inicial más elevado, está casi a la par con el aire en coste total.

Comparación de rendimiento y coste (para un bastidor de 30 kW)

Solución

CAPEX
(10.000 yenes/IT kW)

OPEX
(RMB/IT kW-mes)

TCO
(RMB/IT kW-mes)

PUE

Energía ahorrada

Refrigeración por placas frías
2.1
685
1057
<1.2
20-30%
Refrigeración por aire
2.6
795
1229
~1.6
-
Inmersión monofásica
3.1
665
1204
<1.2
20-30%

Los costes de la chapa fría se reducen sobre todo a la chapa, las tuberías y la CDU, unas 60% del total. Los costes corrientes se deben a las bombas y el tratamiento del agua. La inmersión monofásica es cara (31.000 RMB/IT kW) por sus fluidos y depósitos especiales. El aire parece barato, pero si se utiliza con todo el CA adicional, la refrigeración líquida se amortiza en dos años. Según NVIDIA, cambiar todos los servidores CPU del planeta a GPU y refrigeración líquida podría ahorrar más de un billón de kWh al año, lo que equivale a $100.000 millones.

Seguridad y buenas prácticas: Siete reglas de oro para la refrigeración líquida

La refrigeración líquida ahorra energía, pero una sola fuga puede deshacerlo todo.

Siga estas siete reglas de hierro -calidad del aguaASHRAE, redundancia CDN de doble bucle, comprobaciones trimestrales de presión, refrigerantes estables, bastidores estándar, plan de crecimiento de 30-100 kW y control térmico AI- para conseguir un sistema sin riesgos.

ASHRAE aconseja circuitos de agua por debajo de 100 µS/cm; Europa exige refrigerante a 20-45°C. Utilice juntas EPDM/FKM para las placas frías y realice pruebas de aire estacionales (1 bar); vigile los niveles de fluido y la estabilidad química en los sistemas de inmersión. El DOE de EE.UU. recomienda el intercambio de calor entre la instalación y los circuitos de refrigeración técnicos. La fontanería inteligente de Hypertec redujo las revisiones necesarias de mensuales a trimestrales. El mejor caso: enlazar con una plataforma DCIM y dejar que el aprendizaje automático ajuste las velocidades de las bombas y las válvulas, reduciendo aún más el PUE.

Mercado y futuro: La carrera de la refrigeración líquida hasta 2028

A veces, los mercados hablan más alto que las especificaciones.

Para 2028, las proyecciones prevén la refrigeración por placa fría en 25% de servidores CPU (135.000 millones de RMB) y 55% de servidores GPU (>500.000 millones de RMB).

Se esperan más de 36 millones de servidores CPU (290 W de media) y 15 millones de servidores GPU (1800 W de media) distribuidos por todo el mundo. La refrigeración líquida por placa fría cuesta sólo 3.400 RMB/kW, frente a los 9.600 RMB de la inmersión. En China, grandes empresas como Yingwei Tech e Inspur cubren toda la cadena de valor; en el extranjero, CoolIT y Asetek dominan las implantaciones de gama alta. De cara al futuro: las placas frías de aluminio y los tubos de plástico reducen los costes 15%; los nanofluidos podrían aumentar la transferencia de calor, pero aún hay que demostrar su estabilidad y coste. La refrigeración por microcanales para chips podría superar los 300 W/cm², pero aún no está en el mercado. Los controles basados en IA y los centros de vanguardia suponen un crecimiento aún mayor.

Refrigeración líquida en el mundo real: Las GPU de NVIDIA en acción

Si un técnico no puede trabajar en directo, no es más que una presentación de diapositivas.

Las GPU A100 y H100 de refrigeración líquida de NVIDIA han reducido el PUE de 1,6 a 1,15, han duplicado la densidad de cálculo y se están instalando masivamente en los centros de datos de Equinix.

La A100 utiliza placas frías de cobre con microcanales para refrigerar 70% de puntos calientes; la H100 aporta refrigeración directa de circuito cerrado para rellenar menos agua. Son compatibles con PCIe, SXM y OAM, y funcionan en bastidores ASUS y Foxconn, sin necesidad de armarios especiales. Con un ahorro energético de 30%, NVIDIA afirma que un cambio global a las GPU con refrigeración líquida podría ahorrar más de un billón de kWh al año: tanto como lo que consume Francia en un año. Los proyectos piloto de Equinix demuestran que la densidad de rack puede pasar de 15 kW a 30 kW, con margen de refrigeración suficiente para configuraciones de IA de 100 kW/rack.

En el mundo ultradenso y de bajo PUE de hoy en día, la refrigeración líquida no es un lujo, sino una necesidad. Las placas frías están en 90% de los bastidores por una buena razón; la refrigeración por inmersión y por chorro se están abriendo paso ahora para las aplicaciones más ávidas de energía. Con controles sólidos de seguridad, mantenimiento e impulsados por IA, sus instalaciones estarán preparadas para el próximo salto. En 2028, el mercado de la refrigeración líquida superará los 600.000 millones de RMB, y los microcanales y nanofluidos se perfilan como las próximas grandes novedades. Conozca las siete reglas de implementación, los cuatro estándares globales y los actores del sector, y liderará la carrera por la informática más fría (¡y más caliente!).

Apéndice: Glosario de términos clave (A-Z)

He aquí algunos términos esenciales de la refrigeración líquida que le ayudarán a comprender mejor esta tecnología:

Obtenga una consulta gratuita
con Ingeniero

Más preguntas