Mundo: Superclusters de refrigeración líquida de Supermicro para centros de datos de inteligencia artificial (1)

(Información remitida por la empresa firmante)

— Los superclusters de refrigeración líquida de Supermicro para centros de datos de inteligencia artificial, con los sistemas NVIDIA GB200 NVL72 y NVIDIA HGX B200, ofrecen un nuevo paradigma de cálculo a exaescala energéticamente eficiente

— Las soluciones integrales de refrigeración líquida de Supermicro impulsan la transición de la industria hacia centros de datos de IA sostenibles con la plataforma NVIDIA Blackwell

SAN JOSÉ, California, 16 de octubre de 2024 /PRNewswire/ — Supermicro, Inc. (NASDAQ: SMCI), proveedor total de soluciones de TI para IA, nube, almacenamiento y 5G/Edge, está acelerando la transición de la industria a los centros de datos refrigerados por líquido con la plataforma NVIDIA Blackwell para ofrecer un nuevo paradigma de eficiencia energética para el rápido aumento de la demanda de energía de las nuevas infraestructuras de IA. Las soluciones integrales de refrigeración líquida de Supermicro, líderes en el sector, están impulsadas por la plataforma NVIDIA GB200 NVL72 para computación a exaescala en un único bastidor y han comenzado el muestreo a clientes seleccionados para la producción a gran escala a finales del cuarto trimestre. Además, los sistemas de refrigeración líquida Supermicro X14 y H14 4U y los sistemas de refrigeración por aire 10U recientemente anunciados están listos para la producción del sistema NVIDIA HGX B200 de 8 GPU.

«Estamos impulsando el futuro de la computación de IA sostenible, y nuestras soluciones de IA con refrigeración líquida están siendo adoptadas rápidamente por algunos de los proyectos de infraestructura de IA más ambiciosos del mundo, con más de 2000 bastidores con refrigeración líquida enviados desde junio de 2024», destacó Charles Liang, presidente y consejero delegado de Supermicro. «La solución integral de refrigeración líquida de Supermicro, con la plataforma NVIDIA Blackwell, libera la potencia computacional, la rentabilidad y la eficiencia energética de la próxima generación de GPU, como las que forman parte del NVIDIA GB200 NVL72, un ordenador a exaescala contenido en un único rack. La amplia experiencia de Supermicro en el despliegue de infraestructura de IA refrigerada por líquido, junto con los servicios integrales in situ, el software de gestión y la capacidad de fabricación global, proporciona a los clientes una ventaja distintiva en la transformación de los centros de datos con las soluciones de IA más potentes y sostenibles».

https://www.supermicro.com/en/solutions/ai-supercluster

Los SuperClusters de refrigeración líquida de Supermicro para los sistemas basados en la plataforma NVIDIA GB200 NVL72 incorporan las nuevas unidades avanzadas de distribución de refrigerante (CDU) en rack o en fila, y placas frías personalizadas diseñadas para la bandeja de computación que aloja dos NVIDIA GB200 Grace Blackwell Superchips en un factor de forma 1U. NVIDIA GB200 NVL72 de Supermicro ofrece capacidades de computación de IA a exaescala en un único rack con la solución de refrigeración líquida integral de Supermicro. La solución de rack incorpora 72 GPU NVIDIA Blackwell y 32 CPU NVIDIA Grace, interconectadas por la red NVLink de quinta generación de NVIDIA. El sistema NVIDIA NVLink Switch facilita 130 terabytes por segundo (TB/s) de comunicación total de la GPU con una latencia extremadamente baja, lo que mejora el rendimiento para las cargas de trabajo de IA y computación de alto rendimiento (HPC). Además, Supermicro es compatible con la recientemente anunciada plataforma NVIDIA GB200 NVL2, un sistema 2U refrigerado por aire con dos GPU NVIDIA Blackwell y dos CPU NVIDIA Grace estrechamente acopladas que resulta idóneo para facilitar la implantación con cargas de trabajo tan diversas como inferencia LLM de gran tamaño, RAG, procesamiento de datos y aplicaciones HPC.

Los principales sistemas de refrigeración líquida 4U y los nuevos sistemas de refrigeración por aire 10U de Supermicro ya son compatibles con el sistema de 8 GPU NVIDIA HGX B200 y están listos para la producción. Las placas frías de nuevo desarrollo y la unidad de distribución de refrigerante en rack de 250 kW de capacidad maximizan el rendimiento y la eficiencia de los sistemas de 8 GPU, proporcionando 64 GPU NVIDIA Blackwell de 1000 W y 16 CPU de 500 W en un único rack de 48U. Pueden instalarse hasta 4 de los nuevos sistemas de 10U refrigerados por aire e integrados totalmente en un rack, la misma densidad que la generación anterior, al tiempo que proporcionan hasta 15 veces más rendimiento de inferencia y 3 veces más de entrenamiento.

El software SuperCloud Composer, la plataforma integral de gestión de centros de datos de Supermicro, proporciona potentes herramientas para supervisar información vital sobre sistemas y bastidores refrigerados por líquido, unidades de distribución de refrigerante y torres de refrigeración, incluyendo presión, humedad, condiciones de bombas y válvulas, etc. El módulo Liquid Cooling Consult Module (LCCM) de SuperCloud Composer optimiza el coste operativo y gestiona la integridad de los centros de datos refrigerados por líquido.

Al escalar la infraestructura para modelos de IA de varios billones de parámetros, Supermicro está a la vanguardia de la adopción de innovaciones de red tanto para InfiniBand como para Ethernet, incluyendo NVIDIA BlueField®-3 SuperNICs y NVIDIA ConnectX®-7 a 400Gb/s, NVIDIA ConnectX®-8, Spectrum™-4, y NVIDIA Quantum-3 para permitir una red de 800Gb/s para la plataforma NVIDIA Blackwell. La Ethernet NVIDIA Spectrum-X™ con los clústeres de sistemas NVIDIA HGX H100 y H200 de Supermicro de 4U refrigerados por líquido y 8U refrigerados por aire ahora impulsan uno de los mayores despliegues de IA hasta la fecha.

Desde la prueba de concepto (PoC) hasta el despliegue a gran escala, Supermicro es una ventanilla única que proporciona todas las tecnologías necesarias, refrigeración líquida, soluciones de red y servicios de instalación in situ. Supermicro ofrece un completo ecosistema de refrigeración líquida de diseño propio, que abarca placas frías de diseño personalizado optimizadas para diversas GPU, CPU y módulos de memoria, junto con múltiples factores de forma y capacidad de CDU, colectores, mangueras, conectores, torres de refrigeración y software de supervisión y gestión. Esta solución integral se integra a la perfección en configuraciones a nivel de rack, lo que aumenta significativamente la eficiencia del sistema, mitiga el estrangulamiento térmico y reduce simultáneamente el coste total de propiedad (TCO) y el impacto medioambiental de las operaciones del centro de datos para la era de la IA.

Supermicro en la 2024 OCP Global Summit

Nuevo sistema X14 4U de refrigeración líquida con 8 GPU NVIDIA HGX B200

SuperCluster NVIDIA GB200 NVL72 Platform 4 de Supermicro

Sistema de refrigeración líquida H13 4U con sistema NVIDIA HGX H200 8-GPU

Sistema X14 JBOF

X14 1U CloudDC con diseño OCP DC-MHS

Más información en el expositor 21 de la OCP Global Summit, San José, California, del 15 al 17 de octubre de 2024.

Acerca de Super Micro Computer, Inc.

(CONTINUA)