Infraestructura de IA

Ejecuta las cargas de trabajo de IA más exigentes más rápido, incluidos el entrenamiento y la inferencia de IA generativa, la computación científica y los motores de recomendación, en cualquier lugar de nuestra nube distribuida. Utiliza Oracle Cloud Infrastructure (OCI) Supercluster para escalar hasta 131 072 GPU.

Ofrece IA en cualquier lugar con Oracle y NVIDIA (2:11)

Oracle y NVIDIA coinnovación

Descubre cómo las dos empresas están acelerando la adopción de la IA.

¿Por qué ejecutar en la infraestructura de IA de OCI?

Rendimiento y valor

Impulsa el entrenamiento de IA con las instancias con hardware dedicado de GPU únicas de Oracle Cloud Infrastructure y redes de clústeres RDMA ultrarrápidas que reducen la latencia a tan solo 2,5 microsegundos. Obtén un precio hasta un 220 % mejor en máquinas virtuales con GPU que en otros proveedores en la nube.

Almacenamiento de HPC

Aprovecha OCI File Storage con destinos de montaje de alto rendimiento (HPMT) y Lustre para terabytes por segundo de rendimiento. Utiliza hasta 61,44 TB de almacenamiento NVMe, el almacenamiento más alto del sector para instancias de GPU.

IA soberana

La nube distribuida de Oracle te permite implementar la infraestructura en cualquier lugar para cumplir con los requisitos de desempeño, seguridad y soberanía de AI. Descubre cómo Oracle y NVIDIA ofrecen IA soberana en cualquier lugar.

Escalabilidad de la imagen de OCI Supercluster, descripción a continuación En la imagen se muestran cuadros que representan recursos informáticos y almacenamiento, conectados por líneas para redes de clúster. En el extremo izquierdo, hay cuatro cajas de recursos informáticos y dos para almacenamiento para el clúster más pequeño con 16 000 GPU NVIDIA H100. A su derecha, hay 8 cajas de recursos informáticos y 4 cajas de almacenamiento para 32 000 GPU NVIDIA A100 en un clúster. A continuación, hay 16 cajas de recursos informáticos y 8 cajas de almacenamiento para 64 000 GPU NVIDIA H200. Por último, a la derecha se encuentran 32 cajas de recursos informáticos y 16 cajas de almacenamiento para 128 000 GPU NVIDIA Blackwell y Grace Blackwell. Esto muestra que la escalabilidad de OCI Supercluster se multiplica por ocho, desde la configuración de GPU más pequeña de 16 000 en el extremo izquierdo hasta la configuración de GPU más grande de 128 000 en el extremo derecho.

OCI Supercluster con GPU NVIDIA Blackwell y Hopper

Hasta 131 072 GPU, 8 veces más de escalabilidad
Las innovaciones de tejido de red que permiten a OCI Supercluster escalar hasta 131 072 GPU NVIDIA B200, más de 100 000 GPU Blackwell en NVIDIA Grace Blackwell Superchips y 65 536 GPU NVIDIA H200.

Infraestructura de IA de Oracle Cloud Infrastructure para todas tus necesidades

Tanto si buscas realizar inferencias, ajustar o entrenar modelos de gran escala para IA generativa, OCI ofrece opciones de clústeres de GPU de máquina virtual y hardware dedicado líderes del sector con tecnología de una red de ancho de banda ultraalto y almacenamiento de alto rendimiento para satisfacer tus necesidades de IA.

Diagrama de productos de infraestructura de IA, descripción a continuación En la imagen se muestran varios productos para AI Infrastructure que comienzan en la parte inferior izquierda con las configuraciones más pequeñas y luego aumentan progresivamente a configuraciones de escala media y gran escala. Las configuraciones más pequeñas tienen solo 1 GPU en una máquina virtual y las configuraciones más grandes tienen más de 100 000 GPU en clústeres de RDMA.

Prueba antes de comprar un programa para OCI Compute AMD con GPU Instinct MI300X.

Conoce OCI Supercluster para el entrenamiento de IA a gran escala

Clústers grandes de escalabilidad horizontal con NVIDIA Blackwell y Hopper


Recursos informáticos supercargados
• Instancias con hardware dedicado sin sobrecarga de hipervisor
• Aceleradas por NVIDIA Blackwell (GB200 NVL72, HGX B200),
Hopper (H200, H100) y GPU de generación anterior
• Opción de utilizar GPU AMD MI300X
• Unidad de procesamiento de datos (DPU) para la aceleración de hardware integrada

Capacidad masiva y almacenamiento de alto rendimiento
• Almacenamiento local: hasta 61,44 TB de capacidad SSD NVMe
Almacenamiento de archivos: servicio Lustre totalmente gestionado (próximamente) y HPMT
con hasta 80 Gb/s de rendimiento
Almacenamiento en bloque: volúmenes equilibrados, de mayor rendimiento y de alto rendimiento con un SLA de rendimiento
Almacenamiento de objetos: distintos niveles de clase de almacenamiento, replicación de cubos y límites de alta capacidad

Redes ultrarrápidas
• Protocolo RDMA sobre Ethernet convergente de diseño personalizado (RoCE v2)
• Latencia de 2,5 a 9,1 microsegundos para redes de clústeres
• Hasta 3 200 Gb/s de ancho de banda de red de clúster
• Hasta 200 Gb/s de ancho de banda de red front-end

Recursos informáticos para OCI Supercluster

Las instancias con hardware dedicado de OCI con tecnología de NVIDIA GB200 NVL72, NVIDIA B200, NVIDIA H200, AMD MI300X, NVIDIA L40S, NVIDIA H100 y GPU NVIDIA A100 te permiten ejecutar grandes modelos de IA para casos de uso que incluyen aprendizaje profundo, IA conversacional e IA generativa.

Con OCI Supercluster, puedes escalar hasta más de 100 000 superchips GB200, 131 072 GPU B200, 65 536 GPU H200, 32 768 GPU A100, 16 384 GPU H100, 16 384 GPU MI300X y 3840 GPU L40S por cluster.

Imagen de recursos informáticos para Supercluster
Ampliar+
El diagrama muestra los nodos de clúster de GPU alimentados por GPU NVIDIA A100 y redes con una latencia inferior a dos microsegundos.

Redes para OCI Supercluster

La red de clústeres RDMA de alta velocidad impulsada por tarjetas de interfaz de red NVIDIA ConnectX con RDMA sobre Ethernet convergente versión 2 le permite crear grandes clústeres de instancias de GPU con la misma red de latencia ultrabaja y escalabilidad de aplicaciones que espera en el entorno local.

No pagas más por la capacidad de RDMA, el almacenamiento de bloques o el ancho de banda de red, y los primeros 10 TB de salida son gratuitos.

Redes para Supercluster
Ampliar+
El diagrama muestra una red RDMA de Supercluster con ocho GPU NVIDIA A100 por nodo conectado mediante un tejido de red de dúplex completo con un ancho de banda entre nodos de 1,6 Tb/s en total.

Almacenamiento para OCI Supercluster

A través de OCI Supercluster, los clientes pueden acceder al almacenamiento local, de bloques, de objetos y de archivos para la computación a escala de petabytes. Entre los principales proveedores de nube, OCI ofrece la mayor capacidad de almacenamiento NVMe local de alto rendimiento para establecer puntos de control más frecuentes durante las ejecuciones de entrenamiento, lo que resulta en una recuperación más rápida de las fallas.

Para conjuntos de datos masivos, OCI ofrece almacenamiento de archivos de alto rendimiento con Lustre y destinos de montaje. Los sistemas de archivos HPC, incluidos BeeGFS, GlusterFS y WEKA, se pueden utilizar para el entrenamiento de IA a escala sin comprometer el rendimiento.

Superclusters de OCI de Zettascale

Mira cómo los principales arquitectos de OCI revelan cómo las redes de clústeres impulsan la IA generativa escalable. Desde unas pocas GPU hasta superclusters de OCI de zettascale con más de 131 000 GPU NVIDIA Blackwell, las redes de clústeres ofrecen alta velocidad, baja latencia y una red resiliente para tu viaje de IA.

26 de marzo de 2025

Presentamos nuevas capacidades de infraestructura de IA con NVIDIA Blackwell para nubes de proveedores de servicios, locales y públicos

Henry Jerez, vicepresidente sénior de Oracle
Christian Linacre, vicepresidente de Oracle

En Oracle Cloud Infrastructure (OCI), nos comprometemos a proporcionar a los clientes la infraestructura en la nube más avanzada para cargas de trabajo de IA, dondequiera que la necesiten.

Lee el post completo

Casos de uso típicos de infraestructura de IA

Entrena modelos de IA en instancias específicas de OCI basadas en GPU, redes de clústeres de RDMA y OCI Data Science.


Diagrama de entrenamiento e inferencias de aprendizaje profundo, descripción a continuación
Entrena modelos de IA en instancias específicas de OCI basadas en GPU, redes de clústeres de RDMA y OCI Data Science.

Proteger los miles de millones de transacciones financieras que se producen todos los días requiere herramientas de IA que puedan analizar grandes cantidades de datos históricos de clientes. Los modelos de IA que se ejecutan en OCI Compute con tecnología de GPU NVIDIA junto con herramientas de gestión de modelos como OCI Data Science y otros modelos de código abierto ayudan a las instituciones financieras a mitigar el fraude.


Detección de fraude aumentada por diagrama de IA, descripción a continuación
Los modelos de IA que se ejecutan en OCI Compute con tecnología de GPU NVIDIA junto con herramientas de gestión de modelos como OCI Data Science y otros modelos de código abierto ayudan a las instituciones financieras a mitigar el fraude.

La IA se utiliza a menudo para analizar diversos tipos de imágenes médicas (como rayos X y resonancias magnéticas) en un hospital. Los modelos entrenados ayudan a priorizar los casos que necesitan revisión inmediata por parte de un radiólogo e informan resultados concluyentes sobre otros.


Diagrama de análisis de imágenes médicas basado en IA, descripción a continuación
Los modelos entrenados que se ejecutan en OCI Compute con GPU analizan imágenes médicas y proporcionan resultados concluyentes inmediatos o priorizan imágenes para una revisión más detallada.

El descubrimiento de medicamentos es un proceso lento y costoso que puede tardar muchos años y costar millones de dólares. Al aprovechar la infraestructura y el análisis de IA, los investigadores aceleran dicho proceso. Además, OCI Compute con tecnología de GPU NVIDIA junto con herramientas de gestión de flujos de trabajo de IA como BioNeMo permite a los clientes curar y preprocesar sus datos.


Uso de la IA para acelerar el descubrimiento de fármacos, descripción a continuación
Al aprovechar la infraestructura y el análisis de IA, los investigadores aceleran el descubrimiento de fármacos, seleccionan y preprocesan sus datos.

Éxitos de clientes con infraestructura de IA

Explora más historias de clientes

Comienza a utilizar OCI AI infrastructure

Accede a expertos en materia de IA

Obtén ayuda para crear tu próxima solución de IA o implementar tu carga de trabajo en la infraestructura de IA de OCI.

  • Pueden responder a preguntas como

    • ¿Cómo puedo empezar a usar Oracle Cloud?
    • ¿Qué tipo de cargas de trabajo de IA puedo ejecutar en OCI?
    • ¿Qué tipos de servicios de IA ofrece OCI?

Descubre cómo aplicar la IA hoy mismo

Entra en una nueva era de productividad con soluciones de IA generativa creadas para tu empresa. Descubre cómo Oracle ayuda a los clientes a aprovechar la IA integrada en toda la pila tecnológica.

  • ¿Qué puedes lograr con Oracle AI?

    • Ajustar LLM en Oracle Cloud Infrastructure
    • Automatiza el procesamiento de facturas
    • Crea un chatbot con RAG
    • Resume el contenido web con IA generativa
    • Y mucho más

Recursos adicionales

Obtén más información sobre redes de clúster RDMA, instancias de GPU, servidores con hardware dedicado y mucho más.

Descubre todo lo que puedes ahorrar con OCI

Los precios de Oracle Cloud son sencillos, con tarifas consistentemente bajas en todo el mundo, y con apoyo a una amplia gama de casos de uso. Para hacer una estimación de tu tarifa reducida, da un vistazo a la calculadora de costos y configura los servicios que se adapten mejor a tus necesidades.

Descubre la diferencia

  • 1/4 de los costos de ancho de banda saliente
  • 3 veces la relación precio-rendimiento de los recursos informáticos
  • El mismo bajo precio en cada región
  • Precios bajos sin compromisos de largo plazo