Demanda
- Superó las estimaciones de ingresos en un 12,3% y superó sus previsiones en un 13,1%.
- La tasa de crecimiento anual compuesto (TCAC) de la empresa es del 56,4% a tres años, frente al 51,7% del trimestre pasado y el 32,7% de hace dos trimestres.
- El centro de datos es el cubo de ingresos en el que se apoya la proliferación de Gen AI.
Rentabilidad
- El EBIT supera las estimaciones en un 18,7% y las previsiones en un 20,4%.
- Se superan las previsiones de EBIT GAAP en un 22,7%.
- Superó las estimaciones de beneficios por acción (BPA) de 3,40 dólares en 0,61 dólares y superó las previsiones en 0,70 dólares.
- Superó en 250 puntos básicos (pb; 1 pb = 0,01%) la guía de margen bruto GAAP del 71,5%.
- Superó la guía del 72,5% GPM en 250 puntos básicos.
Orientaciones para el cuarto trimestre de 2024
- Superó las estimaciones de ingresos en un 12,4%.
- Superó las estimaciones de EBIT no-GAAP en un 19,4%.
- Superó en un 19,3% las estimaciones de ingresos netos no ajustados a los PCGA.
- Superó en 80 puntos básicos la estimación del 74,7% de GPM no ajustado a los PCGA.
Balance
- 18.300 millones de dólares en efectivo y equivalentes. Los fuertes cobros en efectivo provocaron un descenso de las cuentas por cobrar.
- Deuda de 9.700 millones de dólares, de los que 1.250 millones son corrientes (vencimiento en los próximos 12 meses).
- 4.780 millones de dólares en existencias con compromisos de compra por 17.100 millones.
- 6.870 millones de dólares en recompras en lo que va de año, frente a 8.830 millones interanuales.
- El número de acciones descendió ligeramente interanualmente. Sigue contratando agresivamente para satisfacer la demanda y eso significa más comp. de acciones. Teniendo en cuenta estos resultados, creo que los accionistas (que no lo soy) deberían estar totalmente de acuerdo.
Aspectos destacados de la convocatoria y la publicación
Definiciones y acrónimos importantes
- GPU: Unidad de procesamiento gráfico. Se trata de un circuito electrónico para visualizar imágenes en pantalla.
- CPU: Unidad Central de Procesamiento. Se trata de un tipo diferente de circuito electrónico que realiza tareas o asignaciones y procesamiento de datos de las aplicaciones.
- DGX: plataforma completa de Nvidia que combina sus chipsets y servicios de software.
- Hopper: La nueva arquitectura de GPU de Nvidia diseñada para casos de uso de computación acelerada e IA Generativa. Pieza clave de la plataforma DGX.
- H100: Su chip Hopper 100.
- L40S: Otro chipset de GPU más básico basado en la arquitectura Ada Lovelace. Esto funciona mejor para las necesidades menos complejas.
- Ampere: La arquitectura de GPU que Hopper sustituye para multiplicar por 16 el rendimiento.
- Grace: La nueva arquitectura de CPU de Nvidia diseñada para casos de uso de computación acelerada e IA Generativa. Pieza clave de la plataforma DGX.
- GH200: su superchip Grace Hopper 200 con GPU Nvidia y CPU ARM Holdings.
- InfiniBand: tecnología de interconexión que proporciona una red informática de latencia ultrabaja.
- NeMo: funciones paso a paso guiadas para construir modelos de Gen AI granulares para las necesidades específicas del cliente.
- Entrenamiento generativo de modelos de IA: Una de las dos capas clave para el desarrollo de modelos. Esto prepara un modelo alimentándolo con datos específicos.
- Inferencia generativa de modelos de IA: La segunda capa clave para el desarrollo de modelos. Esto motiva a los modelos entrenados a crear nuevos conocimientos y descubrir nuevos patrones relacionados. Conecta puntos de datos que no sabíamos que estaban relacionados. La formación es lo primero. La inferencia es lo segundo.
El centro de datos va viento en popa
La explosión de los centros de datos se apoya en la arquitectura H100 y en el auge coincidente de la IA Gen. La demanda de computación para centros de datos aumentó un 324% interanual, impulsada por el amplio crecimiento de DGX. La demanda se dividió a partes iguales entre proveedores de servicios en la nube y grandes operadores de Internet como Meta.
H100 se escala de forma eficiente mejor que todos los competidores; esto es clave dado el voraz consumo de datos de los modelos y las aplicaciones Gen AI. Esta afirmación se basa en estudios de referencia independientes de MLPerf, no en conclusiones internas. Según la dirección, la H100 «sigue siendo la plataforma de mayor rendimiento, más rentable y más versátil para el entrenamiento de IA, con un amplio margen.»
Nuevos chips para centros de datos
Nvidia lanza la siguiente iteración de sus chips H100 (sorprendentemente llamados H200), que duplican el rendimiento de la inferencia de modelos, reduciendo así los costes a la mitad (o duplicando el valor de cada chip).
Tensor Runtime (TensorRT) es la base de datos de software de Nvidia con modelos y herramientas para optimizar el rendimiento. Acaba de lanzar un nuevo Large Language Model (LLM) (Modelo de lenguaje grande) que duplica el rendimiento de la inferencia (lo que reduce el coste a la mitad). NVDA sigue iterando constantemente para mejorar la eficiencia y eso no va a cambiar.
Los primeros envíos del chip GH200 de Nvidia ya están en marcha. Mientras que el H100 es perfecto para la mayor parte del entrenamiento e inferencia de modelos, el GH200 permite hacerlo a mayor escala para quienes tienen las necesidades más acuciantes. También crea más visualización y análisis de datos en tiempo real a mayor escala que H100. Ambas se están convirtiendo rápidamente en líneas de productos multimillonarias a un ritmo sin precedentes.
«También tendremos una cadencia de lanzamiento de productos más amplia y rápida para satisfacer un conjunto creciente y diverso de oportunidades de IA». – Colette Kress, directora financiera
Ingresos por redes de centros de datos
El cubo de redes de Nvidia son todos los ingresos generados por la tecnología que permite que «los productos se comuniquen entre sí.» Acaba de superar los 10.000 millones de dólares de ingresos anuales porque sus productos son necesarios para «obtener el rendimiento necesario para entrenar modelos». Azure utiliza 29.000 millas de cableado de conectividad NVDA InfiniBand y prácticamente todos los demás proveedores de servicios en la nube también se apoyan en gran medida en él. Los ingresos por redes aumentaron un 155% interanual gracias a la fuerte infraestructura InfiniBand «para apoyar la demanda de los centros de datos». En el futuro, Nvidia planea expandirse a las redes Ethernet. Lanzará un nuevo producto (denominado Spectrum-X) el próximo trimestre con el apoyo inicial de Dell, Hewlett-Packard y Lenovo. Spectrum-X ofrece un rendimiento de red un 60% superior para la comunicación de IA frente a otras alternativas. Esto significa un menor coste. Mejor rendimiento y menor coste es una constante en los productos de Nvidia.
Como dato importante, prácticamente todas las grandes empresas tecnológicas de consumo en Internet o en la nube utilizan chips Nvidia. Amazon, Microsoft, Google, Meta, Adobe, OpenAI, ServiceNow, Databricks, Snowflake. La lista sigue, y sigue, y sigue. Es el motor de ChatGPT, Microsoft CoPilot, Firefly, Now Assist, Meta AI, etc. Los productos de la empresa son omnipresentes y prácticamente sinónimos de IA.
Oportunidad de mercado público y superordenadores
- Trabajar en colaboración con el gobierno indio y los gigantes tecnológicos de ese país (Reliance, Tata, etc.) para «impulsar su infraestructura soberana de IA».
- El gobierno británico utilizará 24.000 superchips GH200 para construir un nuevo superordenador.
- Los primeros envíos de chips al Centro Nacional Suizo de Supercomputación comenzaron este trimestre.
«La inversión nacional en capacidad informática es un nuevo imperativo económico. Servir al mercado soberano de infraestructuras de IA representa una oportunidad multimillonaria en los próximos años.» – Colette Kress, directora financiera
Suministro H100
Sigue habiendo embotellamientos en el suministro. Resulta ridículo pensar en ello, dado el crecimiento demencial que sigue registrando esta empresa. Imagínese cómo sería si hoy pudiera cumplir todos los pedidos. Las restricciones de la oferta están remitiendo, pero tardarán unos trimestres más en desaparecer del todo (suponiendo que la demanda no se dispare por encima de las expectativas).
Restricciones a la exportación en China
El gobierno estadounidense aplicará nuevas restricciones a la exportación de chipsets que superen determinados parámetros de rendimiento. Entre los países implicados figuran China, Arabia Saudí y algunos otros.
Las nuevas normas afectan a los chipsets de sus arquitecturas Ampere, Hopper (H100), Grace (GH200) y Ada LoveLace (L40S). Las empresas deberán obtener una licencia antes de comercializar este tipo de chips. Las nuevas normas ya están en vigor y empezarán a afectar a Nvidia este trimestre.
En los últimos trimestres, China ha representado para Nvidia entre el 20% y el 25% de todos los ingresos procedentes de los centros de datos. Espera que los ingresos procedentes de ese país se reduzcan drásticamente en el futuro debido a estas normas. Afortunadamente, cree que la demanda en otros lugares compensará con creces este golpe. Recuerde que el H100 sigue teniendo una oferta muy limitada.
NVIDIA está trabajando para obtener las licencias necesarias para reanudar los envíos, pero no sabe cuándo ocurrirá. Por otra parte, está trabajando para garantizar un mayor suministro de chips de menor rendimiento para estas naciones en el futuro. En particular, se ha retrasado el lanzamiento de un chipset conforme a la normativa para China.
Juegos, automóviles y visualización profesional
El crecimiento de los juegos y la visualización profesional se vio favorecido por la normalización del exceso de existencias en el canal a principios de año.
Márgenes brutos
El margen bruto se vio reforzado por un cambio hacia los ingresos de los centros de datos, que superaron a los ingresos, y unas menores provisiones de inventario interanuales. Esas disposiciones eran de Ampere, no de Grace o Hopper. En particular, las provisiones del trimestre del año pasado afectaron a GPM en 1.150 puntos básicos, frente a sólo 240 puntos básicos este trimestre. Fue una fuente importante de expansión del margen bruto. No fue la única fuente, ya que el GPM creció 2.040 puntos básicos interanuales y este viento de cola de las provisiones sólo impulsó el GPM en 910 puntos básicos.
La explosión de los ingresos coincidió con un crecimiento del 16% interanual de los gastos de explotación (OpEx) GAAP y del 13% interanual. Apalancamiento loco.
Notas rápidas sobre software
Los ingresos anuales de Nvidia por software y servicios pronto superarán los 1.000 millones de dólares. Esto incluye los servicios en la nube DGX y sus herramientas de software empresarial de IA. Genentech fue anunciado como nuevo cliente. Utilizará el marco BioNeMo LLM de Nvidia para acelerar el descubrimiento de fármacos. NeMo es su marco estandarizado para construir LLMs, siendo BioNeMo más específico para casos de uso en biotecnología.
La colaboración cada vez más estrecha de Nvidia con Azure permitirá que las aplicaciones Gen AI personalizadas creadas a través de Nvidia se ejecuten sin problemas en Azure. Los clientes podrán acceder a cualquier dato de Azure que necesiten para crear los modelos más específicos a sus necesidades.
Mi opinión
Este es uno de los mejores trimestres de gran capitalización que he cubierto. El último trimestre de Nvidia fue el segundo mejor, mientras que su rendimiento hace dos trimestres fue el tercero mejor. Un rendimiento y una ejecución increíbles, junto con la mejor propuesta de valor de su clase, están preparando el camino para unos resultados históricos. No soy accionista, sólo un admirador.
En aras del equilibrio, me gustaría exponer los dos mayores riesgos que veo para el caso de los mercados alcistas. Evidentemente, esos riesgos no afectan hoy en absoluto a la empresa, pero no por ello dejan de ser dignos de mención.
La primera es la ciclicidad. Ya hemos tenido superciclos antes. Los superciclos han provocado picos locos en el crecimiento de la demanda de las empresas de semiconductores. Nunca tan loco, pero algo loco. El riesgo aquí es que la dinámica de la oferta se normalice, la competencia empiece a ponerse al día (aún queda mucho camino por recorrer) y que el crecimiento vuelva a la tasa anual media plurianual de ~sólo~ aproximadamente el 25%-30% que hemos visto anteriormente. 30 veces los beneficios (donde cotiza Nvidia) es realmente muy barato cuando esos beneficios crecen un 50% anualmente. Es menos barato si el apalancamiento se ralentiza y el crecimiento vuelve a las tendencias de varios años. No cabe duda de que acabará ocurriendo. El riesgo es que ocurra antes de lo que algunos esperan. No puedo opinar porque no conozco el sector lo suficiente como para hacerlo. Pero es un riesgo.
En segundo lugar está China. Es fácil sustituir el 25% de la demanda de centros de datos cuando las limitaciones de la oferta se mantienen y la demanda se acelera. Es más difícil tapar ese agujero en tiempos más normales, como el escenario que describo arriba.
¿Qué no es un riesgo apremiante aquí? Las denuncias de fraude que a algunos les encanta hacer en las redes sociales. Yo llamo a esta gente teóricos de la conspiración… y la conspiración no es convincente en este caso. En definitiva, este ha sido un año perfecto para Nvidia. Se ha ganado una reverencia, Jensen… y luego otra. Usted señaló este superciclo años antes que el resto.