NVIDIA y AWS colaboran para lograr una aceleración de 10 veces en la indexación de vectores Noticias Globales

NVIDIA y AWS colaboran para lograr una aceleración de 10 veces en la indexación de vectores

2026-06-26 09:52

Favoritos

es.wedoany.com Noticia: El 25 de junio de 2026, NVIDIA y Amazon Web Services (AWS) han establecido recientemente una colaboración destinada a resolver restricciones clave como la inferencia de baja latencia, la búsqueda rápida de vectores, la relación costo-rendimiento de las GPU y la expansión de la infraestructura al construir sistemas de IA a gran escala. A través de Amazon OpenSearch y Amazon EC2, la infraestructura de IA de NVIDIA ofrece a las empresas más vías prácticas para implementar IA en producción a gran escala.

Las instancias EC2 G7, impulsadas por GPU NVIDIA RTX PRO 4500 Blackwell Server Edition, amplían la capa de cómputo para cargas de trabajo de IA, gráficos, video y análisis de datos. La biblioteca NVIDIA cuVS acelera la capa de recuperación al hacer que la indexación de vectores impulsada por GPU sea la opción predeterminada en OpenSearch Serverless. Además, AWS ha obtenido el estado de NVIDIA Exemplar Cloud en NVIDIA GB300, lo que garantiza a los clientes un rendimiento óptimo en sus cargas de trabajo de entrenamiento.

Las instancias Amazon EC2 G7 introducen las GPU NVIDIA RTX PRO 4500 Blackwell Server Edition en AWS para inferencia de IA, gráficos, computación espacial y análisis de datos acelerados por GPU. Se trata de un nuevo tipo de instancia diseñado para cargas de trabajo de producción, cuyo objetivo es ofrecer rendimiento sin que los clientes tengan que gestionar los gastos operativos de la plataforma GPU. En comparación con las instancias G6, las G7 ofrecen hasta 4,6 veces el rendimiento de inferencia de IA y hasta 2,1 veces el rendimiento gráfico. Al utilizar la biblioteca NVIDIA cuDF para cargas de trabajo de Apache Spark, esta instancia permite un análisis de datos acelerado por GPU más rápido en Amazon EMR. Las instancias G7 admiten hasta 8 GPU, con un total de 256 GB de memoria GPU, conectividad de red EFA de 700 Gbps y hasta 7,6 TB de almacenamiento NVMe SSD local, en configuraciones de 1, 2, 4 y 8 GPU, además de próximas instancias bare metal, lo que permite a los clientes ajustar la escala de la infraestructura según la carga de trabajo.

La próxima generación de Amazon OpenSearch Serverless ofrece soporte para IA de agentes y cargas de trabajo dinámicas sin necesidad de gestionar infraestructura. Este servicio utiliza la indexación de vectores acelerada por GPU impulsada por NVIDIA cuVS como opción de cómputo predeterminada para todos los conjuntos de vectores. Para los equipos que construyen aplicaciones de generación aumentada por recuperación, búsqueda semántica, sistemas de recomendación e IA de agentes, este cambio transforma la búsqueda de vectores impulsada por GPU de un proyecto de optimización especializado a una capacidad estándar de AWS. El impacto para los clientes se manifiesta en: una velocidad de indexación de vectores hasta 10 veces mayor en comparación con las construcciones solo con CPU, con un costo de solo una cuarta parte, lo que hace posible construir una base de datos de vectores de mil millones de elementos en menos de una hora.

AWS ha obtenido el estado de NVIDIA Exemplar Cloud en NVIDIA GB300 para cargas de trabajo de entrenamiento. Esto significa que AWS ha cumplido con los estrictos umbrales de rendimiento que NVIDIA utiliza para comparar cargas de trabajo de IA con su arquitectura de referencia. Este logro es fruto de una profunda ingeniería conjunta entre los equipos de AWS y NVIDIA. A través del programa NVIDIA Exemplar Cloud, los desarrolladores y líderes de IA pueden estar seguros de que están utilizando una infraestructura de nube consistente y de alto rendimiento para el entrenamiento a gran escala, lo que ayuda a los equipos a evaluar proveedores de nube con mayor confianza, mejorar el costo total de propiedad y avanzar proyectos de IA desde la planificación hasta la producción de manera más eficiente.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com