es.wedoany.com Noticia: HPE ha ampliado significativamente su plataforma de IA durante la conferencia HPE Discover en Las Vegas. Anteriormente, la plataforma admitía hasta 64 GPU, y ahora el límite se ha elevado a 256 GPU. Los clientes pueden comenzar con configuraciones más pequeñas y ampliar el rendimiento añadiendo bastidores posteriormente. Además de los servidores ProLiant equipados con aceleradores de Nvidia, el sistema integra almacenamiento, Data Fabric y software para modelos, aplicaciones de IA y agentes, donde Morpheus se encarga del control y OpsRamp de la supervisión.
Los servicios de instalación e integración están incluidos en la oferta. HPE proporciona el entorno completo a un precio fijo total, con el objetivo de que las empresas no tengan que ensamblar por sí mismas una fábrica de IA a partir de componentes individuales de hardware, software y otros elementos. Private Cloud AI de HPE integra Nvidia AI Enterprise, modelos seleccionados y herramientas de desarrollo, así como Nvidia Agent Toolkit, modelos Nemotron, NemoClaw y OpenShell. Los agentes pueden registrarse, desplegarse y configurar reglas de acceso a través de estas herramientas. En cuanto a la computación, el producto se complementa con sistemas equipados con Nvidia RTX Pro 6000 Blackwell Server Edition.
Además, HPE ha lanzado el ProLiant DL394 Gen12, equipado con la CPU Vera de Nvidia basada en la arquitectura Arm. Esta CPU maneja las partes intensivas en memoria y controladores en las aplicaciones de agentes, y colabora estrechamente con las GPU de Nvidia. Por lo tanto, Private Cloud AI de HPE se construye principalmente en torno al stack de hardware y software de Nvidia, lo que reduce la carga de integración, pero también implica una menor flexibilidad en la elección de aceleradores y entornos de ejecución.
Alletra Storage MP X10000 desempeña un papel central en la nueva plataforma de IA. Esta plataforma ofrece almacenamiento de archivos y objetos en una arquitectura unificada, y se integra directamente en Private Cloud AI. HPE también lo utiliza como almacenamiento extendido para la caché KV relacionada con el rendimiento. Los modelos de lenguaje almacenan información sobre el texto procesado, el contexto y los resultados intermedios en la caché KV. Cuando reciben solicitudes adicionales, los modelos recurren a estos contextos en lugar de recalcularlos cada vez.
Esto es especialmente importante para indicaciones largas, grandes volúmenes de documentos y múltiples agentes en paralelo. Cuanto más largo sea el contexto y más solicitudes simultáneas haya, más rápido crecerán las necesidades de almacenamiento. Si se elimina información de contexto antigua, el modelo debe recalcularla en solicitudes posteriores, lo que aumenta la latencia, el consumo de energía y los costos. En entornos de agentes, el problema es más grave, ya que los agentes no solo responden una vez, sino que verifican, planifican, recuperan datos y preparan operaciones repetidamente.
Por lo tanto, HPE descarga parte de la caché KV en el X10000 mediante acceso directo a memoria remota (Remote Direct Memory Access). En este proceso, los datos se transfieren directamente entre el almacenamiento y la memoria, sin pasar por múltiples capas de procesamiento del sistema operativo. De esta manera, la unidad de almacenamiento asume parte de la memoria de la GPU y se convierte en parte del proceso de inferencia. Según HPE, en su configuración de prueba con GPU Nvidia H200 y el modelo Nemotron 70B, el tiempo hasta el primer token de salida se redujo a una vigésima parte, mientras que el rendimiento aumentó 17 veces.
El nuevo Data Fabric 8.2 puede capturar y catalogar recursos de datos distribuidos. Un catálogo global muestra qué información existe y dónde se encuentra. Los metadatos, la identidad y las políticas de acceso determinan qué aplicaciones o agentes pueden acceder a recursos específicos. Data Fabric también está disponible como dispositivo preconfigurado en servidores ProLiant. En toda la pila tecnológica, X10000 se encarga del acceso rápido a los datos, mientras que Data Fabric hace que los recursos de datos sean detectables y controlables.
Sin embargo, la organización técnica de datos por sí sola no hace que los datos sean adecuados para la IA. Para el entrenamiento y los agentes, los datos primero deben clasificarse, limpiarse, describirse y configurarse con permisos. Aunque existen herramientas automatizadas, este proceso aún requiere trabajo manual en parte. Por ejemplo, los departamentos comerciales deben explicar el significado, la vigencia y el propósito de ciertos datos.
Para operar el entorno de IA integrado, HPE depende de Morpheus, OpsRamp y GreenLake Intelligence. Morpheus proporciona recursos de computación, almacenamiento y tiempo de ejecución, y orquesta la infraestructura de nube privada. OpsRamp recopila datos de telemetría y supervisa las dependencias entre aplicaciones, modelos e infraestructura subyacente. Actualmente, la conexión entre estas funciones operativas y la automatización impulsada por IA es más estrecha. Morpheus Central tiene como objetivo mostrar múltiples instancias de instalación en centros de datos, regiones y sitios periféricos.
Esto es importante para los entornos de IA, porque los modelos, los datos y los servicios de inferencia a menudo no se ejecutan en una sola ubicación. OpsRamp no solo recopila fallos, sino que también los correlaciona e identifica las causas raíz en la infraestructura. HPE ha ampliado esta capa con funciones de Copilot y la interfaz MCP. Morpheus Copilot puede crear planos y automatizaciones basándose en instrucciones en lenguaje natural. OpsRamp Copilot debe analizar eventos y respaldar las medidas correctivas. El servidor MCP proporciona interfaces estandarizadas a través de las cuales los agentes pueden acceder a funciones de gestión y automatización. GreenLake Intelligence integra estas funciones en un plano de control unificado.
HPE complementa la pila tecnológica con funciones para controlar agentes de IA. Estos agentes tienen su propia identidad y se ejecutan en entornos aislados. Las políticas especifican qué datos, interfaces y herramientas pueden utilizar. Para operaciones críticas, se puede requerir aprobación humana. Zerto proporciona una capa de reversión adicional; el software registra los cambios y, si es necesario, restaura los sistemas afectados a un estado anterior. Sin embargo, no puede identificar si una decisión es técnicamente incorrecta o regulatoria no permitida.
Para HPE, la gobernanza se refiere principalmente al control de acceso técnico y la ejecución de políticas. La validación de modelos de negocio, la detección de sesgos, la clasificación regulatoria y la asignación de responsabilidades siguen siendo tareas fuera de la plataforma. Este es precisamente el punto débil de muchas estrategias de IA privada. Si bien la infraestructura propia aumenta el control sobre los datos y las operaciones, no puede reemplazar la gobernanza. IBM y Red Hat señalaron recientemente que muchas empresas no comprenden completamente las dependencias de los proveedores de IA, modelos e infraestructura. La nube privada puede hacer que estas dependencias sean más transparentes, pero no puede eliminarlas.
Los productos de fábrica de IA en el mercado difieren notablemente. Por ejemplo, Dell adopta una infraestructura desagregada, donde la computación y el almacenamiento pueden escalarse de forma independiente. En contraste, HPE agrupa más estrechamente el hardware, la plataforma de datos y el software operativo en un sistema integral definido. Esto traslada el trabajo de integración del cliente al fabricante, pero reduce los grados de libertad, especialmente aumentando la dependencia de Nvidia, ya que HPE integra no solo las GPU, sino también las CPU, modelos, entornos de ejecución y herramientas de agente del socio. La ventaja es que los componentes están bien coordinados; la desventaja es que, si se desea reemplazar un componente individual, se alcanzarán más rápidamente las limitaciones de la arquitectura.
La oferta de HPE de productos de IA como nube privada se alinea con la tendencia actual. A medida que la IA pasa de proyectos piloto a operaciones de producción, la forma de calcular la infraestructura también cambia: los servicios de nube pública siguen siendo atractivos para pruebas, cargas de trabajo flexibles y acceso rápido a nuevos modelos; mientras que para inferencia persistente, flujos de trabajo de agentes y datos sensibles, el control de costos y el acceso a los datos se convierten en prioridades. Deloitte cree que existe un punto de inflexión económico bajo cargas de IA sostenidas: cuando los costos de la nube alcanzan una parte significativa de los costos de un sistema propio comparable, la opción de nube privada puede ser más barata. Forrester también prevé que, debido al aumento de los costos de IA, el bloqueo de datos y los riesgos operativos, las empresas adoptarán más nubes privadas de IA. Private Cloud AI de HPE no se presenta como una oposición a la nube pública, sino como una plataforma operativa para cargas de trabajo de IA que deben estar más cerca de los datos y los procesos. Cabe destacar que la pila tecnológica completa aún no está completamente lista; algunas funciones e integraciones anunciadas estarán disponibles en los próximos trimestres.
Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com









