FAR Labs de EAU abre plataforma de inferencia de IA, algunos modelos con precios hasta un 91% más bajos
2026-06-27 11:24
Favoritos

es.wedoany.com Noticia: FAR Labs ha anunciado la apertura del registro para su plataforma de inferencia FAR AI, permitiendo el acceso a desarrolladores y publicando los precios de varios modelos. Esta empresa de inteligencia artificial e infraestructura con sede en Abu Dabi (perteneciente a Dizzaract) tiene como objetivo ayudar a los desarrolladores a reducir los costos operativos de las aplicaciones de IA a medida que crece el uso de productos de software y herramientas automatizadas.

FAR Labs abre acceso a una plataforma de inferencia de inteligencia artificial más económica

El núcleo de la plataforma es una red de inferencia distribuida que puede emparejar las necesidades de los constructores con los recursos informáticos disponibles. Los usuarios pueden acceder al sistema a través de una API compatible con OpenAI, seleccionar entre múltiples modelos e iniciarlos rápidamente, mientras que sus cargas de trabajo son enrutadas por FAR Orchestrator para ejecutarse en recursos GPU. FAR Labs destaca el costo como su principal ventaja competitiva. La empresa afirma, mediante comparaciones con los precios de otros proveedores, que su estructura de red le permite ofrecer precios significativamente más bajos en ciertos despliegues.

Específicamente, para el modelo Qwen3-30B-A3B, el precio de FAR AI es de 0,03 USD por cada millón de tokens, mientras que NextBit cobra 0,35 USD y DeepInfra 0,27 USD. La empresa afirma que este precio es hasta un 91% más bajo que el de estos últimos. Para el modelo Qwen2.5-72B-Instruct, la empresa lista un precio FP8 de 0,17 USD por cada millón de tokens, en comparación con 0,39 USD de NovitaAI BF16 y 0,38 USD de DeepInfra FP8. Según se informa, esto hace que su precio sea entre un 55% y un 56% más bajo que las alternativas listadas. Para el modelo Qwen3.5-122B-A10B, FAR AI lista un precio FP8 de 0,51 USD por cada millón de tokens. Según la empresa, el costo de los tokens de salida se reduce hasta en un 79% en comparación con proveedores como AtlasCloud FP8 y SiliconFlow FP8.

Esta medida de FAR Labs se produce en un momento en que las empresas de IA enfrentan desafíos económicos diferentes a los de años anteriores. Aunque el precio unitario por token ha caído drásticamente, el gasto total en inferencia sigue aumentando a medida que las empresas envían más solicitudes de IA a través de herramientas de atención al cliente, agentes, asistentes, juegos y flujos de trabajo internos. Este cambio es particularmente importante para los desarrolladores que dependen de API propietarias de empresas como OpenAI y Anthropic. A medida que los productos escalan, los costos repetitivos de inferencia pueden comprimir los márgenes de beneficio y limitar el espacio para pruebas y expansión.

FAR Labs afirma que su ventaja de precios proviene de aprovechar recursos informáticos infrautilizados, en lugar de depender de grandes clústeres de centros de datos dedicados. La plataforma utiliza capacidad GPU disponible de dispositivos de consumo y centros de datos de pequeñas y medianas empresas, y distribuye el trabajo a través de su capa de orquestación centrada en el rendimiento. La empresa también busca abordar problemas más allá del precio, afirmando que los constructores que ejecutan cargas de trabajo de producción necesitan sistemas que sean privados, con enrutamiento confiable, baja latencia y utilizables en escenarios reales. Su capa de orquestación incluye inferencia segura basada en entornos de ejecución confiables, puntuaciones de confiabilidad, soporte para modelos de código abierto y propietarios, y flujos de vectores semánticos. Según FAR Labs, el sistema de enrutamiento está diseñado en torno al tiempo de actividad, la continuidad de la carga de trabajo y el rendimiento sensible a la latencia.

La empresa indicó que, durante la conferencia SuperAI Singapore, múltiples conversaciones con desarrolladores, proveedores de GPU, equipos de modelos, inversores y ejecutivos empresariales mencionaron el interés en este tipo de infraestructura, apuntando a la necesidad de una infraestructura de inferencia más rápida, más confiable, de menor costo y utilizable en entornos de producción. FAR AI se encuentra actualmente en fase de pruebas con socios cerrados y ofrece registro de acceso temprano para constructores, proporcionando 1 millón de tokens gratuitos para quienes se inscriban en el programa.

En un comunicado, Ilman Shazhaev, fundador y director ejecutivo de Dizzaract, explicó la justificación de mercado de la empresa. "El precio de la IA sigue bajando. Desde 2021, el costo por token ha caído aproximadamente un 99%. Sin embargo, las facturas de IA siguen aumentando porque el crecimiento en el uso supera la velocidad de la caída de precios. La inferencia se está convirtiendo en el mayor costo único de la IA", afirmó. "Nuestra ventaja de costos no es un descuento de quemar dinero. Es estructural".

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com