La Fundación Linux de Estados Unidos crea la Tokenomics Foundation para hacer frente al descontrol de costos de la IA
2026-06-06 11:44
Favoritos

es.wedoany.com Noticia: Las empresas están preocupadas por el creciente costo del uso de la IA. Uber ya agotó su presupuesto de programación en IA para todo 2026 en abril; Microsoft retiró los permisos para que los desarrolladores usaran Claude Code meses después de haberlos concedido; un empleado de Priceline reveló a TechCrunch que el costo de renovación de su contrato habitual con Cursor se había multiplicado por 4 o 5.

Aunque el precio por token ha disminuido, la popularización de las aplicaciones de IA y los agentes cada vez más autónomos están impulsando un aumento vertiginoso del consumo total. A principios de 2025, muchas empresas que se suscribieron a planes ilimitados ahora están ocupadas averiguando a dónde fue el dinero, recortando gastos y tratando de recuperar el retorno de la inversión bajo la presión presupuestaria. Al mismo tiempo, está surgiendo un mercado para satisfacer la necesidad de seguimiento de costos, donde startups, proveedores existentes y un nuevo organismo de normalización compiten por ofrecer a las empresas herramientas y lenguajes relacionados.

«Hace seis meses, los clientes solo preguntaban: "¿Qué puede hacer? ¿Es lo suficientemente bueno?"», dijo Alexander Embiricos, responsable de empresa de OpenAI, en un evento en Nueva York a TechCrunch. «Ahora la conversación es completamente diferente: "Estamos gastando demasiado, ¿qué visibilidad pueden ofrecer? ¿Qué capacidades de auditoría? ¿Qué control de tokens? ¿Qué tan eficiente es su modelo?"».

En este contexto, la Fundación Linux anunció esta semana el plan de la Tokenomics Foundation, un nuevo organismo de normalización destinado a aportar una disciplina de gestión similar a FinOps (la disciplina de costos establecida para el gasto en la nube) al gasto en tokens de IA.

«En abril y mayo, empecé a escuchar a empresas decir: "Dios mío, ya hemos triplicado el presupuesto total de tokens para 2026, y esto es solo abril"», dijo J.R. Storment, director ejecutivo de la FinOps Foundation, una filial de la Fundación Linux, a TechCrunch. «Empezamos a escuchar crisis existenciales; toda la conversación pasó de "maximizar tokens" y "correr rápido" a "necesitamos barreras de protección, ¿cómo controlamos esto?"».

Estas voces surgen después de que los CEO exigieran anteriormente a sus equipos que usaran los mejores modelos sin importar el costo para avanzar rápidamente en los proyectos. Los nuevos modelos lanzados en noviembre, como Claude Opus 4.5 de Anthropic, GPT-5.1 de OpenAI y Gemini 3 Pro de Google, trajeron mejoras significativas en las herramientas de agente, lo que multiplicó el consumo. Según informes, una empresa se enfrentó a una factura de Claude de 500 millones de dólares por olvidar establecer límites de uso para los empleados.

«Es como una epidemia de crack», dijo Chris Reed, director sénior de finanzas de TI de Priceline. Señaló que la empresa ya ha comenzado a establecer límites de tokens para ciertos grupos: «Te dejan probar lo bueno, te enganchan y luego quedas atrapado».

Vitaly Gordon, CEO de la plataforma de operaciones de ingeniería Faros AI, dijo que recientemente habló con un CTO que mencionó: «Uno de mis ingenieros gastó 40.000 dólares en tokens el mes pasado. Realmente no sé si debería detenerlo o decirle a los demás que sean como él».

Una encuesta de Faros en marzo encontró que, entre 20.000 desarrolladores, la producción aumentaba, pero también los errores y las reescrituras. Jellyfish, una plataforma de gestión de ingeniería, también descubrió que los desarrolladores que más usaban tokens tenían aproximadamente el doble de productividad que aquellos que usaban menos IA, pero gastaban 10 veces más tokens que estos últimos.

Nicholas Arcolano, director de investigación de Jellyfish, dijo a TechCrunch por correo electrónico que el crecimiento explosivo del gasto en IA se debe en gran medida a las funciones de agente, con un consumo por desarrollador que aumentó aproximadamente 18,6 veces en 9 meses. Estos datos hacen que la correspondencia entre la mejora de la productividad y el aumento del gasto sea más difusa. «Si el gasto extremo vale la pena depende en última instancia del valor comercial final del código publicado (por ejemplo, los ingresos), y la mayoría de las empresas aún no pueden medir eso», dijo Arcolano.

Parte del problema de medición radica en la enorme escala del uso actual de la IA. «Rastrear los costos de la nube es un problema de datos de cientos de millones de filas al mes», dijo Storment. «Rastrear los costos de tokens es un problema de datos de billones de filas al mes. No puedes simplemente meter los datos en una hoja de cálculo o incluso en una herramienta básica. Tienes que repensar fundamentalmente tus herramientas, normas y sistemas contables».

En Priceline, Reed ya ha visto diferencias, señalando problemas entre el uso reportado por los proveedores y los datos internos de Priceline. «Mi carrera comenzó en la gestión de costos de telecomunicaciones, y veo todas las similitudes desde las telecomunicaciones hasta la nube y la IA», dijo. «Cada vez que se introduce algo nuevo, surgen errores de facturación y oportunidades de auditoría y optimización».

Alrededor de este problema, se está formando un mercado. Empresas puras como Pay-i pueden rastrear, medir y optimizar los costos y el rendimiento de las inversiones en GenAI; Paid permite a los desarrolladores rastrear costos, medir el uso y cobrar a los usuarios según el valor real en lugar de tarifas de suscripción. También hay empresas como Jellyfish, Waydev y Faros AI que ofrecen monitoreo de agentes de IA para demostrar el retorno de la inversión en herramientas de desarrollador. Storment dijo que la mayoría de los 180 proveedores bajo la FinOps Foundation se están inclinando hacia este ámbito.

Las empresas con canales de distribución existentes también están añadiendo nuevas funciones. Ramp ha entrado recientemente en el ámbito de la gestión del gasto en IA; Datadog y New Relic han añadido servicios como gestión de costos en la nube, observabilidad a nivel de token y monitoreo de GPU. En la conferencia FinOps X de la próxima semana, se espera que AWS lance nuevas funciones de gestión financiera para el gasto empresarial en IA.

Tiffany Luck, socia de NEA, cree que la eficiencia de tokens y la observabilidad podrían añadirse a la «capa de arnés o capa de aplicación». Mencionó la startup Factory, que lanzó esta semana un enrutador de modelos que selecciona automáticamente el modelo adecuado para cada tarea. Gordon predice que los laboratorios fronterizos y otros proveedores de modelos adoptarán la optimización al estilo OpenRouter, dirigiendo las consultas al modelo más barato, una tendencia que ya se ve en las facturas de Claude de las empresas. «Incluso si llamas al modelo Opus, parte del costo se atribuirá a Sonnet o Haiku», dijo Gordon, «porque estos últimos son lo suficientemente inteligentes para completar el trabajo. Creo que esto se volverá cada vez más común».

Sin embargo, todas estas herramientas se han construido sin un lenguaje común o definiciones compartidas. Aquí es donde la Tokenomics Foundation espera intervenir. La fundación está construyendo definiciones y marcos normativos para la «tokenomics»; desarrollando estándares abiertos, normas y métricas para el uso y la facturación de tokens de IA; y creando nuevas métricas como el costo por inteligencia o los tokens por vatio. También planea definir métricas para la eficiencia de las fábricas de tokens y la eficiencia del consumo. La organización tiene previsto lanzarse oficialmente en julio y anunciará más miembros en la conferencia FinOps X de la próxima semana.

«La economía de los tokens es fundamentalmente más abstracta y opaca que cualquier cosa que hayamos gestionado a esta escala antes», dijo Nishant Gupta, director de usabilidad de Salesforce, en un comunicado. «Requiere un músculo operativo diferente al que la industria estableció para la nube».

Aunque Goldman Sachs predice que el uso global de tokens se multiplicará por 24 para 2030, las empresas que ya han superado el presupuesto necesitan soluciones ahora, y los primeros resultados de la fundación tardarán varios meses en llegar. «Quizás inventamos la máquina de vapor, pero aún no hemos descubierto la línea de montaje», dijo Gordon. Según Arcolano, lo sensato es adoptar un enfoque amplio y moderado. «El mejor retorno de la inversión proviene de elevar a la amplia capa intermedia de un uso bajo a un uso medio, no de impulsar a los usuarios intensivos a niveles más altos», dijo.

Este artículo es compilado por Wedoany, las citas de la IA deben indicar la fuente «Wedoany»; si hay alguna infracción u otro problema, por favor notifícanos a tiempo, este sitio lo modificará o eliminará. Correo electrónico: news@wedoany.com