Optimizando Costos en APIs de IA: Un Caso de Estudio con OpenRouter y Google Cloud
Share
Optimizando Costos en APIs de IA: Un Caso de Estudio con OpenRouter y Google Cloud
En el mundo actual de la IA, controlar los costos operativos se ha convertido en un desafío crítico para las empresas. Un análisis reciente reveló que la falta de tracking granular puede resultar en gastos opacos y decisiones poco informadas. Este artículo explora cómo implementamos un sistema de tracking completo y optimizamos los costos en una infraestructura que utiliza OpenRouter y Google Cloud.
El Desafío Inicial
Nuestro análisis inicial de OpenRouter mostró un panorama preocupante:
- Un gasto total de $23.27 USD
- 77% de las llamadas API sin identificación clara
- Gemini 3 Pro Image consumiendo el 79% del presupuesto ($18.38 USD)
Solución Implementada
1. Sistema de Tracking Granular
Implementamos un sistema de tracking completo mediante:
- Creación de API keys específicas por workflow:
- AV-0001: Posts para redes sociales
- AV-0002: TTS para LinkedIn
- AV-0007: Contenido YouTube
- TerminalCli: Scripts de terminal
- Headers personalizados (X-Title) para identificación clara de cada llamada
2. Herramientas de Monitoreo
Desarrollamos un script Python personalizado para monitoreo:
Funcionalidades principales:
- list_usage(api_key, limit, offset) # Listar llamadas
- get_cost(api_key, days) # Costo total últimos N días
- clear_cache(api_key) # Limpiar cache
Además, implementamos comandos bash para acceso rápido:
orlist # Lista últimas 20 llamadas
orcost 7 # Costo de últimos 7 días
orclear # Limpia cache
Análisis de Costos en Google Cloud
El análisis de Google Cloud reveló datos interesantes sobre el origen de los gastos ($989.73 USD):
- Veo 3 Audio Generation: 87.7% ($868.11 USD)
- Imagen 4 Ultra: 12.2% ($120.97 USD)
- APIs de texto Gemini: 0.06% ($0.63 USD)
- Generación de imágenes Gemini: 0.002% ($0.02 USD)
Un hallazgo crucial fue que los workflows automatizados en n8n generaban costos mínimos, mientras que los scripts manuales eran responsables de la mayor parte del gasto.
Conclusiones y Mejores Prácticas
Esta implementación nos permitió:
- Lograr un tracking del 100% en todas las llamadas API
- Identificar claramente el origen de los gastos
- Establecer un sistema de monitoreo continuo y eficiente
La transparencia en los costos y el tracking granular son fundamentales para mantener un control efectivo sobre los gastos en servicios de IA. La automatización mediante workflows probó ser más eficiente en términos de costos que los scripts manuales.