Optimizando Costos en APIs de IA: Un Caso de Estudio con OpenRouter y Google Cloud

Optimizando Costos en APIs de IA: Un Caso de Estudio con OpenRouter y Google Cloud

Optimizando Costos en APIs de IA: Un Caso de Estudio con OpenRouter y Google Cloud

En el mundo actual de la IA, controlar los costos operativos se ha convertido en un desafío crítico para las empresas. Un análisis reciente reveló que la falta de tracking granular puede resultar en gastos opacos y decisiones poco informadas. Este artículo explora cómo implementamos un sistema de tracking completo y optimizamos los costos en una infraestructura que utiliza OpenRouter y Google Cloud.

El Desafío Inicial

Nuestro análisis inicial de OpenRouter mostró un panorama preocupante:

  • Un gasto total de $23.27 USD
  • 77% de las llamadas API sin identificación clara
  • Gemini 3 Pro Image consumiendo el 79% del presupuesto ($18.38 USD)

Solución Implementada

1. Sistema de Tracking Granular

Implementamos un sistema de tracking completo mediante:

  1. Creación de API keys específicas por workflow:
  • AV-0001: Posts para redes sociales
  • AV-0002: TTS para LinkedIn
  • AV-0007: Contenido YouTube
  • TerminalCli: Scripts de terminal
  1. Headers personalizados (X-Title) para identificación clara de cada llamada

2. Herramientas de Monitoreo

Desarrollamos un script Python personalizado para monitoreo:

Funcionalidades principales:

- list_usage(api_key, limit, offset) # Listar llamadas - get_cost(api_key, days) # Costo total últimos N días - clear_cache(api_key) # Limpiar cache

Además, implementamos comandos bash para acceso rápido:

orlist    # Lista últimas 20 llamadas
orcost 7  # Costo de últimos 7 días
orclear   # Limpia cache

Análisis de Costos en Google Cloud

El análisis de Google Cloud reveló datos interesantes sobre el origen de los gastos ($989.73 USD):

  • Veo 3 Audio Generation: 87.7% ($868.11 USD)
  • Imagen 4 Ultra: 12.2% ($120.97 USD)
  • APIs de texto Gemini: 0.06% ($0.63 USD)
  • Generación de imágenes Gemini: 0.002% ($0.02 USD)

Un hallazgo crucial fue que los workflows automatizados en n8n generaban costos mínimos, mientras que los scripts manuales eran responsables de la mayor parte del gasto.

Conclusiones y Mejores Prácticas

Esta implementación nos permitió:

  1. Lograr un tracking del 100% en todas las llamadas API
  2. Identificar claramente el origen de los gastos
  3. Establecer un sistema de monitoreo continuo y eficiente

La transparencia en los costos y el tracking granular son fundamentales para mantener un control efectivo sobre los gastos en servicios de IA. La automatización mediante workflows probó ser más eficiente en términos de costos que los scripts manuales.

Regresar al blog

Deja un comentario