En el primer artículo de esta serie me centré en el modelo SaaS “clásico”: ARR, ARPU, churn, CAC, LTV y CAC payback. La conclusión era sencilla: el SaaS sigue siendo viable en 2026, pero solo cuando la economía subyacente se gestiona con disciplina.
Los productos SaaS basados en IA añaden una capa nueva de complejidad sobre ese escenario. En la superficie se parecen mucho: precio por suscripción, ingresos recurrentes, producto en la nube. Sin embargo, por dentro, la estructura de costes es distinta. Cada acción relevante del usuario que dispara un modelo de lenguaje grande (LLM) tiene un coste variable directo. Y esos costes distan mucho de ser irrelevantes a escala.
En este artículo analizaremos la economía oculta del SaaS de IA: cómo los tokens se convierten en dinero, cómo afectan al ARR, al ARPU y a los márgenes, y por qué muchos productos de IA aparentemente atractivos son más frágiles de lo que parece.
1. Cómo gana (y gasta) dinero realmente un SaaS de IA
Empecemos por lo básico. Un producto SaaS de IA típico suele tener las siguientes capas:
- Interfaz y UX: lo que ve el usuario (editor, dashboard, chatbot, plugin, etc.).
- Orquestación y lógica de prompts: cómo se transforman las entradas en prompts, herramientas y llamadas a distintos modelos.
- Capa de modelos: llamadas a LLMs (por ejemplo, modelos tipo GPT) y, en su caso, otros modelos (visión, embeddings).
- Datos y almacenamiento: documentos, vectores, logs, configuraciones de usuario, analítica.
- Seguridad, gobierno y cumplimiento: identidad, permisos, auditoría, normativas.
Los ingresos siguen viniendo principalmente de suscripciones:
- Planes mensuales o anuales por usuario o por “seat”.
- A veces, componentes de pago por uso (créditos, generaciones, tokens).
La diferencia crucial está en el COGS (Coste de los bienes vendidos). En un SaaS clásico, el COGS lo dominan la infraestructura y algunos servicios externos. En un SaaS de IA, el COGS incluye:
- Llamadas a APIs de LLM (o el coste de ejecutar modelos propios).
- Infraestructura y almacenamiento adicionales para embeddings y cargas de trabajo con mucho contexto.
- En algunos casos, uso de GPU para fine-tuning o modelos específicos.
Todo fundador serio de un SaaS de IA debería poder responder a una pregunta muy simple:
¿Cuánto me cuesta, de media, cada usuario activo al mes en uso de LLM?
Si esa cifra es vaga, el negocio está volando a ciegas.
2. Del prompt a la factura: cómo los tokens se convierten en una partida de coste
La mayoría de proveedores de LLM facturan en función de tokens, una unidad aproximada de texto. Un SaaS de IA suele incurrir en costes de tokens al menos en tres frentes:
- Tokens de entrada: contenido del usuario + prompts de sistema + contexto.
- Tokens de salida: la respuesta generada.
- Embeddings / recuperación: cuando se generan embeddings de documentos y se consultan.
2.1 Un ejemplo sencillo: generación de documentos o presentaciones
Imaginemos una aplicación de IA que ayuda a generar borradores de documentos o presentaciones. Una interacción típica podría incluir:
- El usuario aporta un briefing o contenido.
- La aplicación añade instrucciones de sistema e historial.
- El LLM genera varias secciones y revisiones.
A muy alto nivel (cifras orientativas):
- Tokens totales de entrada + salida por “generación”: ~5.000–7.000 tokens.
- Un usuario intensivo podría hacer 50–100 de estas generaciones al mes.
- Un usuario poco intensivo podría hacer solo 5–10.
Eso significa que el consumo mensual de tokens por usuario puede situarse fácilmente en:
- Uso bajo: 30.000–50.000 tokens.
- Uso medio: 200.000–300.000 tokens.
- Uso alto: 500.000+ tokens.
Si tu modelo de precios y tus planes no reflejan esas diferencias, puede haber un problema.
3. Un ejemplo de SaaS de IA: ingresos frente a costes de LLM
Construyamos ahora un modelo simplificado para un SaaS de IA que se parezca, conceptualmente, a una herramienta de “documento o presentación inteligente”.
3.1 Supuestos de partida
Supondremos:
- ARPU: 20 USD/mes (plan individual o para pequeñas empresas).
- Usuarios de pago: 5.000 en el Año 1, con un crecimiento moderado después.
- Precios de LLM: sin ligarlo a un proveedor concreto, consideramos tres escenarios de coste:
- Modelo barato: 0,20 USD por millón de tokens (modelos pequeños o destilados).
- Modelo medio: 1,00 USD por millón de tokens.
- Modelo premium: 5,00 USD por millón de tokens.
Para el uso de tokens por usuario y mes definimos tres perfiles:
- Ligero: 50.000 tokens.
- Medio: 200.000 tokens.
- Intensivo: 600.000 tokens.
En la práctica, la base de usuarios será una mezcla de estos perfiles.
3.2 Coste de LLM por usuario activo
Podemos estimar ahora el coste mensual de LLM por usuario en los distintos escenarios.
Tabla 1 – Coste de LLM por usuario y mes (USD)
| Coste modelo (USD / 1M tokens) |
Perfil de uso (tokens/mes) |
Tokens en millones |
Coste por usuario/mes (USD) |
| 0,20 |
50.000 (Ligero) |
0,05 |
0,01 |
| 0,20 |
200.000 (Medio) |
0,20 |
0,04 |
| 0,20 |
600.000 (Intensivo) |
0,60 |
0,12 |
| 1,00 |
50.000 (Ligero) |
0,05 |
0,05 |
| 1,00 |
200.000 (Medio) |
0,20 |
0,20 |
| 1,00 |
600.000 (Intensivo) |
0,60 |
0,60 |
| 5,00 |
50.000 (Ligero) |
0,05 |
0,25 |
| 5,00 |
200.000 (Medio) |
0,20 |
1,00 |
| 5,00 |
600.000 (Intensivo) |
0,60 |
3,00 |
A primera vista, estos importes pueden parecer pequeños. Pero son costes variables puros por usuario. A escala, se vuelven relevantes.
Si cobras 20 USD/mes por usuario:
- Con un modelo barato, el coste de LLM es casi despreciable frente al ARPU.
- Con un modelo premium y usuarios intensivos, el coste solo de LLM puede consumir un 15 % del ARPU (3 USD de 20) antes de pagar infraestructura, soporte o cualquier otra cosa.
Si vendes a empresa y puedes cobrar 40–60 USD por usuario, el margen de maniobra es mayor. Si tu punto de precio ronda los 10 USD o menos, el margen se estrecha.
4. Margen bruto en SaaS de IA: la foto real
En un SaaS de IA, el COGS incluye al menos:
- Costes de LLM/API.
- Infraestructura en la nube (cómputo, almacenamiento, red).
- Servicios de terceros estrechamente ligados al producto.
Volvamos a construir una foto simplificada de márgenes con el ejemplo anterior.
4.1 Ingresos y costes básicos por usuario
Supongamos:
- Precio de suscripción (ARPU): 20 USD/mes.
- Costes variables no relacionados con LLM (infra, soporte, terceros): 1,50 USD/usuario/mes.
- Comparamos tres regímenes de coste de LLM: barato, medio y premium.
- Asumimos un usuario “medio”: ~200.000 tokens/mes.
Tabla 2 – Margen estimado por usuario y mes (USD)
| Escenario |
ARPU |
Coste LLM |
Otros costes variables |
COGS total |
Margen bruto (USD) |
Margen bruto (%) |
| Modelo barato (0,20/M) |
20,0 |
0,04 |
1,50 |
1,54 |
18,46 |
92,3 % |
| Modelo medio (1,00/M) |
20,0 |
0,20 |
1,50 |
1,70 |
18,30 |
91,5 % |
| Modelo premium (5,00/M) |
20,0 |
1,00 |
1,50 |
2,50 |
17,50 |
87,5 % |
En este ejemplo, los márgenes parecen muy cómodos. Pero hay tres matices importantes:
- Los usuarios intensivos pueden consumir muchos más tokens que el “medio”, elevando el coste de LLM a 2–3 USD/usuario/mes o más.
- Hemos supuesto que la infraestructura y el soporte están bien controlados; en la realidad, estas partidas pueden crecer rápido.
- Si tu pricing es agresivo (por ejemplo, 8–12 USD/mes) y el coste de LLM por usuario aumenta, la foto de márgenes puede deteriorarse con rapidez.
El mensaje no es que el SaaS de IA sea inviable. Al contrario, si se gestionan bien el uso y la elección de modelos, es posible mantener márgenes brutos por encima del 80–85 %. El riesgo está en ignorar esta dinámica.
5. ARR, ARPU, CAC y costes de IA: uniendo los dos mundos
El siguiente paso es integrar los costes específicos de IA en la economía SaaS que vimos en el Artículo 1.
5.1 Revisitando ARR y ARPU
En un SaaS de IA:
- El ARR sigue siendo la foto de tus ingresos recurrentes.
- El ARPU sigue siendo clave, pero ahora tiene un reflejo en costes que escala de forma más directa con el uso.
Dos preguntas se vuelven críticas:
- ¿Es tu ARPU lo bastante alto como para absorber con holgura tus peores escenarios de coste de LLM por usuario, además de otros costes variables?
- ¿Está tu pricing alineado con valor y uso reales, o tus usuarios intensivos están erosionando silenciosamente tu margen?
Por ejemplo, si:
- ARPU = 15 USD/mes.
- Uso intensivo de LLM = 3 USD/mes.
- Otros costes variables = 2 USD/mes.
Entonces:
- COGS total/usuario/mes = 5 USD → margen bruto = 10 USD → margen = 66,7 %.
Eso ya no es territorio de “margen SaaS puro”. Se parece más a un negocio de software + servicios tradicionales. Puede seguir siendo viable, pero la estructura económica es muy distinta de un SaaS con margen bruto del 90 %.
5.2 CAC y CAC payback en SaaS de IA
El CAC en SaaS de IA sigue estando impulsado por:
- Publicidad de pago.
- Contenido y marca.
- SDRs y outbound.
- Partners y alianzas.
Sin embargo, los productos de IA suelen disfrutar de un tirón inicial fuerte (porque “están de moda”), lo que puede enmascarar problemas de fondo:
- Muchos trials y registros, pero baja conversión a pago.
- Picos de uso en el primer mes, seguidos de abandono.
- Sobreinversión en funcionalidades que impresionan, pero se usan poco en la práctica.
Si el CAC por usuario es, por ejemplo, 150 USD, y tu margen bruto mensual por usuario es:
- 18 USD en un escenario de margen alto → payback ≈ 8–9 meses.
- 10 USD en un escenario de margen más bajo → payback ≈ 15 meses.
Entonces, el pricing y los patrones de uso ligados a la IA afectan directamente a tu capacidad de financiar el crecimiento.
6. Análisis de sensibilidad: dónde se puede torcer un SaaS de IA
Es útil ver cómo unos pocos parámetros pueden cambiar la economía de un SaaS de IA.
Supongamos:
- ARPU = 20 USD/mes.
- CAC por usuario = 150 USD.
- Costes variables no relacionados con LLM = 1,50 USD/mes.
- Uso base de tokens = 200.000 tokens/mes/usuario.
- Precio medio de modelo = 1,00 USD por millón de tokens.
6.1 Caso base
A partir de los cálculos anteriores:
- Coste de LLM ≈ 0,20 USD/mes/usuario.
- COGS total ≈ 1,70 USD/mes.
- Margen bruto ≈ 18,30 USD/mes.
- CAC payback ≈ 150 / 18,30 ≈ 8,2 meses.
6.2 ¿Qué pasa si se duplica el uso?
Si el uso medio por usuario pasa de 200.000 a 400.000 tokens/mes (por nuevas funcionalidades o flujos más intensivos), el coste de LLM sería:
- 0,40 USD/mes/usuario en lugar de 0,20.
COGS ≈ 1,90 USD; margen bruto ≈ 18,10 USD; el payback apenas cambia. A estos niveles absolutos, el impacto parece pequeño.
Sin embargo, si los usuarios intensivos triplican o cuadruplican su uso, o si tu base de usuarios migra hacia el uso intensivo sin un aumento paralelo de ARPU, la situación cambia con rapidez.
6.3 ¿Y si se duplica el coste efectivo del modelo?
Si el coste por millón de tokens pasa de 1,00 a 2,00 USD —porque cambias a un modelo más potente o por cambios en tu orquestación—:
- Coste de LLM por usuario/mes (a 200.000 tokens) pasa de 0,20 a 0,40 USD.
- COGS total: 1,90 USD.
- Margen bruto: 18,10 USD.
- Payback: 150 / 18,10 ≈ 8,3 meses.
De nuevo, con estos niveles de ARPU y uso, el impacto es manejable. El riesgo real aparece cuando hay ARPU bajo y uso alto.
6.4 La zona peligrosa: ARPU bajo y uso intensivo
Imaginemos un modelo de precios donde:
- ARPU = 10 USD/mes (típico de productos prosumer o B2C de baja fricción).
- Costes variables no LLM = 1,50 USD.
- Uso intensivo: 600.000 tokens/mes.
- Coste de LLM: 0,60 USD/mes (a 1,00 USD por millón de tokens).
Entonces:
- COGS total ≈ 2,10 USD.
- Margen bruto ≈ 7,90 USD.
- Margen bruto ≈ 79 %.
Sobre el papel, sigue siendo un margen razonable. Pero:
- El margen bruto por usuario es menos de la mitad del ejemplo anterior.
- Si el CAC por usuario está entre 60–80 USD, el payback puede irse fácilmente por encima de 9–10 meses.
- Si necesitas pasar a un modelo más caro o soportar operaciones más complejas, el margen puede caer al rango del 60–70 %.
Llegado ese punto, ya no juegas el juego de “SaaS de margen ultraalto”. Estás más cerca de un negocio de software + servicio, con una estructura de costes muy dependiente de proveedores externos.
7. Qué deben controlar los fundadores de SaaS de IA desde el día uno
En mi opinión, hay al menos cinco cosas que todo fundador de SaaS de IA —y todo inversor que mire estos negocios— debería exigir.
7.1 Visibilidad clara de la economía de tokens por usuario
- Tokens medios por usuario y mes, desglosados por plan y segmento.
- Distribución de uso (no solo la media): ¿qué aspecto tiene el 10 % de usuarios que más usan el sistema?
- Mapeo de cada funcionalidad relevante a su coste en tokens.
7.2 Pricing alineado con valor y coste
- Planes que diferencien funcionalidades según valor y coste, no solo por número de proyectos o “llamadas de IA”.
- Límites claros en el free tier: qué se permite, con qué topes.
- Mecanismos para evitar que unos pocos usuarios consuman recursos desproporcionados a bajo precio.
7.3 Estrategia de modelos que evite lock-in y shocks de coste
- Plan realista para combinar modelos más baratos para tareas rutinarias y modelos más potentes para acciones premium.
- Conciencia del riesgo de depender de un único proveedor o modelo sin alternativas.
- Experimentos con distilación de modelos o arquitecturas híbridas cuando la escala lo justifique.
7.4 Integrar los costes de IA en las métricas SaaS clave
- Incluir los costes de LLM e infraestructura de IA directamente en COGS y en el análisis de margen.
- Mirar ARR, ARPU, CAC, LTV y CAC payback con los costes de IA incorporados explícitamente, no como una nota a pie de página.
- Ejecutar análisis de sensibilidad periódicos: ¿qué pasa si cambian los precios de modelo, aumenta el uso o hay que ajustar el ARPU?
7.5 Una narrativa sobria hacia inversores y mercado
- Evitar presentar la IA como un multiplicador mágico de margen cuando, en realidad, es un nuevo centro de coste.
- Enmarcar la IA como un motor de valor que justifica mayor ARPU y mejor retención, no solo como una funcionalidad llamativa.
- Ser explícito en cuanto a oportunidades y riesgos: rendimiento, costes, regulación, competencia.
8. Conclusión: la IA no elimina la gravedad financiera
La IA es poderosa y, en muchos casos, realmente transformadora. Pero no elimina la gravedad financiera. Un SaaS de IA sigue siendo un SaaS: vive o muere por su economía.
Si hay una idea que conviene subrayar para fundadores e inversores, es esta:
Las empresas de SaaS de IA más interesantes en 2026 no son las que tienen la demo más espectacular, sino las que pueden explicar, con números, cómo tokens, modelos y uso se traducen en márgenes sostenibles y paybacks razonables.
En el próximo artículo de la serie cambiamos de ángulo de nuevo, esta vez hacia la perspectiva del inversor:
- ¿Qué miran de verdad los inversores en un SaaS de IA?
- ¿Cómo interpretan ARR, CAC y márgenes en este nuevo contexto?
- ¿Y cómo debería presentar el fundador su historia de IA para que resista una due diligence seria?
Mientras tanto, la prioridad para cualquiera que construya o financie SaaS de IA es clara: poner la economía de tokens y la economía SaaS en la misma conversación, y hacerlo cuanto antes.