Nos come la IA #8 — No estoy disfrutando del viaje

Cinco agentes en paralelo, cinco herramientas rotas que esos agentes me montaron, y un ciclo de 40 minutos entre identificar un bug y tenerlo arreglado. La IA no se me ha hecho grande — me he convertido yo en el cuello de botella.

Span de control: nodo central conectado a cajas, la mitad rotas

Esta semana, mitad en una reunión de dos horas con Jaime, mitad entre un bug del clasificador y un pago que no conseguía reconciliar, me oí pensar en voz alta una frase que llevaba tiempo masticando: no estoy disfrutando del viaje. Y no es que la IA no funcione. Es justo lo contrario. Funciona tanto que me ha convertido a mí en el cuello de botella.

Cinco agentes y cinco herramientas rotas

Un día normal llevo cinco o seis cosas en paralelo. Lanzo algo en el CRM, actualizo tareas, reviso bugs en Intelia, trabajo en definiciones de arquitectura, opero manualmente procesos para los clientes, y en los huecos avanzo con mi propio workflow. Los ciclos con la IA son largos — entre que pido una cosa y vuelve la prueba pueden pasar varios minutos — así que mientras uno piensa, salto al siguiente. Context switch todo el rato.

Cuando llevaba equipo humano, cinco personas simultáneas era un span de control razonable. Con IA te convences de que debería escalar hacia arriba sin costes. Pero hay un catch que descubro cada día: cuando gestiono cinco agentes, en realidad estoy gestionando diez cosas. Los cinco agentes, y las cinco herramientas que esos agentes me montaron — y que fallan.

Mi CRM tiene edge cases sin contemplar. En Intelia el clasificador se come el año y lo pone donde iba el mes; las reconciliaciones dejan pagos sin asociar; la calcificación de reglas genera buckets podridos; las facturas periódicas con comprobante de pago se doblan entre sí. El daemon escupe alertas. Me siento a lanzar una tarea y aparecen cinco paralelas de cosas rotas que tengo que arreglar para poder seguir.

Cuarenta minutos antes de retomar

En Intelia, el ciclo medio desde que detecto un bug y lo describo hasta que el agente me lo arregla es de cuarenta minutos. Si fallan los tests, o si al arreglarlo rompe otra cosa, suma otros cuarenta. Y como todo está interconectado, el agente repara una pieza y pasado mañana sale otra con grietas. Esta semana he llegado a tener 56 stashes acumulados en Main de trabajar en paralelo con demasiados agentes — metáfora exacta de lo que me pasa: la IA me deja seguir avanzando por arriba mientras el sótano se llena de trabajo a medio terminar.

El caso más simbólico fue un proveedor de uno de nuestros clientes. Lo veo en diagonal — una transferencia de 381,44 € con concepto "pago facturas enero-abril" — y ninguna factura casa. Mi primera reacción es que el problema es nuestro: algún bug de Intelia habrá dejado pagos sin asociar. Le pido a un agente que lo investigue. Vuelve y me dice que no ve ningún problema en el proceso — que simplemente las facturas no cuadran entre sí. Me pongo yo en paralelo, repaso en diagonal, tampoco encuentro nada. Solo al abrir factura por factura, una a una, descubro lo que pasaba: el proveedor había empezado a cobrar IVA a mitad del período. 95,36 × 4 = 381,44. Ni el agente lo había detectado, porque no tenía instrucciones para mirar ese tipo de cosa, ni yo al principio, porque miraba el total. Y al final ni siquiera es un problema técnico — es algo que hay que consultar con el cliente. Media mañana en cinco facturas. Joder, esto es putamente jodido.

El problema no es el span, es que no hay equipo

Con un equipo humano el span de control es algo que aceptas. Delegas, confías, dejas que cada uno encuentre su camino, y a cierto punto metes otra capa de management. Con la IA te engañas: parece que no debería haber límite. Pero lo hay, y es otro.

Los agentes no cierran el loop solos. Les falta autonomía, y les falta contexto — y esas dos cosas están conectadas. Cuando le pido a un agente que arregle un bug, lo arregla en su silo. No tiene el mapa entero. No sabe que al tocar la reconciliación puede romper el merger de documentos. No tiene evals sistemáticos que le avisen. Intenta mirar transversalmente, pero como el código no está limpio, como no hay arquitectura definida, toma decisiones que son razonables en local pero fracasan en global.

Mi rol tendría que ser liderazgo, no micromanagement. Llevar una organización grande de agentes implica lo mismo que llevar un equipo humano: si tienes que sentarte al lado de cada uno a definir qué hacer, estás muerto. El trabajo real es otro — definir contexto, definir objetivos, confiar en que cada uno encuentre su camino, y tener arquitectura suficiente para que cuando varios trabajen en paralelo no se pisen.

Esta semana leí algo que me resonó: "context engineering is the new prompt design". La habilidad real ya no es escribir el prompt — es saber inyectar el contexto correcto antes de soltar al agente. Totalmente de acuerdo. Es la puta clave. Y es exactamente lo que aún no sé hacer bien: darle al agente el mapa completo, no solo la tarea puntual.

Me siento gilipollas

No disfrutar del viaje necesita matiz. Trabajar con la IA me encanta. Lo que no me gusta es pasar el día reparando bugs del automatismo. Cuando el tiempo que dedico a arreglar lo que la IA dejó a medias es mayor que el tiempo que habría tardado en hacerlo a mano desde el principio, me siento gilipollas. Y ese es un sentimiento que, cuando se repite tres días seguidos, mina.

Se me mezcla con otra cosa: mientras yo estoy arreglando mi propia herramienta, fuera está el mundo corriendo. Hoy mismo, jueves 16, Anthropic ha lanzado Claude Opus 4.7 — mejor en código, mejor en visión, capaz de hacer doble-check de su propio trabajo. Todavía no lo he probado; la semana que viene contaré. Y la semana pasada OpenAI metió un plan intermedio de Codex a 100 dólares entre Plus y Pro. Yo acabé pagando el de 200 para correr más cosas en paralelo a mayor calidad — comprar caballos mientras no consigo gobernar los que ya tengo.

Tengo la sensación de que mientras reparo mi propio pozo séptico, me están adelantando por la izquierda. Si hago esto es porque creo que esto es el futuro y quiero ser parte de él. Cuando el día se me va arreglando el automatismo que debería ejecutar las tareas que tengo que hacer, ese proyecto de futuro se me hace pequeño.

No sé si es el peaje

Si pudiera hablar con el Pablo de hace seis meses, no sé qué le diría, porque yo mismo no tengo la respuesta. Tengo dudas: no sé si estamos haciendo mal las cosas, si nos falta contexto del dominio, si vamos demasiado rápido, si me falta experiencia como arquitecto de software, o si simplemente este es el peaje por estar entre los primeros en intentar esto. No lo sé. Estoy frustrado.

Lo que sí tengo claro son los cambios concretos de la próxima semana:

  1. Dejamos de dar de alta clientes. En Intelia tenemos una metodología que llamamos pain-driven development — solo desarrollamos donde duele. Con el nivel de bugs y fragilidad que arrastramos ahora, meter otro cliente es suicidarse.
  2. Jaime se centra en arquitectura y framework. Yo me dejo puntos del día a día para aumentar la fricción entre su trabajo y la realidad — si el framework que monta no resuelve mis problemas reales, no sirve.
  3. Menos obsesión por arreglar todo con código. Trade-offs explícitos: qué merece la pena automatizar y qué es más barato seguir haciendo a mano durante unos meses.
  4. Cuando lo haga a mano, dejar marca. Un aviso, una nota, algo que diga "esto lo resolví manualmente hoy, tiene que entrar en el backlog de automatización". Que no se pierda.

La paradoja del span de control con IA es que no se parece a escalar un equipo — se parece a convertirte en el ingeniero-jefe de un sistema que tú mismo estás construyendo mientras lo utilizas. Para eso no vale con prompts mejores. Vale con dar contexto, construir arquitectura, tener tests, y sobre todo aceptar que hay semanas en las que toca bajar al sótano en vez de seguir añadiendo plantas.

A ver si con eso vuelvo a disfrutar del viaje.


Nos come la IA es un newsletter semanal de Pablo Muñiz, cofundador de Intelia. Si te ha gustado, compártelo con alguien que hable de IA pero no la haya tocado.