Accounting V3 — Arquitectura conceptual

Status: Target conceptual · No implementación Fecha: 2026-05-22 Síntesis de: v3-conceptual-claude/ + v3-conceptual-codex/

1. Tesis

V3 no es una reescritura de V2 con mejores nombres. Es un cambio de frontera.

El principio rector es separar con violencia conceptual tres mundos que en V2 aparecen mezclados:

El System of Record (SoR) persiste la verdad contable canónica. Hoy es Holded. Mañana puede ser Odoo, Sage u otro ERP, pero Intelia no debe simularlo.
El System of Action (SoA) decide, propone, valida, aprende y opera. Intelia es el SoA.
El Conector / Integrador traduce entre las decisiones del SoA y la interfaz concreta del SoR, sin apropiarse de la semántica contable global.

V3 acepta que Holded no es sólo una API: es el primer ERP real con conceptos, límites, peculiaridades, permisos, pantallas, comentarios, documentos, contactos, tags, asientos, facturas y comportamientos observables. Pretender que eso puede desaparecer detrás de un esperanto universal en el primer diseño llevó a una abstracción prematura: mucho vocabulario general, poca verdad operacional.

La alternativa V3 es más humilde y más fuerte: diseñar el sistema alrededor de un primer ERP real, pero impedir que sus cicatrices contaminen el Motor semántico. El Motor decide qué hacer. El integrador de Holded decide cómo expresarlo en Holded. El executor ejecuta. El SoR persiste. T3 calcifica patrones en el nivel correcto. T4 trae de vuelta señales estructuradas desde la realidad.

2. Las cinco reglas de frontera

V3 queda gobernado por cinco reglas que deben sobrevivir a cualquier fase de implementación:

Eliminar account_lines o declararlo sombra explícita. Intelia no mantiene una contabilidad paralela autoritativa. Puede conservar proyecciones, snapshots, índices, caches y trazas de decisión — pero no una segunda fuente de verdad contable. Si existe representación interna de líneas, debe estar marcada como no autoritativa, derivada, versionada y reconciliable contra el SoR.
Separar Facts por owner. Los hechos no son una bolsa común. V3 distingue cinco propietarios: extracted (OCR + LLM extractor), memory (histórico y preferencias del cliente), erp_snapshot (estado observado en Holded, no copiado como verdad), human_context (instrucciones, aprobaciones y correcciones previas) y runtime (fecha, equipo, periodo, moneda, feature flags). Cada hecho tiene propietario, frescura, procedencia y nivel de autoridad.
El Plan Store del integrador vive dentro del integrador. Las reglas calcificadas de traducción Holded son conocimiento operativo de cómo se hace algo en Holded, no semántica global. Sacarlas fuera del integrador recrearía el esperanto por la puerta de atrás.
Las guías Holded no razonan semánticamente. Una guía Holded dice cómo usar Holded, no qué decisión contable tomar. Puede explicar qué endpoint, qué campo, qué orden de operaciones, qué comentario insertar y qué workaround aplicar. No decide si un gasto es deducible, si corresponde 623 o 629, o si el IVA es soportado.
Las reglas calcificadas se tipan por nivel. Una regla semántica vive en el Motor. Una regla de traducción vive en el integrador. Una regla de UX vive en S1. Una regla de señal vive en T4/TX. Mezclar niveles produce velocidad inicial y deuda estructural inmediata.

Estas reglas son más importantes que cualquier servicio concreto. Si una implementación futura las rompe para ganar velocidad, probablemente vuelve a V2.

3. Mapa de capas

V3 se organiza en seis capas funcionales más una transversal. No todas tienen que ser servicios separados desde el día uno, pero sí deben tener contratos separados.

M1 — Motor

SoA portable

Facts (5 owners) + 3 LLMs + Internal Plan + Contextual + Validation

→

I1 — Integrador Holded

Conector + SoR pequeño propio

Plan Generator (agente) + Plan Store + Executor + Final Validation

T3 — Calcification

SoA + escritura SoR pequeño

candidate → shadow → active → quarantined → retired

↔

T4 — Reverse Sync

Conector + interpretación SoA

Polling Holded → Learning Signals tipadas

S1 — UX Híbrido

Surface

Dashboard Intelia (baja confianza) + Holded como surface (alta confianza)

⊕

TX — Signals + Temporal

Plumería transversal

Durabilidad · Bus de signals tipados · Idempotencia

3.1 M1 — Motor

Núcleo de decisión contable de Intelia. Consume hechos con procedencia clara, contexto de cliente, memoria operativa, histórico de decisiones, políticas contables y snapshots del ERP. Produce un Internal Plan: una intención contable semántica, no ejecutable directamente contra Holded.

El Motor no sabe qué endpoint de Holded se llama. No sabe qué campo concreto acepta decimales o qué objeto debe crearse antes de otro. Sí sabe que una factura de proveedor debe reconocerse como gasto, que requiere una cuenta contable, tratamiento fiscal, posible proyecto/coste, contrapartida, fecha de devengo, y que ciertas anomalías bloquean automatización.

La decisión del Motor se apoya en tres roles LLM:

LLM de interpretación documental: entiende documento, proveedor, concepto, importes, fechas, impuestos y señales textuales.
LLM de decisión contable: propone cuenta, tratamiento fiscal, imputación, regla contextual y confianza.
LLM crítico/validador: busca inconsistencias, riesgos, excepciones y razones para no automatizar.

Además, M1 incluye validación determinística previa y posterior: los LLMs no sustituyen invariantes (sumas, moneda, fechas, coherencia fiscal, compatibilidad con snapshots, límites de confianza, duplicados, restricciones de política).

Detalle completo en m1-motor.md

3.2 I1 — Integrador Holded

El mundo Holded. Recibe un Internal Plan y produce un ExecutionPlan Holded declarativo. Esta traducción no se implementa como una fase agnóstica de providers universales: la hace un agente LLM especializado en Holded con:

guías textuales de Holded (markdown editable, sin semántica fiscal);
wrapper de herramientas Holded (read estado, leer chart, leer locks);
snapshots relevantes del SoR;
Plan Store de patrones calcificados (cache + reglas promovidas);
capacidad de explicar por qué una operación se traduce de una forma concreta.

El agente genera, no ejecuta. La ejecución pertenece a un executor determinístico y aburrido. Este executor solo interpreta un ExecutionPlan ya validado, invoca operaciones permitidas, registra resultados, hace idempotencia y devuelve outcome.

I1 contiene también validación final: antes de escribir, revisa que el plan sea compatible con el estado actual del ERP; después de escribir, verifica que el SoR quedó como se esperaba o que existe una desviación trazable.

Detalle completo en i1-integrator-holded.md

3.3 T3 — Calcification Engine

T3 convierte repetición aprobada en velocidad. Cuando el sistema produce el mismo plan, o uno suficientemente equivalente, para inputs similares, y el contable aprueba durante un periodo de sombra, T3 promueve el patrón a regla calcificada.

La calcificación no es una cache. Es una promoción gobernada. Requiere:

equivalencia de inputs;
estabilidad de output;
aprobación humana;
ausencia de ediciones relevantes;
periodo de sombra contra el agente nuevo;
métrica de drift;
nivel correcto de regla (semántica, traducción, UX o señal).

Una regla atraviesa cinco estados de lifecycle:

candidate → shadow → active → quarantined → retired

Una vez active, la regla permite responder instantáneamente sin coste LLM para esa parte del pipeline. Pero nunca borra trazabilidad: cada aplicación de regla conserva versión, motivo, matching y posibilidad de invalidación.

Detalle completo en t3-calcification.md

3.4 T4 — Reverse Sync

T4 observa el SoR después de que Intelia escribe o propone. Su objetivo es aprender de la realidad operacional:

el contable editó un asiento;
añadió un comentario en Holded;
cambió una cuenta;
movió un documento;
ajustó IVA;
rechazó una automatización;
corrigió proveedor / proyecto / coste;
dejó una pista textual.

T4 no interpreta todo como verdad automática. Captura delta, lo atribuye, lo clasifica, lo contrasta con el plan original y produce señales estructuradas (Learning Signals). Algunas señales invalidan una regla calcificada. Otras recalibran histórico de proveedor. Otras son ruido o edición no semántica.

Sin T4, Intelia vuelve a depender de dashboards propios para saber si acertó. Con T4, Holded se convierte en interfaz de trabajo de alta confianza y fuente de feedback.

Detalle completo en t4-reverse-sync.md

3.5 S1 — UX Híbrido

La UX V3 tiene dos superficies:

Intelia Dashboard "Planes Pendientes" para baja confianza, onboarding, excepciones, edición asistida, aprobación explícita y explicación.
Holded para alta confianza y trabajo diario de contables maduros, con trazabilidad hacia Intelia mediante comentario, tag estructural o enlace al plan.

La transición no es binaria por cliente. Puede variar por proveedor, tipo de documento, regla, periodo, importe, confianza, antigüedad y estabilidad. Un cliente puede tener 90% auto-contabilizado en alquileres y 0% en gastos raros de importación.

Detalle completo en s1-ux-hybrid.md

3.6 TX — Signals + Temporal

TX es la capa transversal de orquestación, señales e historia operacional. Temporal no es el cerebro contable; es el mecanismo para ejecutar procesos durables, idempotentes, observables y recuperables.

TX coordina ingestión, ejecución de M1, generación y validación de ExecutionPlan, revisión humana cuando aplica, escritura en Holded, reverse sync, calcificación, reintentos, compensaciones y timeouts.

La señalización es first-class: cada decisión, validación, intervención humana, edición externa y aplicación de regla produce eventos consultables. V3 aprende porque conserva estructura, no porque guarde logs sueltos.

Detalle completo en tx-signals-temporal.md

4. Contratos principales

V3 evita contratos gigantes. Usa pocos artefactos conceptuales, cada uno con propietario claro.

4.1 Fact Bundle (input al Motor)

No es un modelo monolítico de "documento enriquecido". Es un paquete con secciones por owner:

Owner	Contenido
`extracted`	Datos extraídos del documento y pipeline OCR/LLM
`memory`	Conocimiento persistido del cliente, proveedor, histórico y preferencias
`erp_snapshot`	Estado observado en Holded, no copiado como verdad propia
`human_context`	Instrucciones explícitas, aprobaciones, comentarios y correcciones previas
`runtime`	Fecha, equipo, periodo, entorno, moneda, feature flags y límites operativos

Cada hecho debe poder decir: quién lo originó, cuándo, con qué confianza, desde qué documento o snapshot, y si es autoritativo, inferido o auxiliar.

4.2 Internal Plan (output del Motor)

Intención contable semántica, auditable y no ejecutable directamente. Incluye:

clasificación del documento o evento;
decisión contable propuesta (cuenta o familia de cuenta);
tratamiento fiscal;
imputaciones internas;
excepciones;
nivel de confianza;
razones y evidencias;
requisitos de revisión humana;
validaciones pasadas y fallidas;
constraints que el integrador debe respetar.

No incluye endpoints, IDs de operación Holded, secuencia exacta de API calls, workaround de contacto, payload final ni nombres de campos propios del ERP.

4.3 ExecutionPlan Holded (output del Integrador)

Declarativo pero específico de Holded. Describe qué operaciones se deben hacer en Holded y bajo qué precondiciones.

Debe incluir:

objetivo de negocio;
precondiciones observadas en Holded;
operaciones permitidas y ordenadas;
estrategia de idempotencia;
expected state final;
comentario / tag / enlace de trazabilidad;
validaciones antes y después;
fallback de bloqueo, no fallback silencioso;
explicación de traducción.

No es una lista libre de comandos inventados por el agente. Debe ajustarse a una gramática pequeña y versionada que el executor determinístico entienda.

4.4 Execution Outcome (output del Executor)

El Outcome cierra el ciclo de escritura. Contiene:

qué se intentó;
qué se ejecutó;
IDs del SoR;
estado final observado;
desviaciones;
validaciones finales;
señal para UX;
señal para T3;
señal para T4.

El Outcome es más importante que la respuesta de la API. Es la base para auditoría, aprendizaje e idempotencia.

4.5 Learning Signal (output de T4 y de S1)

Toda corrección humana o edición externa se convierte en señal estructurada cuando es posible:

tipo de señal;
nivel afectado (semántico / traducción / UX);
entidad afectada;
delta frente al plan original;
confianza de interpretación;
severidad;
recomendación: ignorar, revisar, invalidar, recalibrar, promover.

La Learning Signal no aplica cambios por sí sola. Los aplican componentes propietarios: Motor, Plan Store, T3, configuración de cliente o guía operativa.

5. Flujo end-to-end

5.1 Visualización del flujo

📥

Documento entra

email · upload · sincronización · ERP

↓

Construcción del Fact Bundle

extracted · memory · erp_snapshot · human_context · runtime

↓

Consulta T3 semántica

¿Regla calcificada activa para este input?

↘ miss ↙ hit

Motor de decisión

3 LLMs (intérprete · decisor · crítico) + validación determinista

→ Internal Plan

↓

Consulta T3 de traducción

¿Plan Holded calcificado para este Internal Plan?

↓

Plan Generator (agente LLM)

Planner + Tool Mapper + Critic · guías Holded · tool wrapper

→ ExecutionPlan Holded + score de confianza

↘ baja confianza ↙ alta confianza

Dashboard "Planes pendientes"

contable revisa → aprueba / edita / rechaza

Auto-ejecutar contra Holded

+ link al plan + tag estructural en Holded

↓

Executor + Final Validation

determinístico · captura readback · compara PlanState declarado vs observed

→ Execution Outcome

↓

Reverse Sync (ventana posterior)

polling Holded · captura ediciones del contable · interpreta comments con LLM

→ Learning Signal

↓

Aprendizaje

acumula evidencia · promueve / invalida / recalibra reglas (gate humano)

5.2 Detalle paso a paso

Ingestión y extracción. El documento entra por email, upload, sincronización o ERP. El pipeline produce hechos extraídos y evidencias.
Construcción del Fact Bundle. TX agrega memoria, snapshot ERP, human_context y runtime. Conserva owner y frescura por sección.
Consulta T3 semántica. Antes de invocar el Motor completo, busca regla calcificada semántica aplicable por proveedor, tipo de documento, concepto, importe, cliente, periodo y condiciones.
Decisión M1. Si no hay regla semántica suficiente, el Motor ejecuta sus tres roles LLM y validaciones para producir un Internal Plan.
Validación M1. Reglas determinísticas y LLM crítico deciden si el plan es auto-contabilizable, requiere revisión o debe bloquearse.
Consulta T3 de traducción Holded. El integrador busca si existe una traducción calcificada para Internal Plans equivalentes.
Plan Generator Holded. Si no hay traducción calcificada suficiente, el agente Holded (con 3 roles internos: Planner + Tool Mapper + Critic) genera un ExecutionPlan específico.
Validación I1. El integrador comprueba precondiciones, estado actual del SoR, permisos, campos obligatorios, idempotencia y expected state.
Routing UX. Según madurez, confianza y reglas, el plan pasa a Pending Plans o se ejecuta automáticamente.
Aprobación o edición humana. En Pending Plans, el contable puede aprobar, editar, rechazar o comentar. La edición produce señal inmediata.
Ejecución determinística. El executor aplica el plan en Holded sin razonar. Si algo se desvía, bloquea o escala.
Validación final. Se lee Holded y se verifica que el estado final coincide con el expected state.
Trazabilidad en Holded. El asiento/factura/documento queda con comentario, tag o link hacia Intelia Plan ID.
Outcome y señales. TX emite eventos para auditoría, UX, T3 y T4.
Reverse Sync. T4 sigue observando Holded durante una ventana posterior y captura ediciones o comentarios.
Aprendizaje. T3 decide promoción, invalidación o recalibración con intervención humana cuando toca.

Detalle importante: la aprobación humana puede ocurrir antes de escribir en Holded o después, dentro de Holded. V3 no fuerza una única superficie de control.

5.bis — Lifecycle de una regla calcificada (T3)

candidate

patrón observado, aún no fiable. Acumula evidencia. No se aplica nunca.

→

score ≥ 5 + Intelia ops aprueba

shadow

cada doc del patrón se procesa por ambos paths (agente + regla). Comparator estructural compara.

→

match ≥ 95% en N=15 ejecuciones

active

aplica en producción. Cada aplicación incrementa contadores. Instant + 0€ LLM.

↓

correction_rate alto · drift detectado por T4 · cambio sistémico

quarantined

dejó de ser fiable. NO aplica. Pendiente de revisión humana.

↓

decisión ops: sustituir o invalidar

retired

inválida o sustituida. NO se borra — queda en historial para auditoría.

5.ter — Evolución por madurez del cliente (matriz)

Fase	Volumen auto-Holded	UX dominante	Coste LLM/doc
Mes 0 (onboarding)	0-20%	Dashboard Intelia (revisa todo)	Alto · 100% por agente
Mes 1-3	30-50%	Mezcla	Medio · agente en ~50%
Mes 6	70-80%	Holded principal · Intelia ocasional	Bajo · agente en ~25%
Mes 12+	85-95%	Casi todo Holded	Marginal · agente solo en edge cases

Madurez no es un booleano de cliente. Es una matriz por isla (proveedor, tipo doc, importe, periodo). Un cliente puede tener 90% auto en alquileres y 0% en gastos raros de importación al mismo tiempo.

6. Evolución por madurez del cliente

V3 modela madurez como una matriz, no como un estado global. Un cliente puede tener 90% auto en alquileres y 0% en gastos raros de importación al mismo tiempo.

Mes 0: modo aprendizaje visible

En un cliente nuevo, casi todo pasa por Pending Plans. El sistema debe maximizar explicación y captura de correcciones:

mostrar Facts por owner;
explicar decisión semántica;
explicar traducción Holded;
permitir editar antes de escribir;
pedir motivo cuando la edición contradice una propuesta de alta confianza;
registrar patrones para T3;
mantener auto-ejecución desactivada salvo casos triviales.

El objetivo no es eficiencia inmediata. Es generar dataset del cliente y detectar diferencias de práctica contable.

Mes 1-3: automatización por islas

Empiezan a calcificarse patrones: proveedor recurrente, gasto simple, factura con estructura estable, misma cuenta y tratamiento fiscal, mismo flujo Holded, ausencia de ediciones.

La automatización se activa por isla, con shadow mode y comparación contra agente. Pending Plans se reduce para zonas estables, pero sigue siendo la interfaz de excepciones.

Mes 3-12: Holded como superficie principal para alta confianza

Cuando una isla alcanza estabilidad, Intelia puede escribir directamente en Holded. El contable trabaja en Holded y T4 observa:

si no edita, se refuerza la regla;
si edita, se genera señal;
si comenta, se interpreta;
si cambia patrón, se abre revisión.

La UX de Intelia se vuelve más de auditoría, cola de excepciones y explicación que de operación diaria.

Mes 12+: automatización mayoritaria y aprendizaje cruzado

Clientes maduros deberían tener 80-95% de documentos recurrentes auto-contabilizados, pero no por magia generalista. Lo logran por acumulación de reglas por cliente, proveedor, sector y tipo de documento.

El cross-bootstrap permite que un cliente nuevo de un sector arranque con reglas candidatas de otros clientes. Pero esas reglas no entran como verdad. Entran como:

sugerencias calcificadas heredadas;
menor umbral para shadow;
explicación de precedentes;
nunca auto-promoción sin validación local.

7. Posiciones de diseño

7.1 Plan Generator: agente único con 3 roles internos, no multi-agente

El Plan Generator de Holded se implementa conceptualmente como un agente único con tres roles internos, no como tres agentes independientes desde el principio:

Planner: traduce Internal Plan a intención Holded.
Tool Mapper: selecciona operaciones y datos concretos de Holded.
Critic: verifica precondiciones, idempotencia y expected state.

Separarlo físicamente en sub-agentes demasiado pronto aumentaría latencia y superficie de coordinación. Mantener roles internos permite prompts y evaluaciones diferenciadas sin multiplicar infraestructura. Si en producción aparecen errores sistemáticos de tool mapping o crítica débil, entonces sí merece extraerlos.

El executor debe permanecer completamente fuera del agente. Si el agente puede escribir, se rompe la frontera más valiosa de V3.

7.2 T3: lifecycle asíncrono Temporal, no lookup con side effects

T3 es un sistema asíncrono gobernado por Temporal. El lookup de reglas activas sí es sincrónico y barato, pero la promoción, shadow comparison, invalidación, análisis de drift y revisión ops viven en workflows durables:

una promoción puede tardar días;
necesita ventanas de observación;
depende de señales posteriores de T4;
puede requerir aprobación humana;
debe ser auditable.

T3 no debería ser una tabla rules con un contador. Eso produciría calcificación prematura. V3 necesita lifecycle explícito: candidate → shadow → active → quarantined → retired.

7.3 T4: feedback imperfecto clasificado, no conversación explícita

T4 trata Holded como una fuente de feedback imperfecta, no como conversación. Una edición en Holded puede significar:

Intelia se equivocó;
el contable aplicó criterio específico;
el cliente pidió algo excepcional;
el contable corrigió un dato externo;
hubo una limitación de Holded;
alguien tocó por accidente;
una regla fiscal cambió;
la propuesta era correcta pero incompleta.

Por eso T4 no debe auto-aplicar todo. Debe producir señales clasificadas con confianza. Las señales de alto impacto deben entrar en cola de revisión ops antes de modificar reglas activas.

Los comentarios de Holded son especialmente peligrosos: tienen mucha semántica y poca estructura. Se interpretan con LLM, pero la salida debe quedar tipada y revisable.

8. Diferencias frente al target V2 documentado

Dimensión

V2 Target (documentado)

Fase 6 Projection agnóstica

Presente con primitivas universales

Eliminada sin esperanto sin segundo ERP

Fase 7 Providers

Implícita

Reorganizada como I1 con Plan Generator LLM

Plan Generator

Determinista hand-coded

Agente LLM con 3 roles internos

Calcificación

Flag implícito confidence_calcified

T3 primera clase + lifecycle 5-states

Reverse-sync

Ausente

T4 primera clase

Cliente nuevo

Reglas uniformes hard-coded

Bootstrap cruzado por archetype

Frontera aprobación

Implícita en Holded

Híbrida dashboard + Holded por madurez

account_lines

SoR paralelo al ledger Holded

Eliminado o sombra explícita

Facts

Mezclados

5 owners tipados

Madurez del cliente

No modelada

Matriz por isla no estado global

La renuncia más importante: V3 no intenta demostrar desde el primer día que Intelia sirve para cualquier ERP. Intenta demostrar que Intelia puede decidir mejor que un humano promedio, operar con seguridad en un ERP real y aprender de correcciones. Si eso se logra, el segundo ERP se abstrae desde evidencia, no desde imaginación.

9. Trade-offs explícitos

9.1 Menos agnosticismo, más verdad operacional

V3 acepta acoplamiento explícito a Holded en I1. Eso reduce elegancia arquitectónica pero aumenta capacidad de entrega. El riesgo es que Holded contamine el Motor. La mitigación es contrato Internal Plan estricto y revisión de las 5 reglas de oro en cada PR relevante.

9.2 Más LLM donde hay ambigüedad, menos LLM donde hay ejecución

El LLM decide y genera planes. No ejecuta. Esto asume que el coste y variabilidad del LLM son aceptables antes de calcificar. T3 reduce coste con el tiempo. El executor determinístico reduce riesgo de acciones irreversibles.

9.3 Aprendizaje con gate humano

La calcificación gobernada será más lenta que auto-learning. Es intencional. En contabilidad, una regla equivocada aplicada mil veces no es una mejora de producto; es deuda operativa y riesgo de confianza.

9.4 Holded como UX madura

Usar Holded como superficie principal evita obligar al contable a duplicar trabajo en Intelia. Pero también reduce control visual sobre la experiencia. T4 y trazabilidad estructural (link + tag + comment) son el precio para que esta decisión sea viable.

9.5 Plan Store dentro del integrador

Esto protege niveles, pero puede duplicar mecánicas de reglas entre Motor (M1.RuleStore) e integrador (I1.PlanStore). La mitigación es T3 común como framework de ciclo de vida, con stores propietarios por nivel.

9.6 Latencia vs coste vs control

Surface	Latencia	Control del contable	Señal para T3
Holded auto (alta confianza)	Inmediato	Pasivo (reacciona si ve algo raro)	Inactividad N días o edición
Dashboard Intelia (baja confianza)	Espera al contable	Activo (aprueba o edita explícito)	Aprobación explícita

Auto es mejor UX a largo plazo; dashboard es mejor señal de aprendizaje. No hay versión perfecta — hay calibración constante del umbral de confianza.

10. Patologías estructurales — lo que puede salir mal

10.1 El Internal Plan se convierte en esperanto encubierto

Si el Internal Plan empieza a incluir primitivas ejecutables genéricas, V3 recrea el target V2. Mitigación: el Internal Plan debe describir intención y constraints, no operaciones. Cualquier campo que parezca POST_X o ENSURE_Y debe justificarse o moverse al integrador.

10.2 El integrador empieza a decidir semántica

El agente Holded puede sentirse tentado a corregir cuentas o tratamiento fiscal porque ve datos del ERP. Mitigación: guías Holded sin semántica, prompts con frontera explícita, validación que detecte cambios semánticos no autorizados, y tests de contrato.

10.3 T3 calcifica correlaciones falsas

Un proveedor puede parecer estable hasta que cambia el concepto. Mitigación: scopes estrechos, periodo de sombra, invalidación por T4, explicación de matching y umbrales conservadores al principio.

10.4 T4 genera demasiadas señales ruidosas

Si todo cambio en Holded se interpreta como aprendizaje, ops se satura. Mitigación: clasificación por severidad, ventanas de observación, deduplicación, sampling y colas separadas de "acción requerida" vs "telemetría".

10.5 La UX queda partida

Si algunas acciones se revisan en Intelia y otras en Holded sin trazabilidad clara, el contable pierde confianza. Mitigación: cada objeto escrito en Holded debe tener enlace/tag a Intelia, y Pending Plans debe mostrar qué pasó después.

10.6 Temporal se convierte en dominio

Temporal debe orquestar, no decidir. Mitigación: workflows finos en persistencia de estado operacional, actividades con servicios de dominio, señales tipadas y prohibición de lógica contable sustantiva en workflows.

11. Criterios de éxito

V3 debe medirse con métricas que reflejen la frontera:

porcentaje de documentos con Internal Plan válido;
porcentaje que requiere revisión humana;
tasa de edición post-write en Holded;
tasa de invalidación de reglas calcificadas;
tiempo hasta primera regla activa por cliente;
coste LLM por documento por madurez;
divergencia entre agente nuevo y reglas calcificadas;
tasa de errores de ejecución Holded;
calidad de señales T4 interpretadas;
porcentaje de decisiones bloqueadas correctamente.

La métrica central no es "auto-contabilización bruta". Es auto-contabilización estable sin corrección posterior relevante.

12. Diseño de implementación gradual

Aunque este documento es conceptual, la arquitectura sugiere un orden:

Formalizar Fact Bundle e Internal Plan sin tocar ejecución.
Encapsular ExecutionPlan Holded y executor determinístico. Sustituyen el actual erp_executor.py.
Insertar Pending Plans como punto de revisión del plan, no solo del resultado.
Añadir trazabilidad en Holded desde el primer write (link + tag + comment).
Implementar reverse-sync mínimo para detectar ediciones post-write.
Crear T3 como lifecycle de candidatos, no como auto-reglas.
Activar calcificaciones semánticas estrechas (proveedor + tipo simple).
Activar calcificaciones de traducción Holded.
Pasar islas maduras a auto-write.
Usar señales T4 para invalidación y recalibración.

El peligro sería empezar por la automatización final. La base real es la trazabilidad. Sin trazabilidad, no hay aprendizaje fiable.

13. Frase de frontera

El Motor decide. El integrador traduce. El executor ejecuta. El SoR persiste. T3 calcifica patrones por nivel. T4 devuelve señales estructuradas desde la realidad. S1 mueve al humano entre Intelia y Holded según confianza. TX hace que todo esto sea durable, observable e idempotente.

Apéndice — Cómo leer el resto de docs

Empieza por...	Si tu objetivo es...
`m1-motor.md`	Entender qué decide Intelia y cómo se separa de la integración
`i1-integrator-holded.md`	Entender cómo se gestiona la cicatriz Holded sin contaminar el SoA
`t3-calcification.md`	Entender el loop de aprendizaje y por qué es componente de primera clase
`t4-reverse-sync.md`	Entender cómo el SoA aprende del criterio del contable
`s1-ux-hybrid.md`	Entender el bootstrap híbrido (dashboard → Holded auto)
`tx-signals-temporal.md`	Entender la plumería durable y observable

Síntesis de las versiones paralelas de Claude (../v3-conceptual-claude/) y Codex (../v3-conceptual-codex/). Documentos individuales preservados para auditoría.