Arquitectura Multi-Agente

¿Por Qué
Múltiples Agentes?

La mayoría de las herramientas de revisión de código con IA envían tu código a un LLM con "revisa esto" y esperan lo mejor. diffray usa agentes especializados que investigan, verifican y validan — como un equipo de revisores expertos.

Pregunta Justa

"¿No Puede Un Solo Prompt Hacer Esto?"

"Si los LLMs modernos pueden manejar 200k tokens, ¿por qué no simplemente enviar el diff con el contexto relevante y dejar que el modelo lo resuelva? ¿Cuál es el punto de toda esta complejidad de agentes?"

El Problema Fundamental: Tu Base de Código No Cabe

Un prompt solo puede ver lo que le envías. Para una revisión de código significativa, necesitas contexto de toda tu base de código — imports, dependencias, archivos relacionados, tests, convenciones.

Base de código promedio: 100k-500k+ líneas
Ventana de contexto LLM: ~200k tokens máx
Techo de rendimiento práctico: ~25-30k tokens

Incluso Si Cupiera — No Funcionaría

La investigación demuestra que volcar más contexto en los LLMs perjudica activamente el rendimiento. Esto se llama "dilución de contexto."

10-20%

caída de rendimiento por demasiados documentos

Curva U

la info en el medio se "pierde"

60-80%

tasa de falsos positivos en herramientas de volcado de contexto

Lee la investigación: Por Qué el Contexto Curado Supera al Volumen de Contexto →

Lo Que los Agentes Realmente Proporcionan

Los agentes no solo "leen prompts mejor." Ellos investigan activamente tu base de código:

Recuperación Selectiva de Contexto

Obtienen solo archivos relevantes bajo demanda, no vuelcan todo de antemano

Verificación de Hipótesis

"Sospecho un desajuste de tipos" → buscar llamadores → confirmar con análisis estático

Investigación Iterativa

Siguen pistas entre archivos, profundizan cuando algo parece sospechoso

Integración de Herramientas

Ejecutan linters, verificadores de tipos y analizadores para verificar hallazgos con datos reales

Un prompt ve lo que le das.

Un agente encuentra lo que necesita.

Precisión Sobre Volumen

Gestión de Contexto Curado

La diferencia entre una revisión útil y ruido no es cuánto contexto tienes — es tener el contexto correcto

Cómo diffray Cura el Contexto

Análisis del Grafo de Dependencias

Antes de que comience la revisión, construimos un mapa de cómo se conectan los archivos — imports, exports, definiciones de tipos y cadenas de llamadas

Filtrado Inteligente

Cada agente recibe solo el contexto relevante para su tarea — el agente de seguridad obtiene flujos de autenticación, no estilos de UI

Recuperación Bajo Demanda

Los agentes obtienen contexto adicional solo cuando es necesario — siguiendo pistas sin sobrecarga inicial

Contexto en Capas

El contexto central (diff, tipos) permanece residente; el contexto circundante (llamadores, tests) se carga según sea necesario

Enfoque de Volcado de Contexto

200k tokens de todo — diff, archivos completos, dependencias aleatorias...

La señal se ahoga en el ruido
Detalles importantes en el "medio perdido"
Atención dispersa en código irrelevante

Enfoque de Contexto Curado

Fragmentos enfocados — diff + dependencias directas + patrones relevantes

Cada token tiene un propósito
La info crítica permanece en foco
Atención completa en lo que importa
Aprende más sobre nuestros motores de IA →

El Problema de "Solo Pregúntale al LLM"

Una sola llamada LLM revisando código tiene limitaciones fundamentales

Llamada LLM Única
Solo ve lo que envías

Limitado al diff que proporcionas

Generación de un solo intento

Sin iteración ni verificación

No puede seguir imports

Ciego a dependencias y contexto

Alucinaciones sin verificar

Sin forma de validar afirmaciones

Ventana de contexto fija

Atención dispersa en todas las preocupaciones

Consejos genéricos

"Asegúrate de actualizar los llamadores"

Sistema Basado en Agentes
Explora la base de código autónomamente

Navega todo tu proyecto

Análisis iterativo

Sigue pistas, profundiza

Navega la estructura del proyecto

Entiende imports y dependencias

Valida con herramientas reales

Ejecuta analizadores estáticos para confirmar

Atención enfocada

Cada agente se especializa en un área

Hallazgos específicos

"3 sitios de llamada tienen desajustes de tipos en líneas 45, 89, 112"

La diferencia está entre especulación e investigación.

¿Qué Hace Diferente a un Agente?

Un agente es un sistema de IA que puede pensar, actuar y verificar

Usar Herramientas

Leer archivos, buscar código, ejecutar analizadores estáticos

Tomar Decisiones

Elegir qué investigar basándose en hallazgos

Iterar

Seguir pistas, verificar hipótesis, profundizar

Auto-Corregirse

Validar razonamiento contra datos reales

Lo Que los Agentes de diffray Realmente Hacen

Cuando diffray revisa tu PR, los agentes no solo "miran el diff"

Rastrear Dependencias

Siguen imports para entender cómo el código modificado afecta a todo el sistema

Verificar Archivos Relacionados

Examinan tests, configuraciones y documentación para contexto

Verificar Suposiciones

Ejecutan análisis estático para confirmar que los problemas sospechados realmente existen

Referencias Cruzadas

Buscan definiciones de tipos, contratos de API y convenciones

Ejemplo Real

Considera un cambio de firma de función en un PR:

Enfoque LLM único

"Esto cambia el tipo de retorno, asegúrate de actualizar los llamadores"

Consejo genérico. Sin especificaciones.

Enfoque de agente
  1. Busca todos los usos de esta función
  2. Identifica 3 sitios de llamada con desajustes de tipos
  3. Verifica si los tests cubren estos escenarios
  4. Reporta archivos específicos y números de línea

→ "Encontrados 3 cambios incompatibles: src/api/users.ts:45, src/hooks/useAuth.ts:89, src/utils/validate.ts:112"

Conciencia Completa de la Base de Código

El Diff No Es Suficiente

Para entender verdaderamente los cambios, necesitas ver cómo encajan en toda la base de código

Lo que ve una revisión solo-diff

Nueva función formatUserName() añadida

Parece sintácticamente correcto

Sin bugs obvios en estas 20 líneas

Veredicto: "LGTM" — pero perdiendo completamente el panorama general

Lo que ve un agente consciente de la base de código

Esta función duplica utils/names.ts:formatName()

La función existente maneja casos límite que esta no

3 otros archivos ya usan la utilidad existente

Esto rompe la convención de nombres en /docs/CONVENTIONS.md

Veredicto: "Considera usar formatName() existente de utils/names.ts"

Lo que los agentes de diffray verifican más allá del diff:

Detección de Duplicados

¿El desarrollador está reinventando la rueda? ¿Ya existe una solución similar en la base de código?

Consistencia de Patrones

¿Estos cambios siguen patrones establecidos? ¿O introducen un enfoque conflictivo?

Análisis de Impacto

¿Cómo afectan estos cambios al resto del sistema? ¿Qué depende del código modificado?

Adherencia a Convenciones

¿Se están siguiendo las convenciones del equipo y los estándares documentados?

Un diff te muestra qué cambió. El contexto completo de la base de código te muestra si debería haberlo hecho.

El Problema de la Dilución de Contexto

Un solo LLM revisando todos los aspectos del código simultáneamente enfrenta un problema fundamental: dilución de contexto.

Mientras intenta verificar seguridad, rendimiento, bugs y estilo todo a la vez, su atención se dispersa. Cuantas más preocupaciones maneja, más probable es que pierda problemas.

La solución de diffray: Agentes especializados, cada uno con su propio enfoque estrecho. Como tener un equipo de especialistas vs. un generalista intentando hacer todo.

Cada Agente:

Contexto Curado

Comienza con contexto enfocado y recopilado con precisión — solo los archivos, dependencias y patrones relevantes para su tarea específica

Permanece Enfocado

Un trabajo, hecho a fondo — el agente de seguridad solo busca vulnerabilidades, nunca se desvía al estilo

Profundiza

Puede dedicar todo el contexto a su especialidad — sin dividir atención entre 10 preocupaciones diferentes

Nunca Olvida

No pierde el hilo durante la revisión — cada regla, cada verificación, cada vez, sin excepción

Nunca Se Cansa

El PR número 50 del día recibe la misma atención que el primero — sin fatiga, sin prisas, sin atajos

9 Agentes Especializados

Conoce al Equipo de Revisión

Seguridad, Rendimiento, Bugs, Arquitectura, Testing y más — cada agente aporta experiencia profunda a su dominio. Ve exactamente qué hace cada uno.

Los Motores Detrás de diffray

Fundamentos poderosos que permiten la verdadera colaboración multi-agente

Motor Central

  • Últimos modelos de Anthropic (Haiku, Sonnet, Opus)
  • Selección de modelo adaptada a la tarea
  • Búsqueda inteligente de archivos
  • Gestión de tareas integrada

Motor de Herramientas

  • Integración de analizadores estáticos
  • Verificación de hipótesis
  • Salida concreta de herramientas
  • Falsos positivos drásticamente reducidos

Arquitectura Multi-Agente

  • Ejecución paralela de agentes
  • Contexto de base de código compartido
  • Deduplicación de hallazgos
  • Validación cruzada entre agentes

El Pipeline de Revisión por Fases

Cada revisión pasa por un pipeline multi-fase, cada fase optimizada para su propósito

1

Clonar

Obtener repo y checkout del PR

2

Preparar Datos

Construir grafo de dependencias

3

Resumir

LLM resume los cambios

4

Triaje

Enrutar archivos a agentes

5

Reglas

Cargar y filtrar reglas

6

Revisar

Análisis paralelo de agentes

7

Deduplicar

Fusionar y recalificar

8

Validar

Verificar y recalificar

9

Reportar

Generar comentarios de PR

El Resultado

Un sistema multi-agente que combina razonamiento de IA con análisis concreto de código — entregando hallazgos precisos y verificados en lugar de especulación.

Recurso Gratuito

Playbook de Revisión de Código con IA

Insights basados en datos de más de 50 fuentes de investigación. Por qué los desarrolladores dedican 5-6 horas semanales a revisión, por qué el código generado por IA necesita más escrutinio, y cómo implementar herramientas de IA en las que los desarrolladores realmente confían.

Experimenta la Diferencia
que Hacen los Agentes

Ve cómo la investigación supera a la especulación. Prueba diffray gratis en tu próximo PR.

14 días de prueba gratis
Sin tarjeta de crédito
Configuración en 2 minutos