What makes diffray different from other AI code review tools?

diffray uses multi-agent intelligence instead of single-model AI. Multiple specialized agents work together - Security Agent, Performance Agent, Architecture Agent, and Consistency Agent - each expert in their domain. This coordinated approach reduces false positives by 87% and catches 3x more real bugs compared to traditional single-agent tools like GitHub Copilot or CodeRabbit.

How does multi-agent AI code review work?

Multi-agent AI code review deploys specialized agents that work in parallel, each focused on a specific domain: security vulnerabilities, performance bottlenecks, architectural patterns, and code consistency. Unlike single-model approaches that suffer from context dilution, each agent maintains deep expertise in its area. Research shows this approach improves bug detection by 3x while reducing noise.

Is diffray free for open source projects?

Yes, diffray is completely free forever for open source projects. We support the open source community with full access to our multi-agent code review platform, including all specialized agents, unlimited reviews, and priority support.

What programming languages does diffray support?

diffray supports all major programming languages including TypeScript, JavaScript, Python, Go, Rust, Java, C#, Ruby, PHP, and more. The multi-agent system is language-agnostic and adapts its analysis to language-specific patterns and best practices.

How does diffray integrate with GitHub?

diffray integrates seamlessly with GitHub through a GitHub App. Once installed, it automatically reviews every pull request, posting actionable comments directly on the PR. Setup takes less than 2 minutes with no configuration required. Enterprise teams can also use diffray CLI for local reviews before pushing code.

What is the difference between diffray and CodeRabbit or GitHub Copilot?

While CodeRabbit and GitHub Copilot use single-model AI that can hallucinate and produce false positives, diffray employs multi-agent intelligence where specialized agents cross-validate findings. This results in 87% fewer false positives. Additionally, diffray provides full codebase awareness, custom rule support, and agent memory that learns from your team's patterns.

Can diffray detect security vulnerabilities?

Yes, diffray's Security Agent is specifically trained to detect OWASP Top 10 vulnerabilities, injection attacks, authentication flaws, and sensitive data exposure. It analyzes code in context of your entire codebase, reducing false positives while catching real security issues that static analysis tools miss.

How much does diffray reduce code review time?

According to our customer data, teams using diffray reduce PR review time by 73% on average - from 45 minutes to 12 minutes per week. This is because diffray's multi-agent system produces 87% fewer false positives, so developers spend time on real issues instead of filtering noise.

What is the developer action rate on diffray comments?

diffray achieves a 98% developer action rate on its comments, compared to industry average of 15-20% for traditional AI code review tools. This high engagement is due to our multi-agent approach that eliminates noise and surfaces only actionable findings with confidence scores.

How does diffray handle duplicate comments?

diffray guarantees zero duplicate comments through its intelligent deduplication system. Unlike single-agent tools that often flag the same issue multiple times across a PR, diffray's agents coordinate to consolidate findings and present each issue exactly once with full context.

Does diffray store my code?

No, diffray never stores your source code. Code is processed in memory during the review and immediately discarded. We are SOC 2 compliant and your code is never used for AI training. Enterprise customers can also use our on-premise deployment option for complete data sovereignty.

How does diffray compare to GitHub Copilot code review?

While GitHub Copilot uses a single AI model for code review, diffray employs specialized multi-agent intelligence. Research shows multi-agent systems catch 3x more real bugs while producing 87% fewer false positives. diffray also provides full codebase awareness, custom rules, and agent memory - features not available in Copilot's code review.

Diluição de Contexto: Mais Tokens, Pior AI

Pesquisas de Stanford, Google, Anthropic e Meta revelam que Grandes Modelos de Linguagem sofrem degradação previsível de performance quando janelas de contexto contêm muita informação. Este fenômeno, conhecido como diluição de contexto, faz com que modelos "percam" informações críticas enterradas em prompts longos, com quedas de precisão de 13,9% a 85% conforme o contexto cresce—mesmo quando o modelo tem acesso perfeito aos dados relevantes.

13,9-85%

Queda de precisão com aumento do contexto

20+ pts

Queda de performance quando info está no meio

49-67%

Redução de falhas com recuperação contextual

O Fenômeno "Lost in the Middle": Por Que a Posição Importa

O artigo seminal de 2023 "Lost in the Middle: How Language Models Use Long Contexts" de pesquisadores de Stanford e Meta AI estabeleceu o entendimento fundamental da diluição de contexto. Testando modelos incluindo GPT-3.5-Turbo, Claude-1.3 e LongChat em tarefas de QA multi-documento, os pesquisadores descobriram uma impressionante curva de performance em U: LLMs performam melhor quando informação relevante aparece no início ou fim do contexto, mas a precisão despenca quando detalhes críticos estão enterrados no meio.

Curva de Performance em U

Início

25%

Meio

75%

Fim

Precisão do modelo pela posição da informação relevante no contexto

A degradação é substancial. A performance cai mais de 20 pontos percentuais quando informação relevante se move das bordas do contexto para posições centrais. Em uma descoberta impressionante, a precisão do GPT-3.5-Turbo em QA multi-documento caiu abaixo de sua performance sem contexto quando informação relevante foi colocada no meio do contexto com 20 documentos presentes.

Sumidouros de Atenção e Diluição: Limites Arquitetônicos Fundamentais

Pesquisadores do MIT e Meta AI descobriram outra peça do quebra-cabeça em seu artigo ICLR 2024 "Efficient Streaming Language Models with Attention Sinks" . Eles descobriram que tokens iniciais recebem scores de atenção desproporcionalmente altos mesmo quando semanticamente sem importância—um fenômeno que chamaram de sumidouros de atenção.

Por Que a Diluição de Atenção Acontece

Softmax força atenção a somar 1

Adicionar mais tokens significa que cada token recebe menos atenção em média

Sumidouros de atenção absorvem excesso de atenção

Primeiros tokens se tornam "lixeiras" independente da relevância

Tokens irrelevantes roubam atenção dos relevantes

Cada documento adicional degrada progressivamente a qualidade do sinal

Benchmarks Empíricos Quantificam a Queda de Performance

O benchmark RULER da NVIDIA , publicado em abril de 2024, revela que comprimentos de contexto declarados excedem muito os comprimentos de contexto efetivos:

Modelo	Contexto Declarado	Contexto Efetivo	Degradação (4K→128K)
GPT-4	128K	64K	-15,4 pontos
Yi-34B	200K	32K	-16,0 pontos
Mistral 7B	32K	16K	-79,8 pontos
Mixtral 8x7B	32K	32K	-50,4 pontos

Comprimento do Contexto Prejudica Performance Mesmo com Recuperação Perfeita

Um artigo arXiv de outubro de 2025, "Context Length Alone Hurts LLM Performance Despite Perfect Retrieval" , entregou a descoberta mais contra-intuitiva. Mesmo com recuperação 100% perfeita de informação relevante, a performance degrada de 13,9% a 85% conforme o comprimento de entrada aumenta.

Descoberta Crítica

Esta descoberta sugere que diluição de contexto não é puramente um problema de atenção ou recuperação—o mero comprimento do contexto impõe um imposto cognitivo em LLMs independente da qualidade do conteúdo.

Curadoria Estratégica de Contexto Melhora Dramaticamente a Precisão

A pesquisa mostra consistentemente que contexto relevante supera quantidade bruta de contexto. O artigo "Contextual Retrieval" da Anthropic de setembro de 2024 demonstrou que adicionar apenas 50-100 tokens de contexto explicativo específico do chunk reduz falhas de recuperação em 49%. Combinado com reranking, falhas caíram 67%.

Limiares de Performance por Modelo

Llama-3.1-405Bapós 32K tokens
GPT-4-turboapós 16K tokens
Claude-3-sonnetapós 16K tokens

Fonte: Databricks Mosaic Research

Benefícios da Compressão

Compressão LLMLinguaaté 20x
Perda de raciocínioapenas 1,5 pontos
Aceleração de inferência1,7-5,7x mais rápido

Fonte: Microsoft Research LLMLingua

Como diffray Resolve Diluição de Contexto com Arquitetura Multi-Agente

Diluição de contexto representa uma limitação fundamental das arquiteturas transformer atuais. O caminho a seguir não é maximizar contexto—é otimizar relevância.

A Abordagem Multi-Agente da diffray

Em vez de despejar tudo em uma única janela de contexto, diffray distribui a revisão entre 10 agentes especializados—cada um com contexto precisamente curado para seu domínio.

Problema do Agente Único

• Todo código em uma janela de contexto
• Info crítica de segurança perdida no meio
• Atenção diluída entre código não relacionado
• Performance degrada com tamanho do repo

Solução Multi-Agente

• Agente de segurança recebe só contexto relevante
• Agente de performance vê benchmarks e hot paths
• Contexto de cada agente fica dentro dos limites efetivos
• Escala para qualquer tamanho de repositório

Ao dar a cada agente contexto focado e curado abaixo de 25K tokens, ficamos bem dentro da janela de performance efetiva—enquanto revisamos o PR completo de forma abrangente.

Conheça Nossos Agentes Agente Único vs Multi-Agente

Fontes de Pesquisa Principais

Artigos Fundamentais

Benchmarks e Estudos

Publicações de Labs de IA

Experimente Code Review Consciente do Contexto

Veja como a arquitetura multi-agente da diffray aplica essas descobertas de pesquisa para entregar feedback de code review acionável sem diluição de contexto.

Comece Seu Teste Gratuito Ler Documentação

Diluição de Contexto: Por Que Mais Tokens
Podem Significar Pior Performance de IA

O Fenômeno "Lost in the Middle": Por Que a Posição Importa

Curva de Performance em U

Sumidouros de Atenção e Diluição: Limites Arquitetônicos Fundamentais

Por Que a Diluição de Atenção Acontece

Benchmarks Empíricos Quantificam a Queda de Performance

Comprimento do Contexto Prejudica Performance Mesmo com Recuperação Perfeita

Descoberta Crítica

Curadoria Estratégica de Contexto Melhora Dramaticamente a Precisão

Limiares de Performance por Modelo

Benefícios da Compressão

Como diffray Resolve Diluição de Contexto com Arquitetura Multi-Agente

A Abordagem Multi-Agente da diffray

Problema do Agente Único

Solução Multi-Agente

Fontes de Pesquisa Principais

Artigos Fundamentais

Benchmarks e Estudos

Publicações de Labs de IA

Experimente Code Review Consciente do Contexto

Artigos Relacionados

Why Noisy AI Code Review Tools Deliver Negative ROI

Context Awareness in AI Code Review: How Intelligent Systems Understand Your Codebase

Introducing Agent Store: Create, Share, and Discover Custom AI Agents

AI Code Review Playbook

Diluição de Contexto: Por Que Mais TokensPodem Significar Pior Performance de IA

O Fenômeno "Lost in the Middle": Por Que a Posição Importa

Curva de Performance em U

Sumidouros de Atenção e Diluição: Limites Arquitetônicos Fundamentais

Por Que a Diluição de Atenção Acontece

Benchmarks Empíricos Quantificam a Queda de Performance

Comprimento do Contexto Prejudica Performance Mesmo com Recuperação Perfeita

Descoberta Crítica

Curadoria Estratégica de Contexto Melhora Dramaticamente a Precisão

Limiares de Performance por Modelo

Benefícios da Compressão

Como diffray Resolve Diluição de Contexto com Arquitetura Multi-Agente

A Abordagem Multi-Agente da diffray

Problema do Agente Único

Solução Multi-Agente

Fontes de Pesquisa Principais

Artigos Fundamentais

Benchmarks e Estudos

Publicações de Labs de IA

Experimente Code Review Consciente do Contexto

Artigos Relacionados

Why Noisy AI Code Review Tools Deliver Negative ROI

Context Awareness in AI Code Review: How Intelligent Systems Understand Your Codebase

Introducing Agent Store: Create, Share, and Discover Custom AI Agents

AI Code Review Playbook

Diluição de Contexto: Por Que Mais Tokens
Podem Significar Pior Performance de IA