What makes diffray different from other AI code review tools?

diffray uses multi-agent intelligence instead of single-model AI. Multiple specialized agents work together - Security Agent, Performance Agent, Architecture Agent, and Consistency Agent - each expert in their domain. This coordinated approach reduces false positives by 87% and catches 3x more real bugs compared to traditional single-agent tools like GitHub Copilot or CodeRabbit.

How does multi-agent AI code review work?

Multi-agent AI code review deploys specialized agents that work in parallel, each focused on a specific domain: security vulnerabilities, performance bottlenecks, architectural patterns, and code consistency. Unlike single-model approaches that suffer from context dilution, each agent maintains deep expertise in its area. Research shows this approach improves bug detection by 3x while reducing noise.

Is diffray free for open source projects?

Yes, diffray is completely free forever for open source projects. We support the open source community with full access to our multi-agent code review platform, including all specialized agents, unlimited reviews, and priority support.

What programming languages does diffray support?

diffray supports all major programming languages including TypeScript, JavaScript, Python, Go, Rust, Java, C#, Ruby, PHP, and more. The multi-agent system is language-agnostic and adapts its analysis to language-specific patterns and best practices.

How does diffray integrate with GitHub?

diffray integrates seamlessly with GitHub through a GitHub App. Once installed, it automatically reviews every pull request, posting actionable comments directly on the PR. Setup takes less than 2 minutes with no configuration required. Enterprise teams can also use diffray CLI for local reviews before pushing code.

What is the difference between diffray and CodeRabbit or GitHub Copilot?

While CodeRabbit and GitHub Copilot use single-model AI that can hallucinate and produce false positives, diffray employs multi-agent intelligence where specialized agents cross-validate findings. This results in 87% fewer false positives. Additionally, diffray provides full codebase awareness, custom rule support, and agent memory that learns from your team's patterns.

Can diffray detect security vulnerabilities?

Yes, diffray's Security Agent is specifically trained to detect OWASP Top 10 vulnerabilities, injection attacks, authentication flaws, and sensitive data exposure. It analyzes code in context of your entire codebase, reducing false positives while catching real security issues that static analysis tools miss.

How much does diffray reduce code review time?

According to our customer data, teams using diffray reduce PR review time by 73% on average - from 45 minutes to 12 minutes per week. This is because diffray's multi-agent system produces 87% fewer false positives, so developers spend time on real issues instead of filtering noise.

What is the developer action rate on diffray comments?

diffray achieves a 98% developer action rate on its comments, compared to industry average of 15-20% for traditional AI code review tools. This high engagement is due to our multi-agent approach that eliminates noise and surfaces only actionable findings with confidence scores.

How does diffray handle duplicate comments?

diffray guarantees zero duplicate comments through its intelligent deduplication system. Unlike single-agent tools that often flag the same issue multiple times across a PR, diffray's agents coordinate to consolidate findings and present each issue exactly once with full context.

Does diffray store my code?

No, diffray never stores your source code. Code is processed in memory during the review and immediately discarded. We are SOC 2 compliant and your code is never used for AI training. Enterprise customers can also use our on-premise deployment option for complete data sovereignty.

How does diffray compare to GitHub Copilot code review?

While GitHub Copilot uses a single AI model for code review, diffray employs specialized multi-agent intelligence. Research shows multi-agent systems catch 3x more real bugs while producing 87% fewer false positives. diffray also provides full codebase awareness, custom rules, and agent memory - features not available in Copilot's code review.

Dilution du Contexte: Plus de Tokens, Pire IA

Les recherches de Stanford, Google, Anthropic et Meta révèlent que les Grands Modèles de Langage subissent une dégradation prévisible des performances lorsque les fenêtres de contexte contiennent trop d'informations. Ce phénomène, connu sous le nom de dilution du contexte, amène les modèles à "perdre" des informations critiques enfouies dans de longs prompts, avec des baisses de précision de 13,9% à 85% à mesure que le contexte augmente—même lorsque le modèle a un accès parfait aux données pertinentes.

13,9-85%

Baisse de précision avec l'augmentation du contexte

20+ pts

Baisse de performance quand l'info est au milieu

49-67%

Réduction des échecs avec récupération contextuelle

Le Phénomène "Lost in the Middle" : Pourquoi la Position Compte

L'article fondateur de 2023 "Lost in the Middle: How Language Models Use Long Contexts" des chercheurs de Stanford et Meta AI a établi la compréhension fondamentale de la dilution du contexte. En testant des modèles incluant GPT-3.5-Turbo, Claude-1.3 et LongChat sur des tâches de QA multi-documents, les chercheurs ont découvert une courbe de performance en U frappante : les LLMs performent mieux quand l'information pertinente apparaît au début ou à la fin du contexte, mais la précision s'effondre quand les détails critiques sont enfouis au milieu.

Courbe de Performance en U

Début

25%

Milieu

75%

Fin

Précision du modèle selon la position de l'information pertinente dans le contexte

La dégradation est substantielle. La performance chute de plus de 20 points de pourcentage lorsque l'information pertinente passe des bords du contexte aux positions centrales. Dans une découverte frappante, la précision de GPT-3.5-Turbo sur le QA multi-documents est tombée en dessous de sa performance sans contexte lorsque l'information pertinente était placée au milieu du contexte avec 20 documents présents.

Puits d'Attention et Dilution : Limites Architecturales Fondamentales

Les chercheurs du MIT et de Meta AI ont découvert une autre pièce du puzzle dans leur article ICLR 2024 "Efficient Streaming Language Models with Attention Sinks" . Ils ont découvert que les tokens initiaux reçoivent des scores d'attention disproportionnellement élevés même lorsqu'ils sont sémantiquement sans importance—un phénomène qu'ils ont appelé puits d'attention.

Pourquoi la Dilution de l'Attention Se Produit

Softmax force l'attention à sommer à 1

Ajouter plus de tokens signifie que chaque token reçoit moins d'attention en moyenne

Les puits d'attention absorbent l'attention excédentaire

Les premiers tokens deviennent des "déversoirs" indépendamment de leur pertinence

Les tokens non pertinents volent l'attention des pertinents

Chaque document supplémentaire dégrade progressivement la qualité du signal

Les Benchmarks Empiriques Quantifient la Chute de Performance

Le benchmark RULER de NVIDIA , publié en avril 2024, révèle que les longueurs de contexte annoncées dépassent largement les longueurs de contexte effectives :

Modèle	Contexte Annoncé	Contexte Effectif	Dégradation (4K→128K)
GPT-4	128K	64K	-15,4 points
Yi-34B	200K	32K	-16,0 points
Mistral 7B	32K	16K	-79,8 points
Mixtral 8x7B	32K	32K	-50,4 points

La Longueur du Contexte Nuit aux Performances Même avec une Récupération Parfaite

Un article arXiv d'octobre 2025, "Context Length Alone Hurts LLM Performance Despite Perfect Retrieval" , a livré la découverte la plus contre-intuitive. Même avec une récupération 100% parfaite de l'information pertinente, la performance se dégrade de 13,9% à 85% à mesure que la longueur d'entrée augmente.

Découverte Critique

Cette découverte suggère que la dilution du contexte n'est pas purement un problème d'attention ou de récupération—la seule longueur du contexte impose une taxe cognitive aux LLMs indépendamment de la qualité du contenu.

La Curation Stratégique du Contexte Améliore Dramatiquement la Précision

La recherche montre systématiquement que le contexte pertinent surpasse la quantité brute de contexte. L'article "Contextual Retrieval" d'Anthropic de septembre 2024 a démontré que l'ajout de seulement 50-100 tokens de contexte explicatif spécifique au chunk réduit les échecs de récupération de 49%. Combiné avec le reranking, les échecs ont chuté de 67%.

Seuils de Performance par Modèle

Llama-3.1-405Baprès 32K tokens
GPT-4-turboaprès 16K tokens
Claude-3-sonnetaprès 16K tokens

Source : Databricks Mosaic Research

Avantages de la Compression

Compression LLMLinguajusqu'à 20x
Perte de raisonnementseulement 1,5 points
Accélération d'inférence1,7-5,7x plus rapide

Source : Microsoft Research LLMLingua

Comment diffray Résout la Dilution du Contexte avec l'Architecture Multi-Agent

La dilution du contexte représente une limitation fondamentale des architectures transformer actuelles. La voie à suivre n'est pas de maximiser le contexte—c'est d'optimiser la pertinence.

L'Approche Multi-Agent de diffray

Au lieu de tout déverser dans une seule fenêtre de contexte, diffray distribue la revue sur 10 agents spécialisés—chacun avec un contexte précisément curé pour son domaine.

Problème de l'Agent Unique

• Tout le code dans une fenêtre de contexte
• Info critique de sécurité perdue au milieu
• Attention diluée sur du code non lié
• Performance se dégrade avec la taille du repo

Solution Multi-Agent

• L'agent sécurité reçoit seulement le contexte pertinent
• L'agent performance voit benchmarks et hot paths
• Le contexte de chaque agent reste dans les limites effectives
• S'adapte à n'importe quelle taille de repository

En donnant à chaque agent un contexte focalisé et curé sous 25K tokens, nous restons bien dans la fenêtre de performance effective—tout en revoyant le PR complet de manière exhaustive.

Découvrir Nos Agents Agent Unique vs Multi-Agent

Sources de Recherche Clés

Articles Fondateurs

Benchmarks et Études

Publications des Labs IA

Découvrez la Revue de Code Consciente du Contexte

Voyez comment l'architecture multi-agent de diffray applique ces découvertes de recherche pour livrer des retours de revue de code actionnables sans dilution du contexte.

Commencer l'Essai Gratuit Lire la Documentation

Dilution du Contexte : Pourquoi Plus de Tokens
Peut Signifier Moins de Performance IA

Le Phénomène "Lost in the Middle" : Pourquoi la Position Compte

Courbe de Performance en U

Puits d'Attention et Dilution : Limites Architecturales Fondamentales

Pourquoi la Dilution de l'Attention Se Produit

Les Benchmarks Empiriques Quantifient la Chute de Performance

La Longueur du Contexte Nuit aux Performances Même avec une Récupération Parfaite

Découverte Critique

La Curation Stratégique du Contexte Améliore Dramatiquement la Précision

Seuils de Performance par Modèle

Avantages de la Compression

Comment diffray Résout la Dilution du Contexte avec l'Architecture Multi-Agent

L'Approche Multi-Agent de diffray

Problème de l'Agent Unique

Solution Multi-Agent

Sources de Recherche Clés

Articles Fondateurs

Benchmarks et Études

Publications des Labs IA

Découvrez la Revue de Code Consciente du Contexte

Articles Connexes

Why Noisy AI Code Review Tools Deliver Negative ROI

Context Awareness in AI Code Review: How Intelligent Systems Understand Your Codebase

Introducing Agent Store: Create, Share, and Discover Custom AI Agents

AI Code Review Playbook

Dilution du Contexte : Pourquoi Plus de TokensPeut Signifier Moins de Performance IA

Le Phénomène "Lost in the Middle" : Pourquoi la Position Compte

Courbe de Performance en U

Puits d'Attention et Dilution : Limites Architecturales Fondamentales

Pourquoi la Dilution de l'Attention Se Produit

Les Benchmarks Empiriques Quantifient la Chute de Performance

La Longueur du Contexte Nuit aux Performances Même avec une Récupération Parfaite

Découverte Critique

La Curation Stratégique du Contexte Améliore Dramatiquement la Précision

Seuils de Performance par Modèle

Avantages de la Compression

Comment diffray Résout la Dilution du Contexte avec l'Architecture Multi-Agent

L'Approche Multi-Agent de diffray

Problème de l'Agent Unique

Solution Multi-Agent

Sources de Recherche Clés

Articles Fondateurs

Benchmarks et Études

Publications des Labs IA

Découvrez la Revue de Code Consciente du Contexte

Articles Connexes

Why Noisy AI Code Review Tools Deliver Negative ROI

Context Awareness in AI Code Review: How Intelligent Systems Understand Your Codebase

Introducing Agent Store: Create, Share, and Discover Custom AI Agents

AI Code Review Playbook

Dilution du Contexte : Pourquoi Plus de Tokens
Peut Signifier Moins de Performance IA