What makes diffray different from other AI code review tools?

diffray uses multi-agent intelligence instead of single-model AI. Multiple specialized agents work together - Security Agent, Performance Agent, Architecture Agent, and Consistency Agent - each expert in their domain. This coordinated approach reduces false positives by 87% and catches 3x more real bugs compared to traditional single-agent tools like GitHub Copilot or CodeRabbit.

How does multi-agent AI code review work?

Multi-agent AI code review deploys specialized agents that work in parallel, each focused on a specific domain: security vulnerabilities, performance bottlenecks, architectural patterns, and code consistency. Unlike single-model approaches that suffer from context dilution, each agent maintains deep expertise in its area. Research shows this approach improves bug detection by 3x while reducing noise.

Is diffray free for open source projects?

Yes, diffray is completely free forever for open source projects. We support the open source community with full access to our multi-agent code review platform, including all specialized agents, unlimited reviews, and priority support.

What programming languages does diffray support?

diffray supports all major programming languages including TypeScript, JavaScript, Python, Go, Rust, Java, C#, Ruby, PHP, and more. The multi-agent system is language-agnostic and adapts its analysis to language-specific patterns and best practices.

How does diffray integrate with GitHub?

diffray integrates seamlessly with GitHub through a GitHub App. Once installed, it automatically reviews every pull request, posting actionable comments directly on the PR. Setup takes less than 2 minutes with no configuration required. Enterprise teams can also use diffray CLI for local reviews before pushing code.

What is the difference between diffray and CodeRabbit or GitHub Copilot?

While CodeRabbit and GitHub Copilot use single-model AI that can hallucinate and produce false positives, diffray employs multi-agent intelligence where specialized agents cross-validate findings. This results in 87% fewer false positives. Additionally, diffray provides full codebase awareness, custom rule support, and agent memory that learns from your team's patterns.

Can diffray detect security vulnerabilities?

Yes, diffray's Security Agent is specifically trained to detect OWASP Top 10 vulnerabilities, injection attacks, authentication flaws, and sensitive data exposure. It analyzes code in context of your entire codebase, reducing false positives while catching real security issues that static analysis tools miss.

How much does diffray reduce code review time?

According to our customer data, teams using diffray reduce PR review time by 73% on average - from 45 minutes to 12 minutes per week. This is because diffray's multi-agent system produces 87% fewer false positives, so developers spend time on real issues instead of filtering noise.

What is the developer action rate on diffray comments?

diffray achieves a 98% developer action rate on its comments, compared to industry average of 15-20% for traditional AI code review tools. This high engagement is due to our multi-agent approach that eliminates noise and surfaces only actionable findings with confidence scores.

How does diffray handle duplicate comments?

diffray guarantees zero duplicate comments through its intelligent deduplication system. Unlike single-agent tools that often flag the same issue multiple times across a PR, diffray's agents coordinate to consolidate findings and present each issue exactly once with full context.

Does diffray store my code?

No, diffray never stores your source code. Code is processed in memory during the review and immediately discarded. We are SOC 2 compliant and your code is never used for AI training. Enterprise customers can also use our on-premise deployment option for complete data sovereignty.

How does diffray compare to GitHub Copilot code review?

While GitHub Copilot uses a single AI model for code review, diffray employs specialized multi-agent intelligence. Research shows multi-agent systems catch 3x more real bugs while producing 87% fewer false positives. diffray also provides full codebase awareness, custom rules, and agent memory - features not available in Copilot's code review.

Jeder Fehler Wird zur Regel

Boris Cherny, der Schöpfer von Claude Code, enthüllte kürzlich seinen Workflow, und ein Satz aus seinem Thread explodierte in der Entwickler-Community: "Jedes Mal, wenn wir sehen, dass Claude etwas falsch macht, fügen wir es zur CLAUDE.md hinzu, damit Claude es beim nächsten Mal nicht wieder tut."

Produktleiter Aakash Gupta fasste es perfekt zusammen: "Jeder Fehler wird zur Regel." Je länger ein Team mit KI zusammenarbeitet, desto intelligenter wird sie.

Das ist genau die Philosophie, auf der diffray aufgebaut ist. Heute zeigen wir Ihnen, wie es unter der Haube funktioniert.

Das Problem: Kontextverschmutzung Beeinträchtigt die Review-Qualität

Bevor wir über Regeln sprechen, müssen wir die technische Hauptherausforderung des KI-Code-Reviews verstehen — Kontextverschmutzung.

Anthropics Forschung zeigt, dass LLMs, wie Menschen, den Fokus verlieren, wenn das Kontextfenster sich füllt. Korrekturen häufen sich, Nebendiskussionen stapeln sich, veraltete Tool-Ausgaben bleiben bestehen. Das Ergebnis ist vorhersehbar:

False Positives

KI findet "Probleme", die nicht existieren

Halluzinationen

Imaginäre Bugs und nicht existierende Muster

Zieldrift

Reviews werden progressiv weniger relevant

JetBrains Research (Dezember 2025) quantifizierte dies: Agent-Kontexte wachsen so schnell, dass sie teuer werden, aber keine signifikant bessere Aufgabenleistung liefern. Mehr Kontext ≠ bessere Ergebnisse.

Die Lösung: Spezialisierte Subagenten mit Isoliertem Kontext

Boris Cherny verwendet Subagenten als "automatisierte Kapselungen der häufigsten Workflows." Seine Philosophie:

"Zuverlässigkeit kommt von Spezialisierung plus Einschränkung"

Anstelle eines allwissenden Reviewers erzeugt sein Code-Review-Befehl mehrere parallele Agenten mit unterschiedlichen Verantwortlichkeiten:

1.Ein Agent überprüft Stilrichtlinien

2.Ein anderer analysiert die Projektgeschichte, um Muster zu verstehen

3.Ein dritter markiert offensichtliche Bugs

4.Dann suchen fünf weitere Agenten gezielt nach Schwachstellen in den ersten Erkenntnissen

Diese adversariale Schicht ist entscheidend. Sekundäre Agenten hinterfragen die Erkenntnisse des ersten Durchgangs und eliminieren False Positives durch strukturierte Skepsis.

Das Ergebnis, in Chernys Worten: "findet alle echten Probleme ohne die falschen."

Wie Es Technisch Funktioniert

Wenn der Hauptagent an einen Subagenten delegiert, entsteht ein frisches Kontextfenster, das nur die Aufgabenbeschreibung und relevante Parameter enthält. Der Subagent kann extensiv erkunden—zehntausende Token beim Durchsuchen von Code verbrauchen—gibt aber nur eine kondensierte Zusammenfassung von 1.000-2.000 Token zurück.

Dies bewahrt den Fokus des Hauptagenten und ermöglicht gleichzeitig tiefgehende Analyse.

Hauptagent(sauberer Kontext)

🛡️

Sicherheit

isolierter Kontext

✨

Stil

isolierter Kontext

⚡

Performance

isolierter Kontext

🏗️

Architektur

isolierter Kontext

Kondensierte Zusammenfassungen(1-2K Token jeweils)

Bei diffray verwenden wir über 30 spezialisierte Agenten, jeder auf eine bestimmte Domäne fokussiert: Sicherheit, Performance, Code-Stil, architektonische Muster und mehr. Jeder Agent arbeitet in einem isolierten Kontext und gibt nur substanzielle Erkenntnisse zurück.

Regelerstellung: Feedback in Wissen Verwandeln

Jetzt zum Hauptereignis. Subagenten lösen das Kontextproblem. Aber wie bringt man KI dazu, aus Ihren Korrekturen zu lernen?

Das CLAUDE.md-Muster

In Claude Code pflegen Teams eine CLAUDE.md-Datei in ihrem Repository—eine Art "Verfassung" für das Projekt. Die Datei wird automatisch bei jeder Sitzung in den Kontext geladen.

Aber es gibt eine kritische Einschränkung. HumanLayer-Forschung zeigt, dass Claude Codes System-Prompt bereits ~50 Anweisungen enthält, und Frontier-LLMs folgen zuverlässig nur 150-200 Anweisungen insgesamt. Die Qualität der Anweisungsbefolgung nimmt gleichmäßig ab, wenn die Anzahl steigt.

Das bedeutet: Sie können nicht einfach 500 Regeln abladen und Magie erwarten.

Drei Ebenen des Wissens

Effektive Regeln kodieren Wissen auf drei Ebenen:

WAS (Projektkarte)

## Tech-Stack
- Backend: Python 3.11, FastAPI, SQLAlchemy
- Frontend: React 18, TypeScript, TailwindCSS
- DB: PostgreSQL 15

WARUM (Architekturentscheidungen)

## Warum Wir KEIN ORM für Komplexe Abfragen Verwenden
Geschichte: ORM generierte N+1-Abfragen in Berichten.
Entscheidung: Raw SQL für Analytics, ORM nur für CRUD.

WIE (Prozesse)

## Vor dem Commit
- `make lint` ausführen — muss ohne Fehler bestehen
- `make test` ausführen — Abdeckung darf nicht sinken

Das Problem mit Manuellen Ansätzen

Manuelle Regelwartung funktioniert... solange Ihr Team klein und diszipliniert ist. In der Realität:

Entwickler vergessen, Regeln zu aktualisieren

Regeln veralten schneller als Code

Implizite Konventionen bleiben implizit

Stammeswissen stirbt, wenn Schlüsselpersonen gehen

Wie diffray die Regelerstellung Automatisiert

diffray dreht den Prozess um. Statt Regeln manuell zu schreiben, geben Sie einfach Feedback zu Reviews.

Der Lernkreislauf

📝

→

🔍

diffray Review

→

💬

Entwickler-Feedback

→

🧠

Analyse

🔬Musterextraktion

Was war falsch?

⚙️Regelgenerierung

Spezifische Regel erstellen

✅Validierung

An PR-Historie testen

Nächster PR integriert die Regel

Schritt 1: Sie Geben Feedback

Daumen runter für einen diffray-Kommentar gegeben? Geantwortet "das ist kein Bug, das ist beabsichtigt"? Eine Empfehlung ignoriert? diffray erfasst alles.

Schritt 2: Musterextraktion

diffray analysiert: Was genau war falsch? War es ein Fehlalarm (Code ist korrekt), nicht anwendbarer Kontext (Regel gilt hier nicht), oder projektspezifische Konvention (so machen wir das hier)?

Schritt 3: Regelgenerierung

Basierend auf dem Muster formuliert diffray eine Regel, die den Geltungsbereich (welche Dateien/Verzeichnisse), was unterdrückt oder durchgesetzt werden soll, und warum spezifiziert. Die Regel wird für Nachverfolgbarkeit mit dem ursprünglichen Feedback verknüpft.

Schritt 4: Validierung

Bevor die Regel angewendet wird, führt diffray sie gegen historische PRs aus. Wie viele Kommentare wären unterdrückt worden? Wie viele davon waren tatsächlich False Positives? Die Regel wird nur angewendet, wenn sie die Genauigkeit verbessert.

Arten von Regeln in diffray

🚫

Unterdrückungsregeln

"X im Kontext Y nicht markieren" — bestimmte Warnungen in Legacy-Code, Testdateien oder generiertem Code unterdrücken.

🛡️

Durchsetzungsregeln

"Immer auf Z prüfen" — sicherstellen, dass kritische Muster wie SQL-Parametrisierung oder Auth-Prüfungen nie übersehen werden.

🎯

Kontextregeln

"Die Besonderheiten berücksichtigen" — Priorität basierend auf Dateityp, Dekoratoren oder umgebenden Codemustern anpassen.

📖

Terminologieregeln

"Wir nennen es so" — diffray Ihr Domänenvokabular beibringen, damit es Ihre Codebasis besser versteht.

Praktisches Beispiel: Von Ärgernis zu Regel

Stellen Sie sich vor: diffray hinterlässt einen Kommentar zu Ihrem PR:

Warnung Performance: Die Verwendung von any reduziert die Typsicherheit. Erwägen Sie explizite Typisierung.

Sie wissen, dass dies ein Legacy-Modul ist, das für das nächste Quartal zur Umschreibung vorgesehen ist. Jetzt Typen zu korrigieren wäre Zeitverschwendung.

Sie antworten: "Das ist Legacy, Typisierung wird während der Q2-Refaktorierung behandelt"

Was als Nächstes passiert:

1.diffray erkennt das negative Feedback

2.Analysiert den Kontext: Datei ist in src/legacy/, es gibt ein TODO mit Datum

3.Findet ähnliche Fälle in der Historie: 12 analoge Kommentare im letzten Monat

4.Generiert eine Unterdrückungsregel für src/legacy/** mit Ablaufdatum (Q2)

5.Nächster PR in src/legacy/ — diffray schweigt zu Typen

Aber wichtig: Die Regel ist nicht permanent. Das Ablaufdatum bedeutet, dass diffray nach Q2 wieder beginnt, Typen in diesem Verzeichnis zu prüfen.

Die Metrik: False-Positive-Rate Reduzieren

Das Schlüsselmaß für die Effektivität von KI-Code-Review ist die False-Positive-Rate. Wie viele von 100 Kommentaren waren nutzlos?

Typische Branchen-Benchmarks:

40-60%

Basis-KI-Review False Positives

25-35%

Mit manuellen Regeln

8-13%

diffray mit gelernten Regeln

Wie wir das erreichen:

Kontextisolierung

Durch Subagenten verhindert Drift

Agentenspezialisierung

Verbessert Genauigkeit in jeder Domäne

Lernen aus Feedback

Eliminiert wiederkehrende False Positives

Regelvalidierung

Verhindert Overfitting

Erste Schritte: Drei Schritte

Schritt 1: Verbinden Sie diffray mit Ihrem Repository

Die Integration dauert 5 Minuten über GitHub App oder GitLab-Webhook.

Schritt 2: Arbeiten Sie Einfach

In den ersten 2-3 Wochen arbeitet diffray im Lernmodus. Es studiert Ihre Projektstruktur, Ihre PR-Muster und den Kommentarstil Ihrer Reviewer.

Schritt 3: Geben Sie Feedback

Ignorieren Sie diffray-Kommentare nicht stillschweigend. Geben Sie Daumen hoch für nützliche, Daumen runter für nutzlose, antworten Sie auf diskutierbare.

Jede Interaktion macht diffray intelligenter. Nach einem Monat haben Sie einen personalisierten KI-Reviewer, der Ihre Konventionen besser kennt als ein neuer Entwickler nach dem Onboarding.

Fazit: KI, Die Mit Ihrem Team Wächst

Die Philosophie "jeder Fehler wird zur Regel" ist nicht nur ein eingängiger Spruch. Es ist ein architektonisches Prinzip, das Spielzeugtools von produktionsreifen Lösungen unterscheidet.

diffray ist auf drei Säulen aufgebaut:

Subagenten mit isoliertem Kontext

Für Genauigkeit ohne Verschmutzung

Regelerstellung aus Feedback

Für Lernen ohne manuelle Arbeit

Validierung an Historie

Für Vertrauen in Verbesserungen

Das Ergebnis: KI-Code-Review, das mit jedem PR besser wird. Nicht weil das Modell aktualisiert wurde, sondern weil es von Ihrem Team lernt.

Beginnen Sie Heute, Ihren KI-Reviewer zu Trainieren

Installieren Sie diffray und öffnen Sie einen PR. Es ist kostenlos für öffentliche Repos und enthält eine großzügige kostenlose Stufe für private Repos.

diffray Installieren Über Regeln Erfahren

Jeder Fehler Wird zur Regel:Wie diffray aus Ihrem Feedback Lernt

Das Problem: Kontextverschmutzung Beeinträchtigt die Review-Qualität

False Positives

Halluzinationen

Zieldrift

Die Lösung: Spezialisierte Subagenten mit Isoliertem Kontext

Wie Es Technisch Funktioniert

Regelerstellung: Feedback in Wissen Verwandeln

Das CLAUDE.md-Muster

Drei Ebenen des Wissens

WAS (Projektkarte)

WARUM (Architekturentscheidungen)

WIE (Prozesse)

Das Problem mit Manuellen Ansätzen

Wie diffray die Regelerstellung Automatisiert

Der Lernkreislauf

Schritt 1: Sie Geben Feedback

Schritt 2: Musterextraktion

Schritt 3: Regelgenerierung

Schritt 4: Validierung

Arten von Regeln in diffray

Unterdrückungsregeln

Durchsetzungsregeln

Kontextregeln

Terminologieregeln

Praktisches Beispiel: Von Ärgernis zu Regel

Die Metrik: False-Positive-Rate Reduzieren

Kontextisolierung

Agentenspezialisierung

Lernen aus Feedback

Regelvalidierung

Erste Schritte: Drei Schritte

Schritt 1: Verbinden Sie diffray mit Ihrem Repository

Schritt 2: Arbeiten Sie Einfach

Schritt 3: Geben Sie Feedback

Fazit: KI, Die Mit Ihrem Team Wächst

Beginnen Sie Heute, Ihren KI-Reviewer zu Trainieren

Verwandte Artikel

Why Noisy AI Code Review Tools Deliver Negative ROI

Context Awareness in AI Code Review: How Intelligent Systems Understand Your Codebase

Introducing Agent Store: Create, Share, and Discover Custom AI Agents

Jeder Fehler Wird zur Regel:
Wie diffray aus Ihrem Feedback Lernt