Warum Laute KI-Code-Review-Tools
Negativen ROI Liefern
KI-Code-Review-Tools mit hohen False-Positive-Raten helfen nicht nur nicht—sie verschlechtern aktiv die Codequalität. Wenn alles markiert wird, wird nichts behoben.
Forschung in Gesundheitswesen, Sicherheitsoperationen und Softwareentwicklung zeigt ein konsistentes Muster: Wenn automatisierte Warnungen die Zuverlässigkeitsschwellen überschreiten, hören Menschen auf, sie zu lesen. Das Wahrscheinlichkeits-Matching-Phänomen zeigt: Hat ein Tool 50% False-Positive-Rate, ignorieren Entwickler etwa die Hälfte aller Warnungen—einschließlich der gültigen.
83%
der Sicherheitswarnungen sind Fehlalarme (Gartner 2024)
62%
der SOC-Warnungen werden komplett ignoriert
$1.3M
jährliche Unternehmenskosten für False Positives
50%
False-Positive-Schwelle für kontraproduktive Tools
Die Wissenschaft des Ignorierens von Warnungen
Alarm-Müdigkeit entstand als klinischer Begriff im Gesundheitswesen, wo Forscher dokumentierten, dass 72% bis 99% der Krankenhaus-Monitoralarme False Positives sind. Die AACN definierte es als "sensorische Überlastung, die auftritt, wenn Kliniker einer übermäßigen Anzahl von Alarmen ausgesetzt sind."
Das Wahrscheinlichkeits-Matching-Phänomen
Bliss, Gilson & Deaton (1995): 90% der Probanden kalibrieren unbewusst ihre Reaktionsraten entsprechend der wahrgenommenen Zuverlässigkeit
Code-Review Hat Strenge Kognitive Grenzen
Optimale Code-Review-Schwellenwerte
200-400
LOC
Zeilen Pro Sitzung
<500
LOC/Std
Review-Geschwindigkeit
60
Min
Sitzungsdauer
Das Wirtschaftliche Argument für Präzision über Abdeckung
False-Positive-Kostenrechner
Triage-Zeit pro FP
15-30 Min
Vollkosten Entwickler
$75-85/Std
Kosten pro False Positive
$19-42
Fallstudie: Der Target-Einbruch
40M
Gestohlene Karten
70M
Kompromittierte Datensätze
-46%
Gewinnrückgang Q4 2013
$200M+
Gesamtkosten des Einbruchs
Die 50%-Schwelle
Die Schwelle für kontraproduktive Tools liegt bei etwa 50% False-Positive-Rate. Tools, die diese Schwelle überschreiten, sollten als aktiv schädlich betrachtet werden.
Wie diffray Präzision Priorisiert
diffray wurde von Grund auf entwickelt, um die Alarm-Müdigkeits-Falle zu vermeiden, die Code-Review-Tools kontraproduktiv macht.