لماذا أدوات مراجعة الكود بالذكاء الاصطناعي المزعجة
تحقق عائد استثمار سلبي
أدوات مراجعة الكود بالذكاء الاصطناعي ذات معدلات الإيجابيات الكاذبة العالية لا تفشل في المساعدة فحسب - بل تؤدي إلى تدهور جودة الكود بشكل فعّال. عندما يتم تمييز كل شيء كمشكلة، لا يتم إصلاح أي شيء.
تكشف الأبحاث في مجالات الرعاية الصحية وعمليات الأمن وهندسة البرمجيات عن نمط متسق: عندما تتجاوز التنبيهات الآلية عتبات الموثوقية، يتوقف البشر عن قراءتها. ظاهرة المطابقة الاحتمالية تُظهر أنه إذا كانت الأداة تحتوي على 50% إيجابيات كاذبة، سيتجاهل المطورون في النهاية حوالي نصف جميع التنبيهات—بما في ذلك الصالحة منها.
83%
من تنبيهات الأمان إنذارات كاذبة (Gartner 2024)
62%
من تنبيهات SOC يتم تجاهلها بالكامل
1.3 مليون$
تكلفة المؤسسات السنوية للإيجابيات الكاذبة
50%
عتبة الإيجابيات الكاذبة للأدوات غير المنتجة
علم تجاهل التنبيهات
نشأ مصطلح إرهاق التنبيهات كمصطلح سريري في الرعاية الصحية، حيث وثّق الباحثون أن 72% إلى 99% من إنذارات أجهزة المراقبة في المستشفيات هي إيجابيات كاذبة. عرّفته AACN بأنه "الحمل الحسي الزائد الذي يحدث عندما يتعرض الأطباء لعدد مفرط من الإنذارات."
ظاهرة المطابقة الاحتمالية
Bliss, Gilson & Deaton (1995): 90% من المشاركين يعايرون معدلات استجابتهم لا شعورياً لتتناسب مع الموثوقية المتصورة
مراجعة الكود لها حدود إدراكية صارمة
العتبات المثلى لمراجعة الكود
200-400
سطر
أسطر لكل جلسة
<500
سطر/ساعة
سرعة المراجعة
60
دقيقة
مدة الجلسة
الحجة الاقتصادية للدقة على التغطية
حاسبة تكلفة الإيجابيات الكاذبة
وقت الفرز لكل FP
15-30 دقيقة
التكلفة الكاملة للمطور
75-85$/ساعة
تكلفة كل إيجابية كاذبة
19-42$
دراسة حالة: اختراق Target
40 مليون
بطاقة مسروقة
70 مليون
سجل مخترق
-46%
انخفاض الأرباح Q4 2013
+200 مليون$
إجمالي تكاليف الاختراق
عتبة 50%
يبدو أن عتبة الأدوات غير المنتجة تقع حول معدل إيجابيات كاذبة 50%. الأدوات التي تتجاوز هذه العتبة يجب اعتبارها ضارة بشكل فعّال.
كيف تعطي diffray الأولوية للدقة
تم تصميم diffray من الأساس لتجنب فخ إرهاق التنبيهات الذي يجعل أدوات مراجعة الكود غير منتجة.