لماذا نختبر النماذج على المعايير القياسية ثم نطلقها بناءً على الحدس؟
الفرصة
تختار الفرق نموذجًا من لوحة التصنيف، ثم تشغّله في بيئة الإنتاج دون أي تقييم مستمر ورخيص وموجَّه للمهمة. حين ينحدر مستوى الجودة، لا يلاحظ أحد ذلك حتى يشكو مستخدم ما. الأدوات اللازمة لقياس ما إذا كانت ميزة الذكاء الاصطناعي لا تزال تعمل بجودة مقبولة غائبة لدى معظم المطورين.
لماذا تهم
لا يمكنك إدارة ما لا تستطيع قياسه، وفي الوقت الراهن معظم ميزات الذكاء الاصطناعي غير مقيسة.
كيف أقيّم الفرصة
نقاط الفرصة هي قراءتي الشخصية لا قياس دقيق: مدى تأثير المشكلة، وتكرار مواجهتها، وشُح الحلول المتاحة لها اليوم. كلما ارتفعت النقاط، كان البناء في رأيي أجدر بالاهتمام.
مقدار الألم الذي تسببه حين تظهر.
مدى تكرار مواجهة الناس لها فعلياً.
مدى شُح الأدوات الجيدة المتاحة لها اليوم.
مزيد من المشكلات التي تستحق الحل
لماذا تنساني كل تطبيقات الذكاء الاصطناعي في اللحظة التي أغلق فيها التبويب؟
AIلماذا لا يزال تعلم مجال جديد رهيناً بمعرفة الأسئلة الصحيحة؟
AIلماذا لا يستطيع غير المتخصص التحقق مما أخبره به الذكاء الاصطناعي للتو؟
AIلماذا لا تملك وكلاء الذكاء الاصطناعي ذاكرة لأخطائها الخاصة؟
AIلماذا لا يمكنني مراجعة ما تدرّب عليه النموذج فعلاً؟
AIلماذا يمكن لمستند مخترق أن يسرّب بصمت كل ما يعرفه مساعدي عني؟