غوغل ديب مايند تكشف عن معايير جديدة لقياس موثوقية الذكاء الاصطناعي

لندن - قناة اليمن الفضائية

أعلنت شركة غوغل ديب مايند عن إطلاق مجموعة معايير جديدة تحمل اسم FACTS Benchmark Suite، تهدف إلى قياس مدى موثوقية نماذج الذكاء الاصطناعي في إنتاج إجابات دقيقة.

وتختبر هذه المعايير أداء النماذج في أربعة مجالات رئيسية:

  • الإجابة عن الأسئلة المعلوماتية عبر المعرفة الداخلية.
  • استخدام البحث عبر الإنترنت بفعالية.
  • إثبات دقة الإجابات من خلال الوثائق الطويلة.
  • تفسير الصور.

وبحسب تقرير لموقع “بيزنس إنسايدر”، فقد حقق نموذج جيميني 3 برو من غوغل أعلى دقة بلغت 69%، متفوقاً على النماذج المنافسة، فيما أظهرت النتائج أن الموثوقية لا تزال أقل من التوقعات البشرية، خاصة في المهام المعقدة أو المتخصصة.

وأكدت الشركة أن هذه المعايير تمثل تحذيراً وخارطة إرشادية للشركات التي تراهن على الذكاء الاصطناعي، مشيرة إلى أن الأخطاء الصغيرة قد تكون لها عواقب كبيرة في قطاعات حساسة مثل المالية والرعاية الصحية والقانون.

وتأمل غوغل أن يسهم تحديد مواطن القصور في تسريع وتيرة تطوير النماذج، رغم أن الذكاء الاصطناعي ما يزال يخطئ في نحو ثلث الحالات.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مقالات ذات صلة

زر الذهاب إلى الأعلى