نماذج الذكاء الاصطناعي الجديدة من OpenAI تعاني من زيادة في معدلات الهلوسة

سان فرانسيسكو | قناة اليمن

كشفت تقارير حديثة أن نماذج الذكاء الاصطناعي الجديدة “O3″ و”O4-mini” التي أطلقتها شركة OpenAI مؤخرًا تعاني من ارتفاع معدل الهلوسة مقارنة بالنماذج السابقة، مما يثير تساؤلات حول دقة وسلامة استنتاجاتها.

وأظهرت اختبارات داخلية أجرتها OpenAI أن هذه النماذج، التي تصنف على أنها نماذج تفكير، تهلوس أكثر من النماذج التقليدية مثل GPT-4o، كما أن معدل الهلوسة في الإجابات زاد بشكل ملحوظ مقارنة بالإصدارات السابقة.

ووفقًا للتقرير الفني الصادر عن الشركة، فإن هناك حاجة إلى بحث إضافي لفهم أسباب تفاقم الهلوسة مع زيادة حجم نماذج التفكير. وأشارت البيانات إلى أن نموذج O3 هلوس في 33% من إجابات اختبار “PersonQA”، وهو ضعف معدل الهلوسة المسجل في نماذج التفكير السابقة، بينما سجل نموذج O4-mini معدلًا أعلى بلغ 48%.

ويرى خبراء الذكاء الاصطناعي أن هذه المشكلة قد تكون ناتجة عن زيادة تعقيد النماذج الجديدة وقدرتها على تقديم ادعاءات أكثر دقة، مما يجعلها عرضة لمزيد من الأخطاء والاختلاقات غير الواقعية.

وفي ظل تزايد الاعتماد على نماذج الذكاء الاصطناعي في مجالات مختلفة مثل البرمجة والرياضيات، أصبحت الحاجة لحل مشكلة الهلوسة أكثر إلحاحًا، إذ قد تؤثر على دقة المعلومات المقدمة للمستخدمين وتحد من إمكانية الوثوق بالنتائج الصادرة عنها.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مقالات ذات صلة

زر الذهاب إلى الأعلى