نتائج اختبار مستقلة تثير الجدل حول أداء نموذج الذكاء الاصطناعي “O3” من OpenAI

قناة اليمن | نيويورك

21/04/2025آخر تحديث: 21/04/2025

0 دقيقة واحدة

أثارت نتائج اختبار مستقلة تساؤلات حول شفافية ومصداقية شركة OpenAI، بعدما كشفت عن أداء أقل من المتوقع لنموذج الذكاء الاصطناعي O3 مقارنةً بالنتائج التي أعلنتها الشركة سابقًا.

وكانت OpenAI قد استعرضت في ديسمبر الماضي قدرات النموذج الجديد، مشيرةً إلى أنه قادر على الإجابة على أكثر من 25% من أسئلة اختبار FrontierMath المتقدم، وهو اختبار متخصص في المسائل الرياضية المعقدة، متفوقًا بشكل كبير على النماذج المنافسة التي لم تتجاوز دقتها 2% فقط.

لكن تقريرًا حديثًا صادرًا عن معهد Epoch AI، الجهة المطورة لمعيار FrontierMath، كشف أن الاختبارات التي أجراها على الإصدار العام من O3 أظهرت أداءً أقل بكثير، حيث لم يتجاوز النموذج حاجز 10% من الإجابات الصحيحة.

اختلاف في الإعدادات الحوسبية يثير التساؤلات

رغم أن هذه النتائج لا تثبت أن OpenAI قدمت معلومات مغلوطة، إلا أنها تثير تساؤلات حول أسلوب الشركة في عرض قدرات نماذجها. وأوضح معهد Epoch AI أن الفروقات قد تكون ناجمة عن اختلاف الإعدادات الحوسبية أو عدد المسائل المستخدمة في كل اختبار.

وفي منشور على منصة إكس، أكدت مؤسسة ARC Prize أن النسخة التي اختبرتها قبل الإطلاق الرسمي كانت أكثر قوة من النموذج الموجّه للاستخدام في المنتجات، مشيرةً إلى أن مستويات الحوسبة التي طُرحت للعامة أقل تطورًا من النسخ التجريبية.

OpenAI تبرر الفروقات في الأداء

من جهتها، قالت ويندا تشو، من الفريق التقني في OpenAI، إن النسخة الحالية من O3 مخصصة لتكون أكثر كفاءة وسرعة في الاستخدامات اليومية، مما قد يؤدي إلى تفاوت في نتائج الأداء.

الجدل حول شفافية اختبارات الذكاء الاصطناعي

هذه الواقعة تضيف حلقة جديدة إلى سلسلة من الانتقادات التي تطال قطاع الذكاء الاصطناعي بشأن الشفافية في نتائج الاختبارات، حيث سبق أن وُجهت اتهامات لشركات مثل ميتا وxAI التابعة لإيلون ماسك بنشر نتائج اختبار غير دقيقة أو لم تُطبَّق على النماذج الفعلية المتاحة للمستخدمين.

وفيما تستعد OpenAI لإطلاق نسخة أقوى من النموذج تحت اسم O3-Pro، تبقى العبرة بضرورة توخي الحذر عند تقييم قدرات نماذج الذكاء الاصطناعي، خصوصًا عندما يكون مصدر النتائج جهةً لها مصلحة تجارية مباشرة.

21/04/2025آخر تحديث: 21/04/2025

0 دقيقة واحدة

إتبعنا

نتائج اختبار مستقلة تثير الجدل حول أداء نموذج الذكاء الاصطناعي “O3” من OpenAI

قناة اليمن | نيويورك

اختلاف في الإعدادات الحوسبية يثير التساؤلات

OpenAI تبرر الفروقات في الأداء

الجدل حول شفافية اختبارات الذكاء الاصطناعي

أقرأ التالي

“آبل” تستعد لإطلاق تحديثات جديدة تعمل على تحسين عمر البطارية وأداء النظام

“علي بابا” تكشف عن نموذج الذكاء الاصطناعي الجديد ” كوين 3.5″

مؤسسة سينمائية تدرب العاملين في هوليود صنعاة الأفلام بالذكاء الاصطناعي

باحثة سابقة في OpenAI تنتقد توجه الشركة نحو الإعلانات وتحذّر من مخاطر أخلاقية

تسريبات جديدة تكشف تصميم وألوان سلسلة Galaxy S26 قبل الإعلان الرسمي

تحديث iOS 26.3 يضيف ميزة طال انتظارها للانتقال من آيفون إلى أندرويد

“آبل” تستعد لإطلاق تحديثات جديدة تعمل على تحسين عمر البطارية وأداء النظام

“علي بابا” تكشف عن نموذج الذكاء الاصطناعي الجديد ” كوين 3.5″

مؤسسة سينمائية تدرب العاملين في هوليود صنعاة الأفلام بالذكاء الاصطناعي

باحثة سابقة في OpenAI تنتقد توجه الشركة نحو الإعلانات وتحذّر من مخاطر أخلاقية

تسريبات جديدة تكشف تصميم وألوان سلسلة Galaxy S26 قبل الإعلان الرسمي

تحديث iOS 26.3 يضيف ميزة طال انتظارها للانتقال من آيفون إلى أندرويد

اترك تعليقاً إلغاء الرد

وزير الداخلية يبحث مع السفيرة الفرنسية تعزيز التعاون الأمني

وزير الدفاع يترأس اجتماعاً موسعاً لقيادة وزارة الدفاع ورئاسة الأركان والمناطق والهيئات والدوائر

شرطة تعز تضبط المتهم الرئيسي في قضية مقتل المواطن البركاني

وزير الدفاع يترأس اجتماعاً أمنياً بسيئون لتعزيز التنسيق والتكامل بين الأجهزة الأمنية والعسكرية

نائب رئيس الأركان يناقش مع خبيرة دولية ملف تجنيد الأطفال وانتهاكات مليشيات الحوثي الارهابية

وزيرة الشؤون القانونية تؤكد العزم في تفعيل آليات تطبيق القانون وتعزيز حضوره في مختلف مؤسسات الدولة

عضو مجلس القيادة طارق صالح: معركة الخلاص من الانقلاب الحوثي باتت قريبة

اللجنة الوطنية لتنظيم وتمويل الواردات تناقش مستجدات سير العمل وتقر عدد من الإجراءات

وزير الشؤون القانونية ووكيل مأرب يترأسان لقاءً موسعاً بالقيادات النسوية ومنظمات المجتمع المدني

اللجنة العليا للحج تناقش تحضيرات موسم 1447هـ

الأرصاد تتوقّع طقساً غائم جزئياً إلى غائم وحار نسبياً إلى معتدل وأمطاراً متفرقة ورعدية

وزيرة التخطيط تبحث مع صندوق الأمم المتحدة للسكان تعزيز الشراكة ودعم البرامج التنموية في اليمن

رئيس الوزراء وزير الخارجية يؤكد دعم استقلالية البنك المركزي ودوره في تحقيق الاستقرار المالي والنقدي

حضرموت تشهد وقفة جماهيرية حاشدة للتنديد بالهجمات الإيرانية على السعودية والدول العربية

نائب وزير الخارجية يعقد اجتماعاً موسعاً مع رؤساء البعثات في الأمريكتين وآسيا

عضو مجلس القيادة محمود الصبيحي يلتقي وزير الإعلام ويوجه بحشد كافة الامكانيات لدعم معركة الوعي

وزير الكهرباء ورئيس مصلحة الجمارك يناقشان التسهيلات الجمركية لقطاع الطاقة

وزير النقل يبحث مع سفيري الولايات المتحدة وفرنسا التعاون المشترك في قطاع النقل

عضو مجلس القيادة محمود الصبيحي يعزي رئيس مجلس النواب

لقاء يبحث دعم جهود اليمن لمواجهة تحديات التغيرات المناخية

اختلاف في الإعدادات الحوسبية يثير التساؤلات

OpenAI تبرر الفروقات في الأداء

الجدل حول شفافية اختبارات الذكاء الاصطناعي

أقرأ التالي

“آبل” تستعد لإطلاق تحديثات جديدة تعمل على تحسين عمر البطارية وأداء النظام

“علي بابا” تكشف عن نموذج الذكاء الاصطناعي الجديد ” كوين 3.5″

مؤسسة سينمائية تدرب العاملين في هوليود صنعاة الأفلام بالذكاء الاصطناعي

باحثة سابقة في OpenAI تنتقد توجه الشركة نحو الإعلانات وتحذّر من مخاطر أخلاقية

تسريبات جديدة تكشف تصميم وألوان سلسلة Galaxy S26 قبل الإعلان الرسمي

تحديث iOS 26.3 يضيف ميزة طال انتظارها للانتقال من آيفون إلى أندرويد

دعوى قضائية ضد "أبل" بسبب سرقة آيفون تثير الجدل حول استعادة البيانات

مسام ينزع 1050 لغماً وذخيرة غير منفجرة وعبوة ناسفة زرعتها المليشيات الحوثية

اترك تعليقاً إلغاء الرد

مقالات ذات صلة

وزير الداخلية يبحث مع السفيرة الفرنسية تعزيز التعاون الأمني

وزير الدفاع يترأس اجتماعاً موسعاً لقيادة وزارة الدفاع ورئاسة الأركان والمناطق والهيئات والدوائر

شرطة تعز تضبط المتهم الرئيسي في قضية مقتل المواطن البركاني

وزير الدفاع يترأس اجتماعاً أمنياً بسيئون لتعزيز التنسيق والتكامل بين الأجهزة الأمنية والعسكرية

نائب رئيس الأركان يناقش مع خبيرة دولية ملف تجنيد الأطفال وانتهاكات مليشيات الحوثي الارهابية

وزيرة الشؤون القانونية تؤكد العزم في تفعيل آليات تطبيق القانون وتعزيز حضوره في مختلف مؤسسات الدولة

عضو مجلس القيادة طارق صالح: معركة الخلاص من الانقلاب الحوثي باتت قريبة

اللجنة الوطنية لتنظيم وتمويل الواردات تناقش مستجدات سير العمل وتقر عدد من الإجراءات

وزير الشؤون القانونية ووكيل مأرب يترأسان لقاءً موسعاً بالقيادات النسوية ومنظمات المجتمع المدني

اللجنة العليا للحج تناقش تحضيرات موسم 1447هـ

الأرصاد تتوقّع طقساً غائم جزئياً إلى غائم وحار نسبياً إلى معتدل وأمطاراً متفرقة ورعدية

وزيرة التخطيط تبحث مع صندوق الأمم المتحدة للسكان تعزيز الشراكة ودعم البرامج التنموية في اليمن

رئيس الوزراء وزير الخارجية يؤكد دعم استقلالية البنك المركزي ودوره في تحقيق الاستقرار المالي والنقدي

حضرموت تشهد وقفة جماهيرية حاشدة للتنديد بالهجمات الإيرانية على السعودية والدول العربية

نائب وزير الخارجية يعقد اجتماعاً موسعاً مع رؤساء البعثات في الأمريكتين وآسيا

عضو مجلس القيادة محمود الصبيحي يلتقي وزير الإعلام ويوجه بحشد كافة الامكانيات لدعم معركة الوعي

وزير الكهرباء ورئيس مصلحة الجمارك يناقشان التسهيلات الجمركية لقطاع الطاقة

وزير النقل يبحث مع سفيري الولايات المتحدة وفرنسا التعاون المشترك في قطاع النقل

عضو مجلس القيادة محمود الصبيحي يعزي رئيس مجلس النواب

لقاء يبحث دعم جهود اليمن لمواجهة تحديات التغيرات المناخية