باحثون يشككون في تقنية “ديب سيك” لمعالجة النصوص الطويلة ويصفون نتائجها بـ”المضللة”

📍متابعات تقنية - قناة اليمن الفضائية

تواجه نماذج الذكاء الاصطناعي قيداً حرجاً يُعرف بـ “عنق الزجاجة للنصوص الطويلة”، وهو تحدٍ يحدّ من قدرتها على معالجة المستندات الكبيرة والمحادثات المطوّلة بكفاءة. وفي هذا السياق، أثار باحثون من الصين واليابان جدلاً واسعاً بعد تشكيكهم في منهجية أعلنتها قبل أشهر شركة الذكاء الاصطناعي الصينية الناشئة “ديب سيك”، والتي قالت إنها طوّرت حلاً مبتكراً لتجاوز هذا القيد.

منهجية DeepSeek-OCR تحت المجهر

وبحسب باحثين من جامعة توهوكو اليابانية والأكاديمية الصينية للعلوم، فإن تقنية DeepSeek-OCR — المصممة لضغط النصوص عبر تمثيلات بصرية — تعاني من أداء غير متسق، رغم ادعاءات الشركة بأنها قادرة على إحداث ثورة في معالجة النصوص الطويلة.

وأظهرت الدراسة أن التقنية تعتمد بشكل كبير على المعرفة اللغوية المسبقة للنماذج، أي الأنماط التي تعلمتها من كميات ضخمة من النصوص، بدلاً من الفهم البصري الحقيقي الذي تقول الشركة إنها حققته. واعتبر الباحثون أن هذا يجعل مقاييس الأداء التي أعلنتها “ديب سيك” مضللة.

انخفاض حاد في الدقة عند إضافة نصوص مشتتة

وفي سلسلة من التجارب الدقيقة، وجد الباحثون أن دقة إجابات DeepSeek-OCR على الأسئلة المرئية انخفضت إلى نحو 20% عند إضافة نصوص إضافية للتأثير على الاستنتاج، مقارنةً بدقة تتجاوز 90% في النماذج القياسية للذكاء الاصطناعي.

وقال الفريق إن هذه الفجوة الكبيرة تثير تساؤلات حول ما إذا كانت تقنيات الضغط البصري تمثل فعلاً مساراً عملياً لحل مشكلة السياق الطويل.

الشركة دافعت عن تقنيتها سابقاً

وكانت “ديب سيك” قد أعلنت عند إطلاق التقنية في أكتوبر أن “ضغط السياق البصري” يمكن أن يقلل عدد الرموز النصية بمعدل يتراوح بين 7 إلى 20 ضعفاً، معتبرة ذلك اتجاهاً واعداً لمعالجة النصوص الطويلة بكفاءة أعلى.

آراء متباينة: سلاح ذو حدين

في المقابل، يرى بعض علماء الحاسوب أن خوارزمية DeepSeek-OCR ليست معيبة بالكامل، بل سلاح ذو حدين. فبحسب الخبير الصيني لي بوجي، قد يساعد الاعتماد على المعرفة المكتسبة في فهم المخطوطات الصعبة، لكنه قد يصبح عيباً عند التعامل مع النصوص المطبوعة بوضوح.

سباق عالمي لحل أزمة السياق الطويل

وتسعى شركات الذكاء الاصطناعي حول العالم إلى تجاوز “عنق الزجاجة” هذا، لما له من تأثير مباشر على رفع قدرات النماذج في تحليل المستندات، وإدارة المحادثات الطويلة، وتحسين جودة التطبيقات المعتمدة على الذكاء الاصطناعي.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

مقالات ذات صلة

زر الذهاب إلى الأعلى