أنثروبيك تطلق Claude Sonnet 5 بقدرات وكيل ذكي متقدمة
الرياض - قناة اليمن الفضائية

أعلنت شركة أنثروبيك عن إطلاق نموذجها الجديد Claude Sonnet 5، الذي يمثل أحدث إضافة إلى فئة النماذج متوسطة الحجم. يوفر هذا النموذج تحسينات كبيرة في قدرات الذكاء الوكيلي (Agentic AI)، بما في ذلك التخطيط، استخدام الأدوات، وتنفيذ المهام بشكل مستقل، مما يعكس التطورات المستمرة في هذا المجال.
قدرات متقدمة بذكاء وكيل مستقل
يتميز Claude Sonnet 5 بقدرته على:
- وضع الخطط وتنفيذ المهام من البداية إلى النهاية.
- استخدام أدوات مثل متصفحات الإنترنت وسطر الأوامر (Terminal).
- العمل بشكل ذاتي دون إشراف مستمر من المستخدم، وهي قدرات كانت تتطلب سابقاً نماذج أكبر وأكثر تكلفة.
سباق الوكلاء الأذكياء بين الشركات الكبرى
يأتي إطلاق Sonnet 5 في إطار المنافسة المتزايدة بين شركات الذكاء الاصطناعي. حيث قدمت OpenAI نموذج GPT-5.6 Sol الذي يمكنه تقسيم المهام بين وكلاء فرعيين. بينما طرحت غوغل نموذج Gemini 3.5 Flash، الذي يتيح تخطيط وتنفيذ المشاريع مع تدخل بشري محدود. ترى أنثروبيك أن المنافسة تتجاوز مجرد القوة، لتشمل أيضاً خفض تكلفة التشغيل وزيادة موثوقية الأداء.
أداء قريب من Opus 4.8 وبسعر أقل
أوضحت الشركة أن Sonnet 5 يوفر أداءً يقترب من مستوى Opus 4.8، ولكنه يأتي بتكلفة أقل بكثير. وأصبح النموذج الافتراضي لمستخدمي خطتي Free وPro. أسعار الاستخدام حتى 31 أغسطس هي:
- 2 دولار لكل مليون رمز إدخال.
- 10 دولارات لكل مليون رمز إخراج.
بعد 31 أغسطس، ستصبح الأسعار:
- 3 دولارات لكل مليون رمز إدخال.
- 15 دولاراً لكل مليون رمز إخراج.
ورغم الزيادة، يبقى Sonnet 5 أقل تكلفة مقارنة بنماذج OpenAI وغوغل المنافسة.
تحسينات في البرمجة والاستدلال
يتفوق النموذج الجديد على الإصدار السابق Sonnet 4.6 في مجالات مثل الاستدلال المنطقي، استخدام الأدوات، برمجة التطبيقات، وتنفيذ المهام المعرفية. في اختبارات البرمجة المعتمدة على الوكلاء، سجل Sonnet 5 نتائج متميزة:
- Sonnet 5: 63.2%
- Opus 4.8: 69.2%
- Sonnet 4.6: 58.1%
كما أظهر Sonnet 5 تفوقاً طفيفاً على Opus 4.8 في اختبارات العمل المعرفي.
أمان أعلى وهجمات أقل
قدمت الشركة تحسينات ملحوظة في جوانب الأمان، حيث تشمل:
- رفض الطلبات الضارة.
- مقاومة هجمات حقن الأوامر.
- تقليل الهلوسة.
- الحد من السلوك التوافقي مع المستخدم.
ومع ذلك، يبقى Opus 4.8 ونسخة Mythos Preview أكثر قوة في المهام الحساسة بالأمن السيبراني.





