أداء أقوى بسعر أقل.. أنثروبيك تطلق نموذج الذكاء الاصطناعي Claude Sonnet 5

أداء أقوى بسعر أقل.. أنثروبيك تطلق نموذج الذكاء الاصطناعي Claude Sonnet 5

أعلنت شركة أنثروبيك إطلاق نموذج الذكاء الاصطناعي الجديد Claude Sonnet 5، والذي يهدف إلى توفير قدرات متقدمة لتنفيذ المهام الذاتية (Agentic AI) بتكلفة أقل. ويأتي النموذج الجديد بتحسينات كبيرة في الاستدلال، واستخدام الأدوات، والبرمجة، وإنجاز المهام المعقدة.

ويستطيع النموذج الجديد التخطيط وتنفيذ المهات بنحو مستقل، مع استخدام أدوات مثل متصفحات الويب والطرفيات (Terminal)، مما يتيح له إتمام أعمال كانت تتطلب قبل أشهر نماذج أكبر وأكثر تكلفة.

يأتي هذا الإطلاق في وقت تتسابق فيه شركات الذكاء الاصطناعي على تطوير نماذج قادرة على العمل كوكلاء مستقلين، بعد إطلاق OpenAI نموذج GPT-5.6 Sol، وتقديم جوجل نموذج Gemini 3.5 Flash بقدرات مشابهة تعتمد على التخطيط وتنفيذ المهام بأقل تدخل بشري.

وترى أنثروبيك أن قدرات الوكلاء الأذكياء أصبحت معيارًا أساسيًا في السوق، في حين باتت المنافسة تتركز على خفض التكلفة وتحسين الاعتمادية عند تنفيذ المهام المستقلة.

أكدت الشركة أن Claude Sonnet 5 يقدم أداءً يقترب من نموذج Opus 4.8 الأعلى فئةً، لكن بسعر أقل بكثير. وقد أصبح النموذج بدايةً من اليوم الخيار الافتراضي لمستخدمي الخطة المجانية وخطة Pro، كما يتوفر لكافة المشتركين في خدمات Claude.

تبلغ تكلفة استخدام النموذج حتى نهاية أغسطس دولارين لكل مليون رمز إدخال (Input Tokens) و 10 دولارات لكل مليون رمز إخراج (Output Tokens)، قبل أن ترتفع تكلفة الإدخال إلى 3 دولارات مع بقاء تكلفة الإخراج دون تغيير.

وبهذه الأسعار، يعد Claude Sonnet 5 أقل تكلفةً من Opus 4.8، وكذلك من GPT-5.5 و Gemini 3.1 Pro، في حين يظل أعلى سعرًا من Gemini 3.5 Flash.

أشارت أنثروبيك إلى أن النموذج الجديد يتفوق بوضوح على Sonnet 4.6، الذي أُطلق في فبراير الماضي، في مجالات البرمجة القائمة على الوكلاء، والاستدلال، واستخدام الأدوات، وإنجاز المهام المعرفية.

وحقق Claude Sonnet 5 نسبة قدرها 63.2% في أحد اختبارات البرمجة الذاتية، مقارنةً بـ 58.1% للإصدار السابق، في حين سجل Opus 4.8 نسبة قدرها 69.2%، كما تفوق النموذج الجديد بصورة طفيفة على Opus 4.8 في أحد اختبارات المهام المعرفية.

وتبدو الشركة أن المطورين أصبح بإمكانهم الاختيار بين Sonnet 5 و Opus 4.8 وفق التوازن المطلوب بين الأداء والتكلفة.

وفقًا لاختبارات أجرتها شركات استخدمت النموذج قبل إطلاقه، فإن Claude Sonnet 5 يتميز بقدرته على إكمال المهام الطويلة والمعقدة حتى النهاية، مع مراجعة نتائجه ذاتيًا دون الحاجة إلى توجيهات إضافية.

أكدت أنثروبيك أن Claude Sonnet 5 يقدم مستوى أعلى من الأمان مقارنةً بالإصدار السابق، مع انخفاض معدلات السلوكيات غير المرغوبة مثل التعاون مع الاستخدامات الضارة أو الخداع، إضافة إلى قدرة أفضل على رفض الطلبات الخبيثة والتصدي لهجمات حقن الأوامر (Prompt Injection).

وأشارت الشركة إلى انخفاض معدلات الهلوسة الرقمية والميل إلى مجاملة المستخدم على حساب الدقة مقارنةً بنموذج Sonnet 4.6.

ومع ذلك، أوضحت الشركة أن نماذج Opus 4.8 و Claude Mythos Preview ما زالا يتفوقان في التعامل مع بعض سيناريوهات السلامة المعقدة، في حين يمتلك Claude Sonnet 5 قدرة أقل على تنفيذ المهام السيبرانية الخطرة، وهو ما يعد عاملًا إضافيًا لتعزيز سلامته عند استخدامه في التطبيقات العملية.

إرسال التعليق

You May Have Missed