ميسترال تطلق Voxtral TTS.. نموذج ذكاء اصطناعي صوتي يدعم العربية
أعلنت شركة الذكاء الاصطناعي الفرنسية “ميسترال” إطلاق نموذج جديد مفتوح المصدر لتحويل النص إلى كلام (TTS) يحمل اسم Voxtral TTS، مع التركيز الأساسي على دعم اللغة العربية ضمن قدراته الأساسية. يأتي هذا النموذج ليدخل في منافسة مباشرة مع شركات رائدة في مجال توليد الصوت بالذكاء الاصطناعي مثل ElevenLabs و OpenAI، بهدف تقديم بديل مفتوح المصدر وقابل للتخصيص يلبي احتياجات الأفراد والشركات.
يدعم نموذج Voxtral TTS تسع لغات عالمية، تشمل العربية بالإضافة إلى الإنجليزية والفرنسية والألمانية والإسبانية والهندية، مما يعزز استخدامه في الأسواق متعددة اللغات. يُعد دعم اللغة العربية خطوة محورية، مما يتيح للشركات بناء وكلاء ذكاء اصطناعي قادرة على التفاعل الطبيعي صوتيًا مع المستخدمين العرب في قطاعات المبيعات والدعم الفني.
توضح الشركة أن النموذج قادر على إنشاء صوت مخصص من خلال عينة صوتية قصيرة لا تقل عن خمس ثوانٍ، مع القدرة على التقاط التفاصيل الدقيقة مثل اللهجات، ونبرة الصوت، وطريقة الإلقاء. يتميز النموذج بقدرته على التنقل بين اللغات المختلفة دون فقدان خصائص الصوت الأساسية، وهو ما يفيد في التطبيقات مثل الدبلجة والترجمة الفورية.
يركز النموذج على الأداء الفوري، حيث تزعم الشركة أنه يمكنه إنتاج مقطع صوتي مدته 10 ثوانٍ في خلال 1.6 ثانية فقط. تعزز هذه السرعة إمكانية استخدام النموذج في سيناريوهات تفاعلية مباشرة مثل المساعدات الصوتية والردود الآلية الفورية، كما أنه صغير الحجم بما يكفي للعمل على أجهزة متنوعة مثل الهواتف الذكية والساعات الذكية والحواسيب المحمولة بتكلفة تشغيل منخفضة مقارنة بالمنافسين.
يأتي إطلاق Voxtral TTS ضمن استراتيجية أوسع لدى ميسترال لبناء منظومة صوتية متكاملة؛ إذ سبق إطلاق نماذج لتحويل الصوت إلى نص، وتخطط الشركة لتطوير منصة تدعم مدخلات ومخرجات متعددة تشمل الصوت والنص والصورة، مع توفير المصادر المفتوحة وإمكانيات التخصيص.



إرسال التعليق