ميسترال تطلق Voxtral TTS كنموذج متقدم للذكاء الاصطناعي الصوتي يدعم اللغة العربية
أعلنت شركة “ميسترال” الفرنسية المتخصصة في مجال الذكاء الاصطناعي عن إطلاق نموذج جديد مفتوح المصدر لتحويل النص إلى كلام تحت اسم “Voxtral TTS”، والذي يركز بشكل خاص على دعم اللغة العربية. تأتي هذه الخطوة في إطار استراتيجية الشركة لدخول المنافسة مع شركات رائدة في مجال توليد الصوت باستخدام تقنيات الذكاء الاصطناعي مثل ElevenLabs وOpenAI. تهدف ميسترال إلى توفير بديل مفتوح وقابل للتخصيص يلبي احتياجات الأفراد والمؤسسات على حد سواء.
دعم اللغة العربية في تسع لغات عالمية
يتميز نموذج Voxtral TTS بدعمه لتسع لغات عالمية، بما في ذلك العربية، الإنجليزية، الفرنسية، الألمانية، الإسبانية، والهندية. يعكس هذا التنوع أهمية النموذج في الأسواق متعددة اللغات، حيث يمكن استخدامه في مجالات متنوعة مثل خدمة العملاء والتفاعل الصوتي. إن إدراج اللغة العربية يعد إنجازًا كبيرًا، إذ يمكّن الشركات من تطوير وكلاء ذكاء اصطناعي قادرين على تقديم خدمات صوتية طبيعية للمستخدمين العرب، سواء في مجالات المبيعات أو الدعم الفني، مع ضمان جودة النطق وسلاسة التواصل.
تكنولوجيا متقدمة لصوت مخصص
أوضحت ميسترال أن النموذج قادر على إنشاء صوت مخصص بناءً على عينة قصيرة لا تتجاوز خمس ثوانٍ. يمكنه التقاط تفاصيل دقيقة مثل اللهجات، ونبرة الصوت، وطريقة الإلقاء، بالإضافة إلى التفاوتات الطبيعية في الحديث. يتيح Voxtral TTS التنقل بين اللغات المختلفة دون فقدان الخصائص الأساسية للصوت، مما يجعله مثاليًا لتطبيقات مثل الدبلجة والترجمة الفورية، مع الحفاظ على هوية المتحدث عند التبديل بين اللغات.
سرعة أداء مناسبة للتطبيقات الفورية
يتميز النموذج بأداء فوري حيث تدعي الشركة أنه قادر على إنتاج مقطع صوتي مدته 10 ثوانٍ في نحو 1.6 ثانية فقط. تسمح هذه السرعة باستخدام النموذج في سيناريوهات تفاعلية مباشرة، مثل المساعدات الصوتية والردود الآلية الفورية. كما أن النموذج صغير الحجم بما يكفي ليعمل على أجهزة متنوعة مثل الهواتف الذكية والساعات الذكية والحواسيب المحمولة، مع تكلفة تشغيل منخفضة مقارنة بالمنافسين، مما يعزز فرص اعتماده في التطبيقات اليومية.
توجهات مستقبلية لبناء منظومة صوتية متكاملة
يأتي إطلاق Voxtral TTS في إطار توجه أوسع من قبل ميسترال لبناء منظومة صوتية متكاملة. فقد سبق للشركة أن أطلقت نماذج لتحويل الصوت إلى نص، وتخطط لتطوير منصة تدعم مدخلات ومخرجات متعددة تشمل الصوت والنص والصورة مع توفير المصادر المفتوحة وإمكانيات التخصيص. إن هذا التوجه يعكس التزام ميسترال بتقديم حلول مبتكرة في مجال الذكاء الاصطناعي وتلبية احتياجات المستخدمين في عالم متغير.







