كشفت مجموعة من الباحثين بقطاع أبحاث الذكاء الاصطناعي في أمازون عن نموذج ذكي جديد، قادر على تعليم نفسه كيفية نطق كلمات ورموز وعبارات لم يتدرب عليها من قبل.
وتمكن نموذج ” BASE TTS” المتخصص في تحويل النصوص إلى كلام مسموع، تطوير قدراته ذاتياً في التعامل مع كلمات غير الإنجليزية، وفهم الرموز وعلامات الترقيم، إلى جانب قدرته على التعبير الصوتي عن المشاعر المختلفة.
وأكد فريق أمازون البحثي تدريب النموذج على 100 ألف ساعة من حديث البشر بلغات مختلفة، 90% منها باللغة الإنجليزية، ثم تدريب نموذجين أصغر حجماً، أحدهما على 10 آلاف ساعة، والآخر على ألف ساعة فقط.
وتتمثل القدرات، التي أذهلت الباحثين، في إدراك النموذج كيفية نطق عبارات يتطلب توصيل معناها الحديث بالهمس، وكذلك كيفية التنقل بين العبارات والجمل عند قراءة نص مزود بعلامات الترقيم الإنجليزية، إلى جانب ذلك استطاع نموذج BASE TTS التعامل باحترافية مع بعض الكلمات الفرنسية التي توسطت جملاً مكونة من كلمات إنجليزية.
ولا يزال النموذج في مرحلة البحث والتطوير، ولم يتم إطلاقه تجارياً للمستخدمين.