نظام تحويل النصوص إلى كلام بمعهد قطر لبحوث الحوسبة يعزز الحلول الإقليمية

نظام تحويل النصوص إلى كلام بمعهد قطر لبحوث الحوسبة يعزز الحلول الإقليمية

11 يناير 2022

إصدار أول نموذج للتعلم العميق قائم على الذكاء الاصطناعي يمثل الخطوة الأولى نحو إتاحة التكنولوجيا للمستخدمين والمطورين في جميع أنحاء منطقة الشرق الأوسط وشمال أفريقيا

يوجد حوالي 422 مليون ناطق باللغة العربية في جميع أنحاء العالم بحاجة إلى مثل هذه التكنولوجيا بلغتهم العربية الأم

ابتكر فريق تقنيات اللغة العربية في معهد قطر لبحوث الحوسبة بجامعة حمد بن خليفة نظامًا رائدًا لتحويل النصوص العربية بشكلٍ فوريٍ إلى كلام.

ويُعد إصدار أول نموذج يطوره الفريق ويعتمد على الذكاء الاصطناعي خطوة أولى على طريق تيسير سبل وصول  المستخدمين والمطورين في جميع أنحاء منطقة الشرق الأوسط وشمال أفريقيا لهذه التكنولوجيا. ويأتي الإصدار الأول بصوتين نقيَّين للغاية، وهما صوت طبيعي مناسب للأخبار والقراءة لشخصية افتراضية تُدعى 'حمزة'؛ وصوت آخر معبر بشكلٍ أكبر لشخصية افتراضية تدعى 'أمينة' يستهدف في المقام الأول إنتاج الكلام للجماهير الشابة من خلال قراءة القصص والمساعدة في التعليم.

وبهذه المناسبة، قال الدكتور أحمد عبد العلي، مهندس برمجيات أول في قسم تقنيات اللغة العربية بمعهد قطر لبحوث الحوسبة: "يعد الإنتاج الآلي للكلام تكنولوجيا مهمة تؤثر على حياتنا بشكلٍ يومي. ولم تعد هذه التكنولوجيا مجرد رفاهية، بل أصبحت ضرورة لأنها توفر حلاً للعديد من المشكلات الصعبة." 

وأضاف: "وبدايةً من التطبيقات التقليدية مثل الإخطارات الصوتية وبرامج قراءة الكتب وصولاً إلى تطبيقات المساعدة الصوتية الأكثر تطورًا، توفر تكنولوجيا تحويل النصوص إلى كلام التقنيات الأساسية لتحويل النصوص إلى إشارات صوتية طبيعية. ورغم أن تكنولوجيا تحويل النصوص إلى كلام ليست قديمة، فقد سمحت لنا الطفرات الحديثة في مجال التعلم العميق ببناء نماذج أكثر تطورًا تتميز بسرعتها وقدرتها على إنتاج أصوات لا يمكن تمييزها عن الكلام البشري. وقد كان إنتاج صوت واضح ومفهوم يشبه صوت الإنسان حلمًا يتوق باحثونا لتحقيقه، ونحن فخورون جدًا بإنجازاتهم."

ومنذ بداية المشروع، حصل الفريق على تسجيلات عالية الجودة لاثنين من المتحدثين. وخضعت النصوص المسجلة لمعالجة مسبقة عن طريق نظام 'فراسة' الذي طوره المعهد، وهو نظام ذكاء اصطناعي آخر يهتم بالمهام اللغوية العربية الأساسية مثل ضبط تشكيل الحروف. وجرت التدريبات باستخدام مجموعة الأداء الفائق الخاصة بالمعهد، بما في ذلك أحدث أجهزة وحدات معالجة الرسومات.

ويوجد حوالي 422 مليون ناطق باللغة العربية في جميع أنحاء العالم، وسيحتاجون في النهاية إلى مثل هذه التكنولوجيا بلغتهم العربية الأم، لذا تبدو أبحاث المعهد في هذا الصدد مهمةً للغاية. ويمثل إصدار نظام تحويل النصوص إلى كلام علامة بارزة أخرى في الجهود التي يبذلها الفريق لسد الفجوة في مجال معالجة النصوص المكتوبة باللغة العربية عبر تمكين مجموعة من التقنيات الخاصة باللغات مثل معالجة النصوص العربية والتحليل الصرفي وضبط الحروف (التشكيل) والترجمة الآلية والتعرف التلقائي على الكلام وإنتاج الكلام في الوقت الراهن.

وتعكس مجموعة الأدوات التي طورها الفريق التزامه بتطوير البحوث المتعلقة باللغة العربية بالإضافة إلى دعم المجتمعات المحلية والدولية بالخبرات ذات الصلة.

ويمكن الوصول إلى النظام عبر: https://tts.qcri.org/