معهد قطر لبحوث الحوسبة وSpeechmatics يتعاونان لتوفير

معهد قطر لبحوث الحوسبة وSpeechmatics يتعاونان لتوفير تقنية تحويل الكلام إلى نصوص باللغة العربية حول العالم

11 مايو 2016

معهد قطر لبحوث الحوسبة وSpeechmatics يتعاونان لتوفير تقنية تحويل الكلام إلى نصوص باللغة العربية حول العالم

أعلنت شركة Speechmatics، ومقرّها المملكة المتحدة، بأنها ستستخدم تقنية من تطوير معهد قطر لبحوث الحوسبة (QCRI)، أحد معاهد البحوث التابعة لجامعة حمد بن خليفة، من أجل توفير خدمات تحويل الكلام إلى نصوص باللغة العربية لعملائها على مستوى العالم.

وستستخدم شركة Speechmatics القائمة في كامبردج أحد منتجات معهد قطر لبحوث الحوسبة، ويعرف باسم (QATS) أي نظام النسخ المتقدم من معهد قطر لبحوث الحوسبة، لتحويل البثّ الصوتي والملفات الصوتية باللغة العربية إلى نصوص وترجمات مرافقة.

ويمكن لنظامQATS  تحويل الملفات الصوتية باللغة العربية الفصحى وأربع لهجات عربية رئيسية، هي اللهجة المصرية، ولهجة بلاد الشام، ولهجة شمال إفريقيا، واللهجة الخليجية.

وأشار الدكتور أحمد خليفة المقرمد، المدير التنفيذي لمعهد قطر لبحوث الحوسبة إلى أن قطر رائدة في مجال البحوث العالمية المختصة بتقنيات الكلام باللغة العربية، وقال: "هذه الخطوة ليست مجرد تحوّل تقني فقط، بل هي أهم من ذلك بكثير، كونها ستسمح بتبادل المعلومات باللغة العربية في جميع أنحاء العالم".

ومن جانبه، أكد الدكتور توني روبنسون، رئيس الشؤون العلمية في Speechmatics، بأن هذا التطوّر الهام الذي استخدم بنية Auto-Auto التي أعلنت عنها الشركة مؤخراً، سيتيح توفير محتوى قيّم باللغة العربية يسهل إيجاده واستخدامه بشكل كبير. وكان الدكتور روبنسون من رواد تطوير تطبيق التعلّم العميق في مجال التعرف على الكلام بجامعة كامبردج في ثمانينيات وتسعينيات القرن الماضي.

وتابع الدكتور روبنسون: "سنقدم لمعهد قطر لبحوث الحوسبة الدعم اللازم لتوسيع انتشاره ليشمل مجموعة من القطاعات والمناطق الجغرافية المرتبطة بسوق خدمات تحويل الكلام إلى نصوص، وذلك من خلال تزويده بأحدث الأبحاث المختصة في مجال التعلم الآلي والذكاء الاصطناعي".

بدوره، أشار أحمد علي، كبير مهندسي تقنيات اللغة العربية في معهد قطر لبحوث الحوسبة، والذي يشرف على الفريق المختص بتقنيات تحويل الكلام، إلى أنه قد تم استخدام بنية الشبكة العصبية العميقة (DNN) والشبكة العصبية المتكررة (RNN) لتطوير نظام النسخ المتقدم QATS. وأوضح علي: "استخدمنا أكثر من 2000 ساعة من الكلام باللغة العربية من أجل تطوير واختبار النظام، فضلاً عن أرشيف ضخم من محتوى الويب 2.0".

كما أشار علي إلى أن الاتفاقية ستمنح معهد قطر لبحوث الحوسبة حقّ الوصول إلى البيانات المتنوعة التي ستتيح للمعهد تعزيز وتطوير أبحاثه التقنية في مجال اللغة العربية. 

وتجدر الإشارة إلى أن معهد قطر لبحوث الحوسبة قد تفوّق على الدوام على المنافسين على مستوى اختبارات اللغة العربية الفصحى واللهجات المختلفة بمعدل لا يقل عن 10%، وفقاً لدراسة أجرتها شركة مستقلة متخصصة بمراقبة وسائل الإعلام خلال شهر مايو 2015.  كما حصل المعهد على جائزة "أفضل عرض تقني" من مؤسسة بي بي سي خلال مسابقة الهاكاثون الثالث (#NewsHACK) في شهر ديسمبر 2014، حول ترجمة فيديوهات بي بي سي من العربية إلى الإنكليزية، بما في ذلك الترجمات المرافقة والتعليق الصوتي مع مزامنة الكلام.

كما تستخدم شبكة الجزيرة الإعلامية إصدارات متعددة من نظام QATS لمعالجة تقاريرها اليومية باللغة العربية لتحويل الكلام المنطوق فيها إلى نصوص استعداداً لبثها منذ أكثر من عامين. وقد تم حتى اليوم معالجة أكثر من 3 آلاف ساعة باستخدام النظام.

ويشار إلى أن اللغة العربية تتبوأ المركز الرابع ضمن قائمة أكثر اللغات رواجاً في العالم، وهي متداولة في 60 بلداً على الأقل.