"يوتيوب" تعد بالوصول لميزة الترجمة النصية التلقائية للصوت إلى المستوى البشري
الوسط - المحرر التقني
كشفت منصة مشاركة الفيديوهات المملوكة لشركة غوغل، يوتيوب، عن نيتها إجراء تطويرات مستقبلية في ميزة الترجمة النصية التلقائية التي توفرها بعشر لغات مختلفة.
وقالت ليات كافير، وهي مديرة منتج في غوغل، أن ميزة الترجمة النصية التلقائية للحوار الصوتي في الفيديوهات على منصة يوتيوب قد حققت نجاحا كبيرا خلال السنوات الأخيرة، وأن عدد الفيديوهات التي استخدم فيها الميزة قد تجاوز مليار فيديو.
وأوضحت كافير أن ميزة الترجمة النصية التلقائية للحوار الصوتي قد ساعدت كثير من مستخدمي يوتيوب، سواء من فاقدي حاسة السمع أو من غير المتحدثين للغة الفيديو الأساسية، في معرفة ما يجري في الفيديوهات التي يشاهدونها.
وأكدت كافير، عبر مدونة يوتيوب الرسمية، أن عدد مرات مشاهدة الفيديوهات المصحوبة بترجمة نصية تلقائية للحوار الصوتي يتجاوز 15 مليون مشاهدة كل يوم.
وأضافت أن التقنيات الجديدة التي تم ادخالها على الميزة، والتي تعتمد بشكل أساسي على تقنية التعرف التلقائي على الحوار الصوتي التي طورتها غوغل، قد حسنت من نظام الترجمة النصية التلقائية في يوتيوب بصورة كبيرة.
وكانت غوغل قد أطلقت نظام التعليق النصي على الفيديوهات أول مرة في 2006، قبل أن تدمجه في يوتيوب بشكل مطور نتج عنه ميزة الترجمة النصية التلقائية في عام 2009.
وأشارت كافير إلى أن بفضل تقنيات مثل التعرف التلقائي على الحوار الصوتي ولوغاريتمات تعلم الآلة والبيانات التي يتم تحليلها يوميا لتطوير هذه الميزة، فإنها قد شهدت تحسنا في دقتها لتحليل الحوار الصوتي باللغة الإنجليزية وتحويله لنص بنسبة بلغت 50 في المائة.
وتسعى يوتيوب للوصول بهذه الميزة خلال السنوات المقبلة إلى نسبة خطأ تتساوى مع نسب الخطأ البشرية عند تحويل حوار صوتي إلى ترجمة نصية، معتمدة في ذلك بشكل أساسي على التعلم من التعديلات التي يُدخلها صناع المحتوى لتحسين الترجمة التلقائية على فيديوهاتهم.
يذكر أن ميزة الترجمة النصية التلقائية للحوار الصوتي في فيديوهات يوتيوب متوافرة بعشر لغات مختلفة هم الإنجليزية والألمانية والفرنسية والإسبانية واليابانية والهولندية والإيطالية والكورية والبرتغالية والروسية، وتعد المنصة بتوسيع قاعدة اللغات المدعومة مستقبلا.