أعلنت شركة بايدو Baidu الصينية العاملة ضمن مجال محركات البحث ومتصفحات الأجهزة المحمولة وغيرها من خدمات الويب الأخرى عن إطلاق تطبيق SwiftScribe، وهو تطبيق ويب يعتمد على المتصفح يساعد المستخدم على تدوين التسجيلات الصوتية بسرعة أكبر وذلك باستعمال تقنيات الذكاء الصناعي.
وعملت الشركة الصينية خلال السنوات القليلة الماضية على تحسين برمجيتها المخصصة للتعرف على الكلام المسماة DeepSpeech، وقدمت خلال العام الماضي تطبيق لوحة مفاتيح أندرويد TalkType الذي يستعمل تقنيات DeepSpeech بحيث يستعمل ميزة إدخال الكلام بالمرتبة الأولى والكتابة في المرتبة الثانية.
وتعتمد فكرة لوحة المفاتيح على إمكانية إدخال المعلومات بسرعة أكبر عند نطقها بدلاً من اخيارها أو كتابتها، وتوفر بايدو الآن تطبيق آخر يعتمد على برمجية DeepSpeech، وتعمل العديد من الشركات التقنية مثل أمازون وأبل وغوغل ومايكروسوفت على تطوير تقنيات التعرف على الكلام جنباً إلى جنب مع بايدو.
ويعمل النظام الخاص بتطبيق SwiftScribe على معالجة الملفات من نوع .wav و.mp3 بمجرد تحمليها من قبل المستخدم، حيث بإمكان النظام معالجة الملفات بسرعة، ويمكن للتطبيق التعامل ومعالجة ملفات تصل مدتها إلى ساعة كاملة من الصوت لأي ملف من الملفات المرسلة ضمن مدة زمنية تصل إلى 20 دقيقة.
ويمتلك التطبيق العديد من الخيارات التي يمكن تغييرها والاستفادة منها مثل علامات الترقيم وتغيير الهجاء لبعض الكلمات واختصارات لوحة المفاتيح التي تساعد المستخدم على تغيير سرعة الصوت بشكل اكثر كفاءة، إلى جانب إمكانية إضافة خطوط فاصلة بين المقاطع الصوتية.
ويعتبر تطبيق SwiftScribe المصمم لتدوين الكلام المنطوق مفيداً بشكل كبير للعديد من الأشخاص مثل الصحفيين والمؤرخين الذين تعودوا العمل على أجهزة الحاسب بدلاً من الأجهزة المحمولة.
وتعمل بايدو الصينية على توفير تطبيق SwiftScribe بمثابة خدمة مجانية، وتأمل الشركة مستقبلاً من أن تتمكن من تحويل هذا التطبيق إلى مصدر للعمل والربح، وأن الفريق العامل على التطبيق قد يتمكن مستقبلاً من تعزيز التطبيق عبر إمكانية تدوين الكلام المنطوق ضمن مقاطع الفيديو ودعم المزيد من تنسيقات الملفات وإضافة خيارات أخرى.