كشفت شركة غوغل عن انها تعمل على الجمع بين تقنيات التعلم العميق الذكي وخدمة التجوال الافتراضي خاصتها Street View ثلاثي الأبعاد لتسهيل عملية تحديد عناوين جديدة لخرائط غوغل مابس تلقائياً، بحيث يمكن لخدمة التجوال الافتراضي استخراج أسماء الشوارع والأرقام والأنشطة التجارية للحفاظ على الخرائط محدثة.
وتعتمد خدمة التجوال الافتراضي من غوغل على سيارات ستريت فيو Street View المجهزة بكاميرا 360 درجة، حيث تتنقل تلك السيارات خلال السنوات القليلة الماضية ضمن مختلف البلدات والمناطق الرئيسية والطرقات في البلاد لالتقاط كل شئ من واجهات المتاجر والمعالم الأثرية إلى المتنزهات والأزقة.
وتعمل الكاميرا على تجميع الصور من العالم الحقيقي لاستكمال خرائط غوغل، كما يمكنها ايضاً استخراج معلومات إضافية من الصور بما في ذلك أرقام وأسماء الشوارع، وذلك في سبيل تحسين البيانات المتاحة ضمن الخرائط، وهناك عوامل عديدة مثل الإضاءة والزوايا والتشوهات والخلفيات المتشابكة أن تجعل من الصعوبة بمكان على الآلة تحديد الأسماء والأرقام بشكل صحيح.
وقد اعتمدت الشركة على عدد من المنهجيات للمساعدة في تحسين البيانات التي تم التقاطها من صور التجوال ثلاثي الأبعاد، بما في ذلك ريكابتشا ReCAPTCHA، والتي تتضمن الاستعانة بالمصادر البشرية من أجل المساعدة في تحديد محتوى الصورة.
وتحولت الشركة في الآونة الأخيرة إلى الاستعانة بالشبكات العصبية العميقة لأتمتة عملية قراءة محتوى الصور، وقد حققت أحدث خوارزمياتها درجة دقة بلغت 84.2 فيما يخص بيانات علامات أسماء الشوارع الفرنسية FSNS، بحيث انها تتفوق بشكل ملحوظ على أحدث الأنظمة الحديثة.
وتستعمل غوغل الشبكات العصبية في خدمة ستريت فيو لإخفاء لوحات السيارات والوجوه، وتستعمل الشركة منهجيات مماثلة من أجل استخراج معلومات مفيدة مثل أرقام الشوارع، والتي تقول غوغل انها استخدمتها لتحسين بيانات الموقع الجغرافي فيما يخص ثلث العناوين عالمياً.
وتعمل الشركة على توسيع النظام ليشمل أسماء الشوارع أيضاً، وذلك لأن العناوين لا تتكون فقط من الأرقام، ويمكن للنظام استبدال الاختصارات بأسماء اكلمة وتجاهل أي نص غير ذي صلة داخل الصورة، كما يعمل هذا النظام الآلي على تعزيز القدرة على رسم خرائط الشوارع الجديدة وإضافة المباني غير الموجودة إلى الخرائط الرسمية للمدينة.