14‏/09‏/2018

فيسبوك يطور نظام ذكاء اصطناعي يمكنه فهم النص في الصور ومقاطع الفيديو

تعمل منصة فيسبوك على تطوير نظام ذكاء اصطناعي يُمكن من خلاله التعرف على النصوص الموجود على الصور الهزلية المُضحكة التي تُستخدم في التعليقات والمعروفة باسم Memes، ومقاطع الفيديو، حيث يعد فهم النص الذي يظهر على الصور أمرًا مهمًا لتحسين تجارب البحث عن الصور الأكثر ملاءمة، كما يساعد أيضًا على تحديد المحتوى غير الملائم أو المسيء.
فيسبوك يطور نظام ذكاء اصطناعي يمكنه فهم النص في الصور ومقاطع الفيديو

جاء بمنشور الإعلان عن النظام عبر مدونة فيسبوك أن النظام الذي تم بناؤه يُسمى روزيتا Rosetta، يعتمد على تقنيات التعلم الآلي لتحديد النصوص في الصور ومقاطع الفيديو من خلال مجموعة واسعة من اللغات، ثم يدخلها في نموذج التعرف على النص الذي تم تدريبه على المصنفات لفهم سياق النص والصورة معا، وعلى وجه الخصوص يجد فيسبوك أن هذه الأداة ستكون أكثر إفادة في تحديد النص الموجود على صور التعليقات Memes، التي انتشرت بصورة كبيرة على فيسبوك وأغلب مواقع التواصل الاجتماعي، وقد تستخدم لأغراض الفكاهة والردود الساخرة بين الأصدقاء، وأحيانًا تكون ذات محتوى يشجع على العنف أو خطابات الكراهية وهو ما تستهدفه الشركة بشكل خاص.

الجدير بالذكر أن أدوات التعرف على النصوص ليست جديدة، ولكن فيسبوك يواجه تحديات مختلفة بسبب حجم منصته وتنوع الصور عليها بالإضافة للحجم الهائل من الصور التي تتم مشاركتها كل يوم، حيث يحتوي عدد كبير من الصور التي يتم نشرها ومشاركتها على فيسبوك وإنستاجرم على نصوص بأشكال مختلفة، ومشكلة فهم النص في الصور تختلف تمامًا عن تلك التي يتم حلها بواسطة الأحرف البصرية التقليدية مثل أنظمة التعرف على الحروف (OCR)، والتي تتعرف على الأحرف ولكن لا تفهم سياق الصورة المرتبطة بها.

يتركز عمل نظام روزيتا Rosetta حاليًا على استخراج النصوص من مليار صورة ومقطع فيديو يومياً عبر منصتي فيسبوك وإنستاجرام، وتحديد ماهية النصوص.

في الوقت الحالي ليس من الواضح تمامًا ما يفعله فيسبوك بالبيانات، ومن الواضح أنه سيكون مفيدًا للميزات الأساسية مثل البحث عن الصور وقارئات الشاشة، حسبما جاء بمشاركة المدونة. ولكن يبدو أيضًا أن منصة فيسبوك بدأت تضعه في اتجاه تحقيق أهداف أكبر بكثير مثل معرفة ما هو مثير للاهتمام لوضعه في خلاصة الأخبار بناء على ميول المستخدمين، والأهم من ذلك معرفة صور التعليقات Memes المسيئة والتي تعمل على انتشار خطاب الكراهية والعنف.

كما ذكرت الشركة أن استخدام تقنيات التعلم الآلي في استخراج النصوص من الصور ومقاطع الفيديو سيساعد في تحديد المحتوى الذي يحض على الكراهية والعنف حيث أنه متوفر بعدة لغات مختلفة، وبذلك سيتمكن النظام من الإبلاغ تلقائيًا عن الصور التي يمكن أن تسبب مشاكل، مقدماً بذلك مساعدة كبيرة لفيسبوك في السيطرة على المحتوى المسيء وتجنب المشاكل التي تعانيه منه.