طورت MIT خوارزمية تزيل الانعكاسات في النوافذ من الصور



إذا ذهبت إلى النافذة وحاولت التقاط صورة من خلال الزجاج ، فسيكون من الصعب تجنب انعكاس شكلك الخاص. سيكون الكائن غير الضروري أكثر وضوحًا ، كلما كانت المساحة خارج النافذة أكثر قتامة. يحل المصورون المحترفون هذه المشكلة عن طريق تقريب عدسة الكاميرا من الزجاج وتطبيق العديد من التقنيات الأخرى ، على سبيل المثال ، المرشحات المستقطبة. ولكن غالبًا ما تكون "عين" الهاتف الذكي متاحة فقط ، أو تكون خيارات التصوير محدودة ، وعليك أن تتحمل وجود الانعكاس. وجد الباحثون في معهد ماساتشوستس للتكنولوجيا حلاً حسابيًا لهذه المشكلة.

وستعرض الخوارزمية في يونيو في مؤتمر حول رؤية الكمبيوتر والتعرف على الأنماط (الكمبيوتر الرؤية والتعرف على الأنماط)، ولكن الآن بعض التفاصيل متوفرة . للعمل ، يتم استخدام حقيقة أن الانعكاسات تتكرر عدة مرات بسبب هيكل النوافذ. استنادًا إلى هذا المبدأ ، يتم تنظيف الصور الرقمية تلقائيًا في مجموعة متنوعة من الحالات.

وفقًا للمؤلف الأول للعمل ، YiChang Shih ، في بوسطن ، غالبًا ما تستخدم النوافذ الزجاجية المزدوجة للاحتفاظ بالحرارة في موسم البرد. لذلك ، عادة ما يتم الحصول على انعكاسين من كل من النظارات. ولكن هذا لا يعني أن الخوارزمية ستعمل فقط للنوافذ المزدوجة ، زجاج سميك واحد يعطي أيضًا انعكاسين: واحد من الداخل ، والثاني من الخارج. بدون توفير معلومات إضافية حول الانعكاس الثاني ، فإن مهمة إزالة العناصر غير الضرورية غير قابلة للتحليل عمليا ، لأن نتيجة الصورة هي مجموع الصورة خارج النافذة والانعكاس في الزجاج. إذا كانت A + B = C ، فسيكون من المستحيل استعادة A و B فقط من C.

يوفر الانعكاس الثاني المعلومات اللازمة لتصحيح الصورة. يجب أن تتطابق قيم وحدات البكسل الانعكاسية الفردية تقريبًا ، وهذا يسهل البحث عن الحل المطلوب ، على الرغم من أن عددها لا يزال كبيرًا. أضاف شي وغيره من مؤلفي العمل - أساتذة علوم الكمبيوتر وهندسة الكمبيوتر Fredo Duran و Bill Freeman (المشرفون العلميون على العمل) و Dilip Krishnan (دكتور العلوم الذي يعمل الآن في Google Research) - إلى الخوارزمية توقع أن كل من التفكير والتأمل والعرض الملتقط من النافذة يحتوي على أنماط إحصائية تسمى صورة طبيعية.

من المفترض أنه في التمثيلات الرسومية غير المتغيرة للعالم على مستوى مجموعات البكسل ، تكون التغييرات اللونية الحادة نادرة ، وإذا حدثت ، ثم داخل حدود واضحة. إذا كانت بعض وحدات البكسل هي الحد بين الكائنات الزرقاء والحمراء ، فمن المتوقع أن يكون للصورة لون أزرق ، وعلى الجانب الآخر - الأحمر. في مجال رؤية الكمبيوتر ، يتم تحقيق ذلك عادة باستخدام مبدأ التدرج ، الذي يميز كل كتلة من وحدات البكسل فيما يتعلق بالاتجاه العام لتغيير اللون وكثافة هذه العملية. لكن شي وزملائه وجدوا أن هذه التقنية في هذه الحالة لا تعمل بشكل جيد للغاية.



لذلك ، أنشأ دانييل زوران من مجموعة فريمان ويائير فايس من الجامعة العبرية في القدس خوارزمية تقسم الصورة إلى مجموعات من كتل 8 × 8 بكسل. لكل مجموعة ، تم إجراء تحليل باستخدام 50 ألف صورة تدريبية ، وعلى أساس البيانات التي تم الحصول عليها ، تم الحصول على طريقة موثوقة لتمييز الانعكاسات من الصور خارج النافذة. لاختبار العمل ، أجرى شي وزملاؤه بحثًا على Google وعلى استضافة فليكر للصور ، وسألوهم عن النموذج "مشاكل في التفكير في النافذة على الصورة". بعد استبعاد النتائج التي لم تكن صورًا في النافذة ، تم جمع 197 صورة. من بين هذه الحالات ، في 96 حالة ، كان التحول بين الصورتين واسعًا بما فيه الكفاية حتى تعمل الخوارزمية.

قال يوآف شيشنر ، أستاذ الهندسة الكهربائية في التخنيون الإسرائيلي ، إن محاولات إزالة مثل هذه العناصر غير الضرورية في الصور تمت من قبل ، لكن بعض الأساليب استخدمت انعكاسًا واحدًا فقط. كانت المهمة معقدة للغاية ، وكان النجاح جزئيًا فقط ، ولم تكن هناك طريقة آلية لفصل الانعكاس عن الصورة المستعادة. يعد عمل شي إنجازًا على عدة جبهات في وقت واحد. يعتقد شيخنر أنه إذا تم تحسين الخوارزمية بمرور الوقت ، فسيتمكن من الدخول إلى حزم معالجة الصور الرقمية الشائعة ومساعدة خوارزميات رؤية الكمبيوتر في الروبوتات. لا يبلغ الباحثون عن إمكانية استخراج صورة المصور من التفكير ، ولكن من المحتمل أن يكون هذا التطبيق ممكنًا. قد يكون هذا الأخير مفيدًا لإنفاذ القانون وللمختلسين.

سيتم تقديم الخوارزمية في يونيو في بوسطن في مؤتمر رؤية الكمبيوتر والتعرف على الأنماط.
الصور: معهد ماساتشوستس للتكنولوجيا .

All Articles