تحويل صفة صورة غير مرتبط بمقياس

تحويل صفة صورة غير مرتبط بمقياس أو Scale-invariant feature transform, SIFT هي خوارزمية في مجال الرؤية الحاسوبية طورها البروفيسور الكندي ديفيد لو في عام 1999. و تعتبر من أهم الخوارزميات المستخدمة لأغراض التعرف على الاجسام و البحث عن الصور ضمن خدمة الجوجل. كما تستعمل لربط مجموعة من الصور المتداخلة لتكوين صورة بانوراما من خلال تحديد نقاط في الصور المراد مقارنتها. كل نقطة توصف بشعاع مؤلف من 128 مركبة, و يتم حساب التشابه بين نقطتين بواسطة المسافة الاقليدية بين شعاعيهما. تتسم هذه الميزات بانها غير مرتبطة بالتحويلات الهندسية Geometry Transformations للصورة كالدوران Rotation و التدرج Scaling ( التصغير و التكبير) و التي تنجم عن دوران آلة التصوير أو تغير نقطة التقاط الصورة viewpoint, كما أنها غير مرتبطة بشكل جزئي بالتحويلات الضوئية Photogrammetry Transformations كتغير التمايز Contrast أو السطوع Brightness و التي تنجم على سبيل المثال بسبب عمل آلة التصوير في اوقات مختلفة (ليل أو نهار) أو تحت طقس مختلف ( غائم أو مشمس و غير ذلك).

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

الخوارزمية

تتألف الخوارزمية من أربع مراحل رئيسية

اكتشاف النقاط المميزة في الصورة Keypoints و التي ستشكل المراكز للصفات المرشحة

يتم تحويل الصورة المراد معالجتها الي صورة اسود و أبيض فيما إذا كانت ملونة ثم يتم تمثيلها بارقام حقيقية بحيث تصبح قيم البكسل محصورة ضمن المجال (0-1) بدلا من المجال (0-255) لكي يمكن ترشيحها بواسطة مرشح غاوص. تطوى الصورة الناتجة مع مرشح غاوص بشكل متكرر أربع مرات على الأقل لكي تكون مجموعة من الصور لها ذات الابعاد تدعى الاوكتاف الأول. ثم تصغر الصورة الأخيرة بمعامل 2 عن طريق حذف كل ثاني سطر و كل ثاني عمود ثم تطوى هذه الصورة المصغرة مع مرشح غاوص بنفس العدد في المرة الأولى بحيث نحصل على الاوكتاف الثاني و هكذا يكرر التصغير و الطي حتى تبلغ ابعاد الصورة حدا معينا لم تعد معه تضهر أي تفاصيل واضحة مهمة. حالما تنتهي هذة العملية نحصل على ما يدعي الهرم الغاوصي Gaussian Pyramid الذي يمكن تمثيله رياضيا بدالة ثلاثية المتحولات يرمز له بـ   , حيث تشير كل من x , y الي إحداثيات النقطة في الصورة اما   فهي الانحراف المعياري لمرشح غوص و الذي يتغير من صورة إلى صورة ضمن الهرم بسبب الطي المتكرر. لتفسير ذلك نفترض انه لدينا صورة   نريد ترشيحهاباستخدام مرشح غاوص   ذو انحراف معياري   نحصل على صورة جديدة مرشحة كما هو موضح في العلاقة التالية   و إذا تكرر الترشيح بنفس المرشح نحصل على صورة ثالثة     و من المعلوم ان   و بالتعويض في العلاقة التي قبلها نجد   الأمر الذي يفسر تغير الانحراف المعياري بسبب الطي التكرر. انطلاقا من الهرم الغاوصي و من خلال طرح كل صورتين متجاورتين من كل اوكتاف نحصل على ما يدعى هرم الفرق الغاوصي Difference of Gaussian Pyramid DoG. الذي يرمز له بـ     حيث يدل الرمز   على تغير الانحراف المعياري من صورة لأخرى بسبب الطي المتكرر. انطلاقا من هرم الفرق الغاوصي يتم تحديد مواقع البكسلات ذات القيم المتطرفة ( العظمى و الصغرى) عن طريق مقارنة قيمتها مع قيم جيرانها الثمانية في نفس الصورة و قيم جيرانها التسعة الموجودة في الصورة التي من فوقها و التسعة التي من تحتها ضمن كل اوكتاف, إذا كانت أكبر أو اصغر من كل الـ 26 بكسل المحيطة بها يتم تعليم هذه النقطة كمركز لصفة محتملة.

ايجاد المواقع الدقيقة للصفات و حذف النقاط غير المستقرة

حساب اتجاه محلي لكل نقطة متبقية من المرحلة السابقة

توصيف النقطة بشعاع مؤلف من 128 مركبة من خلال المنطقة الدائرية المحيطة بها

مراجع خارجية