بینایی کامپیوتر
Computer Vision
مقطع: تحصیلات تکمیلی | گرایش: هوش مصنوعی |
نوع درس: نظری | تعداد واحد: ۳ |
پیشنیاز: – | همنیاز: – |
هدف کلی
هدف این درس آشنا نمودن دانشجویان با مفاهیم و اصول تحلیل تصویر و فیلم بهمنظور درک این رسانهها توسط کامپیوتر است. در این درس تأکید بر روی روشهای سنتی حل مسائل بینایی و درک اصول مطرح است. این دانش در ایجاد سیستمهای بینا و حل هوشمند انواع مسائل کاربرد دارد. روشهای جدیدتر حل مسائل بینایی با یادگیری عمیق نیز در انتهای نیمسال بهطور مختصر مورد اشاره قرار میگیرند.
سرفصلها
- مقدمات: تعریف بینایی کامپیوتر و کاربردها، تصاویر رقمی، نورپردازی، تصویربرداری، نمونهبرداری، چینش و چندیسازی
- پیشپردازش: مناسبسازی تصویر با عملیات نقطهای، محلی، یا سراسری، نویز و حذف آن در حوزه مکان، افزایش وضوح
- ناحیهبندی تصویر بر مبنای لبهها: تعریف لبه، تشخیص لبه، آستانهسازی لبهها، تعیین مرز اشیاء، تبدیل هاف، کانتور فعال
- ناحیهبندی بر مبنای ناحیه: روشهای رشد ناحیه و تقسیم و ترکیب، معرفی بافت، خوشهبندی نقاط با ویژگیهای بافت
- ناحیهبندی بر مبنای آستانهسازی سطوح خاکستری: نیمآستانهسازی، آستانهسازی باند، آستانهسازی تکراری، روش آتسو
- ارائه نواحی: ارائه با توصیف پیرامون، توصیف ناحیه و ویژگیهای هندسی
- تشخیص نقاط کلیدی: لاپلاسین گاسین، تفاضل گاسینها، ماتریس هسین، اپراتورهای مراوک، هریس و فست
- توصیف و تطبیق نقاط کلیدی: ویژگیهای سیفت، سرف، هاگ، ال بی پی، و فریک، الگوریتم رنسک
- مقدمهای بر بینایی سه بعدی: عمق سنجی با روشهای فعال، حسگر کینکت، روشهای غیرفعال
- تحلیل حرکت با روش تفاضلی، تشخیص نقاط کلیدی، و شار نوری
- روشهای اولیه ردیابی، ردیابی با تطبیق، ردیابی با فیلتر کالمن و فیلتر ذره
- مقدمهای بر یادگیری عمیق در بینایی کامپیوتر: شبکه پیچشی، کاربردهای نمونه
ارزیابی پیشنهادی
- تمرینها و پروژهها: ۵۰ درصد نمره
- آزمون پایانی: ۳۰ درصد نمره
- پروژه مطالعاتی: ۲۰ درصد نمره
منابع پیشنهادی
- D. A. Forsyth and J. Ponce. Machine Vision: A Modern Approach. 2nd Edition, Prentice-Hall, 2012.
- E. Trucco and A. Verri. Introductory Techniques for 3D Computer Vision. Prentice-Hall, 1998.
- R. Szeliski. Computer Vision: Algorithms and Applications. 2nd Edition, Springer, 2022.
- M. Sonka, V. Hlavac, and R. Boyle. Image Processing, Analysis and Machine Vision. Chapman & Hall, 1993.