داده‌کاوی

Data Mining

مقطع: کارشناسی گرایش: نرم‌افزار
نوع درس: نظری تعداد واحد: ۳
پیش‌نیاز: آمار و احتمال مهندسی، جبر خطی هم‌نیاز: –

هدف کلی

امروزه در حوزه‌های مختلف، داده‌های متنوعی در دسترس هستند که استخراج اطلاعات مفید از آن‌ها دارای اهمیت زیادی است. درس داده‌کاوی روش‌هایی برای کاوش انواع داده و استخراج دانش از آن‌ها ارائه می‌دهد. پس از معرفی مسائل مطرح در داده‌کاوی، این درس به انواع داده و روش‌های آماده‌سازی آن، مصورسازی داده، رگرسیون، دسته‌بندی، خوشه‌بندی و قواعد با‌هم‌آیی می‌پردازد.

سرفصل‌ها

  1. معرفی داده‌کاوی و مسائل مطرح
  2. انبار داده‌ها
  3. پیش‌پردازش و آماده‌سازی داده: حذف نویز، داده‌های پرت، داده گمشده، نمونه‌برداری، نرمال‌سازی، گسسته‌سازی، کاهش بعد
  4. انواع معیارهای فاصله و شباهت
  5. مصورسازی
  6. رگرسیون: رگرسیون خطی، غیرخطی، چند متغیره، روش نزول گرادیان، روش نزول گرادیان تصادفی
  7. بیش‌برازش، کم‌برازش، منظم‌سازی (Tikhonov, lasso)
  8. دسته‌بندی: معرفی، معیارهای ارزیابی، روش‌های ارزیابی
  9. دسته‌بندی: درخت تصمیم، روش k نزدیکترین همسایه، روش‌های بیزی، بیز ساده، ماشین بردار پشتیبان، شبکه‌های عصبی، روش‌های گروهی، جنگل تصادفی
  10. خوشه‌بندی: روش‌های k میانگین، سلسله مراتبی، مبتنی بر چگالی، فازی، مبتنی بر مدل‌های ترکیبی، روش EM، معیارهای ارزیابی خوشه‌بندی
  11. قواعد با‌هم‌آیی: الگوریتم Apriori، الگوریتم Eclat، الگوریتم FP-Growth، معیارهای ارزیابی قواعد باهم‌آیی

ارزیابی پیشنهادی

  • تمرین‌ها و پروژه‌ها ۲۵٪
  • آزمون میان‌ترم ۳۰٪
  • آزمون پایان‌ترم ۴۵٪

منابع پیشنهادی

  1. P. N Tan, M. Steinbach, and V. Kumar. Introduction to Data Mining. 2nd Edition, Pearson, 2018.
  2. J. Han, M. Kamber, and H. Tong. Data Mining Concepts and Techniques. 4th Edition, Morgan Kaufmann, 2022.
  3. M. J. Zaki and W. Meira. Data Mining and Analysis: Fundamental Concepts and Algorithms. 2nd Edition, Cambridge University press, 2020.