دادهکاوی
Data Mining
مقطع: کارشناسی | گرایش: نرمافزار |
نوع درس: نظری | تعداد واحد: ۳ |
پیشنیاز: آمار و احتمال مهندسی، جبر خطی | همنیاز: – |
هدف کلی
امروزه در حوزههای مختلف، دادههای متنوعی در دسترس هستند که استخراج اطلاعات مفید از آنها دارای اهمیت زیادی است. درس دادهکاوی روشهایی برای کاوش انواع داده و استخراج دانش از آنها ارائه میدهد. پس از معرفی مسائل مطرح در دادهکاوی، این درس به انواع داده و روشهای آمادهسازی آن، مصورسازی داده، رگرسیون، دستهبندی، خوشهبندی و قواعد باهمآیی میپردازد.
سرفصلها
- معرفی دادهکاوی و مسائل مطرح
- انبار دادهها
- پیشپردازش و آمادهسازی داده: حذف نویز، دادههای پرت، داده گمشده، نمونهبرداری، نرمالسازی، گسستهسازی، کاهش بعد
- انواع معیارهای فاصله و شباهت
- مصورسازی
- رگرسیون: رگرسیون خطی، غیرخطی، چند متغیره، روش نزول گرادیان، روش نزول گرادیان تصادفی
- بیشبرازش، کمبرازش، منظمسازی (Tikhonov, lasso)
- دستهبندی: معرفی، معیارهای ارزیابی، روشهای ارزیابی
- دستهبندی: درخت تصمیم، روش k نزدیکترین همسایه، روشهای بیزی، بیز ساده، ماشین بردار پشتیبان، شبکههای عصبی، روشهای گروهی، جنگل تصادفی
- خوشهبندی: روشهای k میانگین، سلسله مراتبی، مبتنی بر چگالی، فازی، مبتنی بر مدلهای ترکیبی، روش EM، معیارهای ارزیابی خوشهبندی
- قواعد باهمآیی: الگوریتم Apriori، الگوریتم Eclat، الگوریتم FP-Growth، معیارهای ارزیابی قواعد باهمآیی
ارزیابی پیشنهادی
- تمرینها و پروژهها ۲۵٪
- آزمون میانترم ۳۰٪
- آزمون پایانترم ۴۵٪
منابع پیشنهادی
- P. N Tan, M. Steinbach, and V. Kumar. Introduction to Data Mining. 2nd Edition, Pearson, 2018.
- J. Han, M. Kamber, and H. Tong. Data Mining Concepts and Techniques. 4th Edition, Morgan Kaufmann, 2022.
- M. J. Zaki and W. Meira. Data Mining and Analysis: Fundamental Concepts and Algorithms. 2nd Edition, Cambridge University press, 2020.