اصول و تکنیک‌ها در علم داده

Principles and Techniques in Data Science

مقطع: تحصیلات تکمیلی گرایش: علم داده
نوع درس: نظری تعداد واحد: ۳
پیش‌نیاز: – هم‌نیاز: –

هدف کلی

هدف این درس، آشنایی دانشجویان با مفاهیم اولیه و ابزارهای موردنیاز برای کار با مسائل مختلف در حوزه علم داده است. برای این منظور، دانشجویان با اصول و گام‌های ارائه راه‌کارهای داده‌محور هم‌چون تحلیل و مصورسازی داده‌ها، مدل‌سازی آماری و تصمیم‌گیری در شرایط نامعین آشنا می‌شوند و با به‌کارگیری این روش‌ها به صورت عملی در مسائل واقعی، با چالش‌های به‌کارگیری این روش‌ها در دنیای واقعی آشنا می‌شوند. همچنین دانشجویان با آداب مسائل اخلاقی در حوزه علم داده آشنا می‌شوند.

سرفصل‌ها

  1. آشنایی با چرخه عمر علم داده (تولید، جمع‌آوری و تجمیع داده‌ها)
  2. تمیز کردن داده
  3. تحلیل اکتشافی و مصورسازی داده
  4. آفت‌های تحلیل‌های داده (بایاس در داده‌ها، ناکافی بودن ویژگی‌ها، تشخیص همزمانی از علّیت)
  5. آشنایی با گام‌های مدل‌سازی (تابع هزینه، یادگیری پارامترهای مدل، پیش‌بینی، نظریه تصمیم)
  6. استنتاج آماری، یادگیری مدل به کمک نظریه تخمین، پیش‌بینی به کمک مدل‌های آموزش داده شده
  7. روش‌های دسته‌بندی و نحوه ارزیابی آن‌ها
  8. مقدمه‌ای بر MLOps: یادگیری انتهابه‌انتها، یادگیری مداوم، تغییر داده، تغییر مفهوم، فروشگاه ویژگی، خط‌لوله
  9. آداب در علوم داده (مالکیت داده و حریم خصوصی، شفافیت داده، عدم تبعیض و …)

ارزیابی پیشنهادی

  • آزمون: آزمون‌های میان‌نیم‌سال و پایان‌نیم‌سال (۴۰ درصد نمره)
  • تمرین و پروژه: سه تمرین نظری و عملی و یک پروژه که در طول نیم‌سال تحویل داده می‌شوند (۴۰ درصد نمره).
  • گزارش پژوهشی: موضوع پژوهش قبل از آزمون پایان نیم‌سال تعیین می‌شود. دانشجو کار پژوهش را با کمک استاد درس آغاز کرده و پس از انجام کار، نتیجه پژوهش را در قالب گزارش ارائه می‌دهد (۲۰ درصد نمره).

منابع پیشنهادی

  1. J. Grus. Data Science from Scratch. O’Reilly, 2019.
  2. G. James, D. Witten, T. Hastie, and R. Tibshirani. An Introduction to Statistical Learning. Springer, 2017.
  3. W. McKinney. Python for Data Analysis. O’Reilly, 2012.
  4. H. Luegenbiehl and R. Clancy. Global Engineering Ethics. Elsevier, 2017.
  5. K. Davis. Ethics of Big Data: Balancing risk and innovation. O'Reilly, 2012.