اصول و تکنیکها در علم داده
Principles and Techniques in Data Science
مقطع: تحصیلات تکمیلی | گرایش: علم داده |
نوع درس: نظری | تعداد واحد: ۳ |
پیشنیاز: – | همنیاز: – |
هدف کلی
هدف این درس، آشنایی دانشجویان با مفاهیم اولیه و ابزارهای موردنیاز برای کار با مسائل مختلف در حوزه علم داده است. برای این منظور، دانشجویان با اصول و گامهای ارائه راهکارهای دادهمحور همچون تحلیل و مصورسازی دادهها، مدلسازی آماری و تصمیمگیری در شرایط نامعین آشنا میشوند و با بهکارگیری این روشها به صورت عملی در مسائل واقعی، با چالشهای بهکارگیری این روشها در دنیای واقعی آشنا میشوند. همچنین دانشجویان با آداب مسائل اخلاقی در حوزه علم داده آشنا میشوند.
سرفصلها
- آشنایی با چرخه عمر علم داده (تولید، جمعآوری و تجمیع دادهها)
- تمیز کردن داده
- تحلیل اکتشافی و مصورسازی داده
- آفتهای تحلیلهای داده (بایاس در دادهها، ناکافی بودن ویژگیها، تشخیص همزمانی از علّیت)
- آشنایی با گامهای مدلسازی (تابع هزینه، یادگیری پارامترهای مدل، پیشبینی، نظریه تصمیم)
- استنتاج آماری، یادگیری مدل به کمک نظریه تخمین، پیشبینی به کمک مدلهای آموزش داده شده
- روشهای دستهبندی و نحوه ارزیابی آنها
- مقدمهای بر MLOps: یادگیری انتهابهانتها، یادگیری مداوم، تغییر داده، تغییر مفهوم، فروشگاه ویژگی، خطلوله
- آداب در علوم داده (مالکیت داده و حریم خصوصی، شفافیت داده، عدم تبعیض و …)
ارزیابی پیشنهادی
- آزمون: آزمونهای میاننیمسال و پایاننیمسال (۴۰ درصد نمره)
- تمرین و پروژه: سه تمرین نظری و عملی و یک پروژه که در طول نیمسال تحویل داده میشوند (۴۰ درصد نمره).
- گزارش پژوهشی: موضوع پژوهش قبل از آزمون پایان نیمسال تعیین میشود. دانشجو کار پژوهش را با کمک استاد درس آغاز کرده و پس از انجام کار، نتیجه پژوهش را در قالب گزارش ارائه میدهد (۲۰ درصد نمره).
منابع پیشنهادی
- J. Grus. Data Science from Scratch. O’Reilly, 2019.
- G. James, D. Witten, T. Hastie, and R. Tibshirani. An Introduction to Statistical Learning. Springer, 2017.
- W. McKinney. Python for Data Analysis. O’Reilly, 2012.
- H. Luegenbiehl and R. Clancy. Global Engineering Ethics. Elsevier, 2017.
- K. Davis. Ethics of Big Data: Balancing risk and innovation. O'Reilly, 2012.