You are not allowed to perform this action
یادگیری ماشین مقیاسپذیر
Scalable Machine Learning
مقطع: تحصیلات تکمیلی | گرایش: علم داده |
نوع درس: نظری | تعداد واحد: ۳ |
پیشنیاز: – | همنیاز: – |
هدف کلی
با توجه به افزایش دادگان حجیم و نیاز بسیاری از مدلهای یادگیری ماشین به دادگان بزرگ برای یادگیری، نیازمند چارچوبهایی هستیم که امکان استفاده از روشهای یادگیری ماشین برای این نوع دادگان را فراهم کند. در این درس، اصول و مفاهیم یادگیری ماشین توزیعشده و موازی و همینطور ابزارهای موجود برای پیادهسازی این مفاهیم را معرفی میکنیم.
سرفصلها
- مفاهیم اولیه محاسبات توزیعشده
- مروری بر Spark و آشنایی با دادگان توزیعشده قابل بازیابی (Resilient Distributed Dataset)
- کاربرد Spark در یادگیری ماشین
- کتابخانه Spark MLlib و پایداری مدل (Model Persistence)
- روشهای یادگیری با ناظر توزیعشده مانند XGBoost توزیعشده
- روشهای بدون ناظر توزیعشده مانند k-means توزیعشده
- تحلیل دادههای مبتنی گراف مقیاسپذیر و آشنایی با GraphX
- روشهای یادگیری متحد (Federated Learning)
- یادگیری ژرف توزیعشده و موازی و Distributed Data Parallel در Pytorch
ارزیابی پیشنهادی
- تمرینهای نظری: ۳ نمره
- آزمونهای میانترم و پایانی: ۱۵ نمره
- آزمونکها: ۲ نمره
منابع پیشنهادی
- B. Quinto. Next-Generation Machine Learning with Spark. Apress, 2020.
- R. Bekkerman, M. Bilenko, and J. Langford. Scaling Up Machine Learning : Parallel and Distributed Approaches. Cambridge University Press, 2012.