یادگیری تقویتی عمیق
Deep Reinforcement Learning
مقطع: تحصیلات تکمیلی | گرایش: هوش مصنوعی |
نوع درس: نظری | تعداد واحد: ۳ |
پیشنیاز: – | همنیاز: – |
هدف کلی
هدف این درس آشنایی با یادگیری تقویتی عمیق است. در این درس ابتدا مدلهای مارکوف معرفی میشوند و سپس روشهای مبتنی بر سیاست، توابع ارزش و عامل و نقاد مورد بررسی قرار میگیرند.
سرفصلها
- تئوری مارکوف
- یادگیری تقلیدی
- چارچوب یادگیری تقویتی عمیق
- یادگیری تقویتی عمیق مبتنی بر سیاست
- یادگیری تقویتی عمیق مبتنی بر عامل و نقاد
- یادگیری تقویتی عمیق مبتنی بر توابع ارزش
- یادگیری تقویتی عمیق مبتنی بر مدل
- روشهای اکتشاف در یادگیری تقویتی عمیق
- یادگیری تقویتی عمیق معکوس
- یادگیری تقویتی عمیق غیر برخط
ارزیابی پیشنهادی
- تمرینها و پروژه: ۳۰ درصد نمره
- آزمونهای میانترم و پایانی: ۵۰ درصد نمره
- پروژه پژوهشی: ۲۰ درصد نمره
منابع پیشنهادی
- R. S. Sutton and A. G. Barto. Reinforcement Learning: An Introduction. 2nd ed., The MIT Press 2018.
- S. Ravichandiran. Deep Reinforcement Learning with Python. 2nd ed., Packt Publishing 2020.