Deep Reinforcement Learning
مقطع: تحصیلات تکمیلی | گرایش: هوش مصنوعی |
نوع درس: نظری | تعداد واحد: ۳ |
پیشنیاز: – | همنیاز: – |
هدف این درس آشنایی با یادگیری تقویتی عمیق است. در این درس ابتدا مدلهای مارکوف معرفی میشوند و سپس روشهای مبتنی بر سیاست، توابع ارزش و عامل و نقاد مورد بررسی قرار میگیرند.