You are not allowed to perform this action
سیستمهای چندعاملی
Multi-Agent Systems
مقطع: تحصیلات تکمیلی | گرایش: هوش مصنوعی |
نوع درس: نظری | تعداد واحد: ۳ |
پیشنیاز: – | همنیاز: – |
هدف کلی
هدف این درس آشنا نمودن دانشجویان با مفاهیم و اصول طراحی سامانههای چندعاملی و مکانیزمهای متداول در این حوزه برای درک عاملها از یکدیگر و چگونگی ارتباط و همکاری عاملها باهم در چنین سامانههایی است. همچنین، مطالعه الگوریتمها و رویکردهای برنامهریزی و تخصیص وظیفه چندعاملی و هوش جمعی از اهداف این درس است.
سرفصلها
- مقدمه: معرفی عامل و خودمختاری؛ سیستمهای چندعاملی تعاونی و رقابتی؛ سیستمهای توزیعشده، متمرکز و غیرمتمرکز
- برقراری ارتباط: کنش گفتاری، زبانهای ارتباطی میان عاملها (KQML، FIPA-ACL، JADE و غیره)
- همکاری بین عاملها: حل مسئله تعاونی توزیعشده، اشتراکگذاری وظیقه و نتیجه، مدیریت ناسازگاریها، روشهای ایجاد هماهنگی، برنامهریزی چندعاملی
- تعامل چندعاملی: سودمندی و اولویت، مفهوم و ویژگیهای راهحل، تعامل تعاونی و رقابتی و جمع-صفر، شکلگیری همکاری: دوراهی زندانی، و غیره
- تصمیمگیری گروهی: توابع رفاه و انتخاب اجتماعی، فرایند رایگیری، خواص مطلوب رایگیری، استراتژی دستکاری راهبردی، مذاکره
- تشکیل ائتلاف: بازیهای تعاونی، چالشهای محاسباتی و بازنمایی، بازنمایی ماژولار، بازنمایی بازیهای ساده، بازیهای ائتلافی هدفدار، ایجاد ساختار ائتلاف
- تخصیص منابع: طبقهبندی انواع مزایده، مزایده برای یک منبع، مزایدههای ترکیبی، تعیین برنده
- یادگیری تقویتی چندعاملی (MARL) در بازیها: فرایند عمومی یادگیری، انواع همگرایی، چالشها و انواع الگوریتمهای عامل
- الگوریتمهای پایه MARL: یادگیری عمل مشترک (یادگیری Q کمینه-بیشینه، یادگیری Q نش، یادگیری Q همبسته)، مدلسازی عامل، یادگیری مبتنی بر سیاست
- اشاره مختصری بر روشهای مبتنی بر یادگیری عمیق در MARL
ارزیابی پیشنهادی
- تمرینها و پروژه: ۳۰ درصد نمره
- آزمونهای میانترم و پایانی: ۵۰ درصد نمره
- پروژه پژوهشی: ۲۰ درصد نمره
منابع پیشنهادی
- M. Wooldridge. An Introduction to MultiAgent Systems. 2nd Edition, 2009.
- S. V. Albrecht, F. Christianos, and L. Schäfer. Multi-Agent Reinforcement Learning: Foundations and Modern Approaches. MIT Press, 2024.