یادگیری ماشین قابل اعتماد

Trustworthy Machine Learning

مقطع: تحصیلات تکمیلی گرایش: هوش مصنوعی
نوع درس: نظری تعداد واحد: ۳
پیش‌نیاز: – هم‌نیاز: –

هدف کلی

پیشرفت‌های اخیر در یادگیری ماشین، به ویژه شبکه‌های عصبی عمیق و مدل‌های زبان بزرگ، طراحی و اجرای سیستم‌های تصمیم گیری را متحول کرده است. با این حال، به دلیل ماهیت جعبه سیاه، شکنندگی، و فقدان ضمانت‌های ایمنی، چالش‌های قابل توجهی در پذیرش آن‌ها در کاربردهای حیاتی و بالقوه بالا مانند سیستم‌های مستقل خودران و مراقبت‌های بهداشتی بوجود آورده است. هدف الگوریتم‌های یادگیری ماشین قابل اعتماد ارائه روش‌هایی با هدف دستیابی به تصمیم گیری امن، قابل توضیح، و تصمیم‌گیری منصفانه می‌باشد. مطالب این درس شامل مروری بر تکنیک‌های مدرن یادگیری ماشین (تفسیرپذیری و توضیح‌پذیری) و مسائل مربوط به امنیت، حریم خصوصی و کیفیت داده‌ها، یادگیری ماشینی متخاصم (مانند حملات و دفاع در زمان تصمیم، حملات و دفاع‌های مسموم کننده داده) می‌باشد.

سرفصل‌ها

  1. مقدمه، اهمیت و معرفی چالشها
  2. آموزش مدل‌های مقاوم
  3. قابلیت تعمیم و مقاومت مدل‌ها
  4. یادگیری مدل‌ها با داده‌های نویزی (یادگیری تخاصمی)
  5. مدل‌های تفسیرپذیر
  6. توضیح‌پذیری مدل‌های یادگیری ماشین
  7. حمله‌های امنیتی در مدل‌های یادگیری ماشین
  8. دفاع در مقابل حمله‌ها
  9. ایمنی و قابلیت اتکای مدل‌های هوش مصنوعی
  10. شفافیت، اخلاق و حریم خصوصی
  11. انصاف و عدالت در مدل‌های هوش مصنوعی
  12. اخلاق در هوش مصنوعی

ارزیابی پیشنهادی

  • تمرین‌ها و پروژه: ۳۰ درصد نمره
  • آزمون‌های میان‌ترم و پایانی: ۵۰ درصد نمره
  • پروژه پژوهشی: ۲۰ درصد نمره

منابع پیشنهادی

  1. B. Mucsányi, M. Kirchhof, E. Nguyen, A. Rubinstein, and S. J. Oh. Trustworthy Machine Learning. ebook, 2023.