یادگیری ماشین قابل اعتماد
Trustworthy Machine Learning
مقطع: تحصیلات تکمیلی | گرایش: هوش مصنوعی |
نوع درس: نظری | تعداد واحد: ۳ |
پیشنیاز: – | همنیاز: – |
هدف کلی
پیشرفتهای اخیر در یادگیری ماشین، به ویژه شبکههای عصبی عمیق و مدلهای زبان بزرگ، طراحی و اجرای سیستمهای تصمیم گیری را متحول کرده است. با این حال، به دلیل ماهیت جعبه سیاه، شکنندگی، و فقدان ضمانتهای ایمنی، چالشهای قابل توجهی در پذیرش آنها در کاربردهای حیاتی و بالقوه بالا مانند سیستمهای مستقل خودران و مراقبتهای بهداشتی بوجود آورده است. هدف الگوریتمهای یادگیری ماشین قابل اعتماد ارائه روشهایی با هدف دستیابی به تصمیم گیری امن، قابل توضیح، و تصمیمگیری منصفانه میباشد. مطالب این درس شامل مروری بر تکنیکهای مدرن یادگیری ماشین (تفسیرپذیری و توضیحپذیری) و مسائل مربوط به امنیت، حریم خصوصی و کیفیت دادهها، یادگیری ماشینی متخاصم (مانند حملات و دفاع در زمان تصمیم، حملات و دفاعهای مسموم کننده داده) میباشد.
سرفصلها
- مقدمه، اهمیت و معرفی چالشها
- آموزش مدلهای مقاوم
- قابلیت تعمیم و مقاومت مدلها
- یادگیری مدلها با دادههای نویزی (یادگیری تخاصمی)
- مدلهای تفسیرپذیر
- توضیحپذیری مدلهای یادگیری ماشین
- حملههای امنیتی در مدلهای یادگیری ماشین
- دفاع در مقابل حملهها
- ایمنی و قابلیت اتکای مدلهای هوش مصنوعی
- شفافیت، اخلاق و حریم خصوصی
- انصاف و عدالت در مدلهای هوش مصنوعی
- اخلاق در هوش مصنوعی
ارزیابی پیشنهادی
- تمرینها و پروژه: ۳۰ درصد نمره
- آزمونهای میانترم و پایانی: ۵۰ درصد نمره
- پروژه پژوهشی: ۲۰ درصد نمره
منابع پیشنهادی
- B. Mucsányi, M. Kirchhof, E. Nguyen, A. Rubinstein, and S. J. Oh. Trustworthy Machine Learning. ebook, 2023.