پردازش زبانهای طبیعی
Natural Language Processing
مقطع: تحصیلات تکمیلی | گرایش: هوش مصنوعی |
نوع درس: نظری | تعداد واحد: ۳ |
پیشنیاز: – | همنیاز: – |
هدف کلی
هدف این درس آشنا نمودن دانشجویان با روشهای ایجاد توانایی فهم زبان طبیعی در محیط کامپیوتر است. از سیستمهای مبتنی بر پردازش زبان میتوان به سیستمهای پرسش و پاسخ، تحلیل احساس، استخراج اطلاعات، ترجمه ماشینی، و خلاصهسازی متون اشاره کرد. مهمترین گام در راستای طراحی چنین سیستمهایی آشنایی با روشهای پردازش زبان طبیعی است که بیشتر بر مبنای الگوریتمهای آماری عمل میکنند. در این درس، به معرفی روشهای پردازش زبان طبیعی از جمله برچسبزنی اجزای کلام، تجزیه نحوی زبان، تشخیص موجودیتهای نامدار، تحلیل معنایی، برچسبگذاری نقش معنایی، و تشخیص موضوع پرداخته خواهد شد.
سرفصلها
- آشنایی با مفاهیم اولیه پردازش زبان طبیعی
- پیشپردازش متن: واحدسازی، بهنجارسازی، ریشهیابی، بنواژهسازی، تصحیح خطای املایی
- مدلهای زبانی: مدلهای زبانی احتمالاتی و عصبی، ارزیابی مدلهای زبانی
- بازنمایی متن: بازنمایی مبتنی بر واژه، بازنمایی ایستای کلمات مبتنی بر جبر خطی و شبکه عصبی
- دستهبندی و خوشهبندی متن
- مدلسازی دنبالهای متن: مدل مخفی مارکوف، میدان تصادفی شرطی، مدلسازی عصبی دنبالهای
- برچسبزنی اجزای کلام و تشخیص موجودیتهای نامدار
- مدلهای دنبالهبهدنباله: مدلهای کدگذار-کدگشا، مکانیزم توجه، مبدلها
- بازنمایی پویا مبتنی بر بافت و مدلهای زبانی بزرگ
- تجزیه نحوی زبان: تجزیه نحوی و آماری مبتنی بر سازه، تجزیه وابستگی
- تحلیل معنایی متن: رفع ابهام معنایی کلمات، برچسبگذاری نقش معنایی
- سامانههای کاربردی: تحلیل احساس، ترجمه و خلاصهسازی متون، پرسش و پاسخ، سامانههای مکالمهمحور
ارزیابی پیشنهادی
- تمرینها و پروژه: ۲۰ درصد نمره
- آزمونهای میانترم و پایانی: ۷۰ درصد نمره
- پروژه پژوهشی: ۱۰ درصد نمره
منابع پیشنهادی
- D. Jurafsky and J. Martin, Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition. 3rd Edition (draft), 2025.
- Yoav Goldberg. A Primer on Neural Network Models for Natural Language Processing. 2015.