مقدمه: ویژگیها و روشهای ذخیرهسازی کلاندادهها، سبک برنامهنویسی کاهش نگاشت.
مسئله استخراج الگوهای پرتکرار: کشف قواعد باهمآیی، الگوریتم apriori، الگوریتمهای تصادفی کشف الگوهای پرتکرار.
مسئله پیدا کردن دادههای مشابه در ابعاد بالا، درهمسازی min-hash، درهمسازی حساس به مکان (LSH)، تحلیل نظری درهمسازی حساس به مکان.
الگوریتمهای پردازش جریان دادهها: نمونهبرداری با نسبت ثابت، نمونهبرداری با اندازه ثابت، پنجره لغزان، الگوریتمهای تقریبی شمارش تعداد بیتهای ۱ در یک جریان داده بیتی.
فیلتر کردن عناصر، شمارش تعداد عناصر متمایز، تخمین انحراف از معیار فرکانس عناصر، و کشف الگوهای پرتکرار در یک جریان داده.
مدلهای یادگیری ماشین برای جریان دادهها: درخت هافدینگ، الگوریتم VFDT، الگوریتم CVFDT
الگوریتمهای کاهش بُعد و تجزیه ماتریسی برای کلاندادهها: تجزیه مقدارهای منفرد SVD، تجزیه CUR.
خوشهبندی دادههای حجیم: معضل ابعاد بالا، خوشهبندی سلسله مراتبی، الگوریتم BFR - الگوریتم CURE.
سیستمهای توصیهگر مقیاسبزرگ: سیستمهای مبتنی بر محتوا، مبتنی بر پیمایش تعاملی، مبتنی بر عوامل پنهان، سیستم توصیهگر شرکت نتفلیکس.
اجمالسازی یا sketching: مبدل subsampled randomized Hadamard، مبدل CountSketch، اجمالسازی برای مسئله رگرسیون حداقل مربعات