25577: تحلیل داده‌های حجیم
نام درس: تحلیل داده‌های حجیم (Massive Data Analysis)
شماره درس: 25577
پیش‌نیاز(ها): -
هم‌نیاز(ها): -
تعداد واحد: 3
مقطع: کارشناسی ارشد
آخرین ویرایش: پاییز 1400

توضیحات:
هدف نهایی از این درس آشنایی با داده‌های حجیم و مولفه‌های آن، داده‌کاوی و نحوه استخراج دانش از داده‌های با حجم و ابعاد بزرگ است. معرفی الگوریتم‌های مختلف خاص پردازش  داده‌های حجیم روی ساختارهای توزیع‌شده و برنامه‌سازی محیط‌های خاص نظیر اسپارک تمرکز اصلی درس را در بر می‌گیرد.
 
سرفصل‌ها:
  • مقدمات معرفی تحلیل داده‌های حجیم
  • ساختارهای MapReduce
  • محیط‌های  نرم‌افزاری Spark and Hadoop
  • اصول داده‌کاوی
  • سامانه‌های توزیع‌شده و فایل سیستم‌های DFS
  • کشف داده‌های مشابه در داده‌های حجیم
  • توابع فاصله حساس به موقعیت (LSH)
  • موارد پرتکرار در داده‌های حجیم
  • مدل سبد بازار و دانش پیشینی
  • پردازش داده‌ای حجیم در حافظه
  • کاهش ابعاد در داده‌های حجیم و الگوریتم‌های آن
  • سامانه‌های توصیه‌گر
  • یادگیری ماشین و داده‌های حجیم
  • داده‌کاوی جریان داده
  • چکیده‌سازی داده و مدل‌های موضوع


مراجع:
  • J. Leskovek et. al, Mining of Massive Datasets, Cambridge University Press, 2020
  • A. Said, Data Science in Practice, Springer, 2019
  • J. Allen, Data Analytics with Spark Using Python, Addison Wesley, 2018


 
آخرین به‌روزرسانی: 5 / 3 / 1403