25577: تحلیل دادههای حجیم
نام درس: تحلیل دادههای حجیم (Massive Data Analysis)
شماره درس: 25577
پیشنیاز(ها): -
همنیاز(ها): -
تعداد واحد: 3
مقطع: کارشناسی ارشد
آخرین ویرایش: پاییز 1400
توضیحات:
سرفصلها:
مراجع:
شماره درس: 25577
پیشنیاز(ها): -
همنیاز(ها): -
تعداد واحد: 3
مقطع: کارشناسی ارشد
آخرین ویرایش: پاییز 1400
توضیحات:
هدف نهایی از این درس آشنایی با دادههای حجیم و مولفههای آن، دادهکاوی و نحوه استخراج دانش از دادههای با حجم و ابعاد بزرگ است. معرفی الگوریتمهای مختلف خاص پردازش دادههای حجیم روی ساختارهای توزیعشده و برنامهسازی محیطهای خاص نظیر اسپارک تمرکز اصلی درس را در بر میگیرد.
سرفصلها:
- مقدمات معرفی تحلیل دادههای حجیم
- ساختارهای MapReduce
- محیطهای نرمافزاری Spark and Hadoop
- اصول دادهکاوی
- سامانههای توزیعشده و فایل سیستمهای DFS
- کشف دادههای مشابه در دادههای حجیم
- توابع فاصله حساس به موقعیت (LSH)
- موارد پرتکرار در دادههای حجیم
- مدل سبد بازار و دانش پیشینی
- پردازش دادهای حجیم در حافظه
- کاهش ابعاد در دادههای حجیم و الگوریتمهای آن
- سامانههای توصیهگر
- یادگیری ماشین و دادههای حجیم
- دادهکاوی جریان داده
- چکیدهسازی داده و مدلهای موضوع
مراجع:
- J. Leskovek et. al, Mining of Massive Datasets, Cambridge University Press, 2020
- A. Said, Data Science in Practice, Springer, 2019
- J. Allen, Data Analytics with Spark Using Python, Addison Wesley, 2018
آخرین بهروزرسانی: 5 / 3 / 1403