جزوه مقدماتی داده کاوی و یادگیری ماشین (دکتر کاویانی)

جزوه مقدماتی داده کاوی و یادگیری ماشین

تاریخ انتشار: 30 خرداد 1399

بازدید: 7,934 بازدید

جزوه مقدماتی داده کاوی و یادگیری ماشین جهاد دانشگاهی صنعتی شریف که توسط دکتر مسعود کاویانی تدریس شده است و مهندس توکلی آن را تهیه و تنظیم کرده است، به صورت PDF از لینک زیر می توانید دانلود کنید.

این جزوه که توسط جناب آقای مسعود کاویانی برای مجموعه نواندیشان ارسال شده است، به صورت دست نویس و با خطی خوانا و کیفیتی خوب در 352 صفحه تهیه شده است که شامل 10 فصل و 79 جلسه بوده و از جزوات خوب و کامل در این زمینه می باشد.

همچنین بخوانید: جزوه داده کاوی دکتر کاظمی (دانشگاه آزاد قزوین)

فهرست مطالب جزوه مقدماتی داده کاوی و یادگیری ماشین :

فصل اول:

آنالیز داده ها به صورت اکتشافی (Exploratory Data Analysis) چیست؟
انواع مختلف داده ها در داده کاوی کدامند؟
منظور از داده های مستطیلی (Rectangular Data) چیست؟
داده پرت (Outlier) در داده کاوی چیست؟
تخمین مکان داده ها (Estimaition of Location) چیست و انواع مختلف آن کدامند؟
تخمین تنوع و پراکندگی (Estimation of Variability) و انواع مختلف آن

فصل دوم: جبر خطی مقدماتی یادگیری عمیق و یادگیری ماشین

عدد (Scalar)، بردار (Vectors)، ماتریس (Matrix) و تنسور (Tensor) چیست؟
نرم (Norm) بردار یا ماتریس چیست؟
انواع ماتریس و ویژگی مختلف آنها
بردار ویژه (Eigen Vector) و مقدار ویژه (Eigen Value) برای یک ماتریس
Singular Value Decomposition یا همان SVD در ماتریس چیست؟
ماتریس کواریانس (Covariance) و ماتریس همبستگی (Correlation) چیست؟
آنالیز مولفه اصلی (Principal Component Analysis) یا همان PCA چیست؟

فصل سوم: توزیع احتمال و کاربردهای آن

متغیر تصادفی (Random Value)، تابع توزیع احتمال (PDF) و تابع توزیع تجمعی (CDF)
توزیع نرمال (Normal Distribution) یا توزیع گوسی (Gaussian Distribution)
چگونه بفهمیم داده های ما از توزیع نرمال پیروی می کند یا خیر؟
توزیع یکنواخت (Uniform Distribution) و کاربردهای آن
توزیع برنولی (Bernoulli Distribution) و توزیع دو جمله ای (Binomial Distribution)
توزیع پواسون (Poissan Distribution)
توزیع نمایی (Exponential Distribution
آزمون برازش Chi-Square برای توزیع های احتمال
توزیع گاما (Gamma Distribution)

فصل چهارم: انبار داده و کاربردهای آن

هوش تجاری (Business Intelligence) چیست؟
انبار داده (Data Warehouse) چیست؟
مفهوم مکعب داده (Data Cube) در انبار داده ها
پردازش تحلیلی برخط یا همان OLAP چیست؟
تفاوت OLAP و OLTP چیست؟
فرآیند ETL در انبار داده (Extract, Load, Transformation)
ELT در انبار داده ها و تفاوت آن با ELT
طراحی انبار داده با شمای چندبعدی (Multidimensional Schema)
بازار داده (Data Mart) چیست و چه تفاوتی با انبار داده (Data Warehouse) دارد؟
دریاچه داده (Data Lake) چیست؟

فصل پنجم: آشنایی با داده کاوی و کاربردهای آن

داده کاوی (Data mining) چیست؟
یادگیری ماشین (Machine learning) چیست؟
طبقه بندی (Classification) چیست؟
خوشه بندی (Clustering) چیست؟
سیستم توصیه گر (Recommendation System) چیست؟
کاربرد داده کاوی و یادگیری ماشین در پردازش متن (Text processing)
معرفی چند نرم افزار کاربردی برای عملیات داده کاوی
ویژگی (Feature) یا همان بعد (Dimension) در داده کاوی چیست؟
تفاوت داده ساختار یافته (Structured) با غیرساختار یافته (Unstructured) چیست؟
منظور از متغیر وابسته (Dependent) و مستقل (Independent)
مجموعه داده هایی با ابعاد زیاد (High Dimensional)

فصل ششم: آشنایی با روش های پیش پردازش داده ها

پیش پردازش داده ها (Data preprocessing) چیست؟
بررسی یکپارچگی داده ها (Data Integrity)
نرمال کردن داده ها (Data Normalization) و انواع آن
تبدیل داده ها (Data Transformation) به فرمت قالب فهم برای الگوریتم داده کاوی
داده های گم شده (Missing Values) و راهکارهای مقابله با آنها
تشخیص داده های پرت و دارای نویز (Noise) و راهکار مقابله با آنها
انتخاب ویژگی (Feature Section) و کاهش ابعاد
انتخاب نمونه (Instance Selection) در پیش پردازش داده ها

فصل هفتم: طبقه بندی و الگوریتم های مختلف آن

الگوریتم K نزدیک ترین همسایه (KNN)
درخت های تصمیم جهت طبقه بندی (Decision Trees)
الگوریتم درخت تصمیم ID3 و ساختار Entropy و Gain
آشنایی با مفهوم Overfitting و Underfitting در طبقه بندی
آشنایی با مفهوم Bias و Variance در طبقه بندی
الگوریتم طبقه بندی درخت تصمیم C4.5
الگوریتم طبقه بندی درخت تصمیم CART
طبقه بندی ترکیبی (Ensemble Classifier) و مبحث Bagging و Boosting
الگوریتم جنگل تصادفی (Random Forest)

فصل هشتم: آشنایی با شبکه های عصبی

شبکه عصبی (Neural Networks) چیست؟
تعریف پرسپترون (Perceptron) در شبکه های عصبی
پرسپترون در شبکه عصبی چگونه یاد می گیرد؟
پرسپترون چند لایه (Multi layer perceptron) چیست؟
درباره توابع فعالسازی پرسپترون و Sigmoid
تابع ضرر (Loss Function) در شبکه عصبی چیست و چه کاربردی دارد؟
نحوه یادگیری پس از انتشار خطا (Back Propagation) در شبکه های عصبی
کاهش گرادیان (Gradient Descent) در شبکه های عصبی

فصل نهم: خوشه بندی و الگوریتم های مختلف آن

الگوریتم خوشه بندی KMeans
الگوریتم خوشه بندی DBSCAN مبتنی بر غلظت
الگوریتم خوشه بندی Meanshift
الگوریتم خوشه بندی طیفی (Spectral Clustering)
خوشه بندی با Gaussian Mixture Model و الگوریتم EM
خوشه بندی سلسله مراتبی (Hierarchical Clustering)

فصل دهم: آشنایی با روش های متن کاوی و پردازش زبان طبیعی

متن کاوی (Text Mining) و پردازش زبان طبیعی (NLP) چیست؟
ساخت کوله کلمات (Bag of Words) در پیش پردازش متون
روش IF IDF برای ساختاردهی به داده های متنی
تحلیل احساسات (Sentiment Analysis) در متن کاوی
یادگیری عمیق (Deep learning) چیست؟

ارسال کننده: مسعود کاویانی

نام فایل: جزوه مقدماتی داده کاوی و یادگیری ماشین

دانلود فایل: لینک مستقیم

پسورد: www.noandishaan.com

منبع: نواندیشان

مقالات، مطالب، طرح ها و پروژه های خود را برای قرارگیری در سایت علمی آموزشی نواندیشان از اینجا بفرستید.

ادامه مطلب

نوشته قبلی

جزوه روانشناسی یادگیری دانشگاه پیام نور

نوشته بعدی

جزوه علم مواد 2 دانشگاه صنعتی اصفهان

2 دیدگاه در “جزوه مقدماتی داده کاوی و یادگیری ماشین”

989135322403 گفت:

خرداد 1, 1402 در 3:15 ب.ظ

سلام لطفا جگونگي ارسال جزوه هاي موردنظررا بفرماييد

پاسخ
1. نواندیشانمدیر سایت گفت:
  
  خرداد 1, 1402 در 3:27 ب.ظ
  
  با کلیک روی لینک داده شده وارد صفحه دانلود فایل شده و میتونید دانلود کنید.
  
  پاسخ

دیدگاهتان را بنویسید

جزوه مقدماتی داده کاوی و یادگیری ماشین