جزوه مقدماتی داده کاوی و یادگیری ماشین

بازدید: 5484 بازدید
جزوه مقدماتی داده کاوی و یادگیری ماشین

جزوه مقدماتی داده کاوی و یادگیری ماشین جهاد دانشگاهی صنعتی شریف که توسط دکتر مسعود کاویانی تدریس شده است و مهندس توکلی آن را تهیه و تنظیم کرده است، به صورت PDF از لینک زیر می توانید دانلود کنید.

این جزوه که توسط جناب آقای مسعود کاویانی برای مجموعه نواندیشان ارسال شده است، به صورت دست نویس و با خطی خوانا و کیفیتی خوب در 352 صفحه تهیه شده است که شامل 10 فصل و 79 جلسه بوده و از جزوات خوب و کامل در این زمینه می باشد.

فهرست مطالب جزوه مقدماتی داده کاوی و یادگیری ماشین :

فصل اول:

  • آنالیز داده ها به صورت اکتشافی (Exploratory Data Analysis) چیست؟
  • انواع مختلف داده ها در داده کاوی کدامند؟
  • منظور از داده های مستطیلی (Rectangular Data) چیست؟
  • داده پرت (Outlier) در داده کاوی چیست؟
  • تخمین مکان داده ها (Estimaition of Location) چیست و انواع مختلف آن کدامند؟
  • تخمین تنوع و پراکندگی (Estimation of Variability) و انواع مختلف آن

فصل دوم: جبر خطی مقدماتی یادگیری عمیق و یادگیری ماشین

  • عدد (Scalar)، بردار (Vectors)، ماتریس (Matrix) و تنسور (Tensor) چیست؟
  • نرم (Norm) بردار یا ماتریس چیست؟
  • انواع ماتریس و ویژگی مختلف آنها
  • بردار ویژه (Eigen Vector) و مقدار ویژه (Eigen Value) برای یک ماتریس
  • Singular Value Decomposition یا همان SVD در ماتریس چیست؟
  • ماتریس کواریانس (Covariance) و ماتریس همبستگی (Correlation) چیست؟
  • آنالیز مولفه اصلی (Principal Component Analysis) یا همان PCA چیست؟

فصل سوم: توزیع احتمال و کاربردهای آن

  • متغیر تصادفی (Random Value)، تابع توزیع احتمال (PDF) و تابع توزیع تجمعی (CDF)
  • توزیع نرمال (Normal Distribution) یا توزیع گوسی (Gaussian Distribution)
  • چگونه بفهمیم داده های ما از توزیع نرمال پیروی می کند یا خیر؟
  • توزیع یکنواخت (Uniform Distribution) و کاربردهای آن
  • توزیع برنولی (Bernoulli Distribution) و توزیع دو جمله ای (Binomial Distribution)
  • توزیع پواسون (Poissan Distribution)
  • توزیع نمایی (Exponential Distribution
  • آزمون برازش Chi-Square برای توزیع های احتمال
  • توزیع گاما (Gamma Distribution)

فصل چهارم: انبار داده و کاربردهای آن

  • هوش تجاری (Business Intelligence) چیست؟
  • انبار داده (Data Warehouse) چیست؟
  • مفهوم مکعب داده (Data Cube) در انبار داده ها
  • پردازش تحلیلی برخط یا همان OLAP چیست؟
  • تفاوت OLAP و OLTP چیست؟
  • فرآیند ETL در انبار داده (Extract, Load, Transformation)
  • ELT در انبار داده ها و تفاوت آن با ELT
  • طراحی انبار داده با شمای چندبعدی (Multidimensional Schema)
  • بازار داده (Data Mart) چیست و چه تفاوتی با انبار داده (Data Warehouse) دارد؟
  • دریاچه داده (Data Lake) چیست؟

فصل پنجم: آشنایی با داده کاوی و کاربردهای آن

  • داده کاوی (Data mining) چیست؟
  • یادگیری ماشین (Machine learning) چیست؟
  • طبقه بندی (Classification) چیست؟
  • خوشه بندی (Clustering) چیست؟
  • سیستم توصیه گر (Recommendation System) چیست؟
  • کاربرد داده کاوی و یادگیری ماشین در پردازش متن (Text processing)
  • معرفی چند نرم افزار کاربردی برای عملیات داده کاوی
  • ویژگی (Feature) یا همان بعد (Dimension) در داده کاوی چیست؟
  • تفاوت داده ساختار یافته (Structured) با غیرساختار یافته (Unstructured) چیست؟
  • منظور از متغیر وابسته (Dependent) و مستقل (Independent)
  • مجموعه داده هایی با ابعاد زیاد (High Dimensional)

فصل ششم: آشنایی با روش های پیش پردازش داده ها

  • پیش پردازش داده ها (Data preprocessing) چیست؟
  • بررسی یکپارچگی داده ها (Data Integrity)
  • نرمال کردن داده ها (Data Normalization) و انواع آن
  • تبدیل داده ها (Data Transformation) به فرمت قالب فهم برای الگوریتم داده کاوی
  • داده های گم شده (Missing Values) و راهکارهای مقابله با آنها
  • تشخیص داده های پرت و دارای نویز (Noise) و راهکار مقابله با آنها
  • انتخاب ویژگی (Feature Section) و کاهش ابعاد
  • انتخاب نمونه (Instance Selection) در پیش پردازش داده ها

فصل هفتم: طبقه بندی و الگوریتم های مختلف آن

  • الگوریتم K نزدیک ترین همسایه (KNN)
  • درخت های تصمیم جهت طبقه بندی (Decision Trees)
  • الگوریتم درخت تصمیم ID3 و ساختار Entropy و Gain
  • آشنایی با مفهوم Overfitting و Underfitting در طبقه بندی
  • آشنایی با مفهوم Bias و Variance در طبقه بندی
  • الگوریتم طبقه بندی درخت تصمیم C4.5
  • الگوریتم طبقه بندی درخت تصمیم CART
  • طبقه بندی ترکیبی (Ensemble Classifier) و مبحث Bagging و Boosting
  • الگوریتم جنگل تصادفی (Random Forest)

فصل هشتم: آشنایی با شبکه های عصبی

  • شبکه عصبی (Neural Networks) چیست؟
  • تعریف پرسپترون (Perceptron) در شبکه های عصبی
  • پرسپترون در شبکه عصبی چگونه یاد می گیرد؟
  • پرسپترون چند لایه (Multi layer perceptron) چیست؟
  • درباره توابع فعالسازی پرسپترون و Sigmoid
  • تابع ضرر (Loss Function) در شبکه عصبی چیست و چه کاربردی دارد؟
  • نحوه یادگیری پس از انتشار خطا (Back Propagation) در شبکه های عصبی
  • کاهش گرادیان (Gradient Descent) در شبکه های عصبی

فصل نهم: خوشه بندی و الگوریتم های مختلف آن

  • الگوریتم خوشه بندی KMeans
  • الگوریتم خوشه بندی DBSCAN مبتنی بر غلظت
  • الگوریتم خوشه بندی Meanshift
  • الگوریتم خوشه بندی طیفی (Spectral Clustering)
  • خوشه بندی با Gaussian Mixture Model و الگوریتم EM
  • خوشه بندی سلسله مراتبی (Hierarchical Clustering)

فصل دهم: آشنایی با روش های متن کاوی و پردازش زبان طبیعی

  • متن کاوی (Text Mining) و پردازش زبان طبیعی (NLP) چیست؟
  • ساخت کوله کلمات (Bag of Words) در پیش پردازش متون
  • روش IF IDF برای ساختاردهی به داده های متنی
  • تحلیل احساسات (Sentiment Analysis) در متن کاوی
  • یادگیری عمیق (Deep learning) چیست؟

ارسال کننده: مسعود کاویانی

نام فایل: جزوه مقدماتی داده کاوی و یادگیری ماشین

دانلود فایل: لینک مستقیم

پسورد: www.noandishaan.com

منبع: نواندیشان
مقالات، مطالب، طرح ها و پروژه های خود را برای قرارگیری در سایت علمی آموزشی نواندیشان از اینجا بفرستید.

ادامه مطلب