آموزش آمار برای علم داده و یادگیری ماشین با پایتون - آخرین آپدیت

دانلود Statistics For Data Science and Machine Learning with Python

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:

آمار کاربردی با پایتون برای علم داده و یادگیری ماشین: مدل‌سازی آماری با استفاده از Sci-kit Learn و Scipy

در این دوره چه چیزی خواهید آموخت؟

  • استفاده از تحلیل اکتشافی داده (EDA) در علم داده.
  • رایج‌ترین انواع داده مانند داده‌های پیوسته و دسته‌بندی‌شده.
  • معیارهای گرایش مرکزی و معیارهای پراکندگی در آمار.
  • مفاهیم داده‌های جامعه آماری در مقابل داده‌های نمونه.
  • مفهوم نمونه‌گیری تصادفی و تأثیر آن بر تحلیل داده.
  • آشنایی با داده‌های پرت (Outliers) و خطاهای نمونه‌گیری و ارتباط آن‌ها با تحلیل داده.
  • نحوه بصری‌سازی توزیع داده‌ها با استفاده از نمودارهای جعبه‌ای (Boxplots)، ویولن (Violin plots)، هیستوگرام (Histograms) و نمودارهای چگالی (Density plots).
  • نحوه بصری‌سازی داده‌های دسته‌بندی‌شده با استفاده از نمودارهای میله‌ای (Bar plots) و دایره‌ای (Pie charts).
  • محاسبه همبستگی (Correlation) و کوواریانس (Covariance) بین ویژگی‌ها در مجموعه داده.
  • بصری‌سازی ماتریس همبستگی با استفاده از نقشه‌های حرارتی (Heat Maps).
  • رایج‌ترین توزیع‌های احتمالی مانند توزیع نرمال و توزیع دوجمله‌ای.
  • نحوه انجام آزمون‌های نرمالیتی برای بررسی انحراف از نرمال بودن.
  • نحوه تست توزیع‌های کج (Skewed) در داده‌های واقعی.
  • نحوه استانداردسازی (Standardize) و نرمال‌سازی (Normalize) داده‌ها برای داشتن مقیاس یکسان.
  • نحوه تبدیل داده‌های کج به توزیع نرمال با استفاده از روش‌های تبدیل مختلف مانند تبدیل لگاریتمی، ریشه دوم و تبدیل توانی.
  • نحوه محاسبه فواصل اطمینان (Confidence Intervals) برای تخمین‌های آماری مانند دقت مدل.
  • یادگیری بوت‌استرپینگ (Bootstrapping) در آمار و نحوه استفاده از آن در یادگیری ماشین.
  • نحوه ارزیابی مدل‌های یادگیری ماشین.
  • درک عملی مفاهیم بایاس (Bias) و واریانس (Variance) در مدل‌سازی داده.
  • درک مفهوم Underfitting و Overfitting در یادگیری ماشین و مدل‌سازی آماری.
  • رایج‌ترین معیارهای ارزیابی برای مدل‌های رگرسیون در یادگیری ماشین.
  • معیارهای ارزیابی برای مدل‌های طبقه‌بندی.
  • نحوه اعتبارسنجی مدل‌های پیش‌بینی‌کننده یادگیری ماشین مانند مدل‌های رگرسیون و طبقه‌بندی.
  • نحوه استفاده از تکنیک‌های اعتبارسنجی مختلف برای یادگیری ماشین مانند اعتبارسنجی Hold-out و اعتبارسنجی متقابل (Cross-validation).

پیش‌نیازها:

هیچ پیش‌زمینه‌ای در آمار نیاز نیست؛ همه چیز در این دوره توضیح داده خواهد شد. آشنایی اولیه با پایتون مفید است.

این دوره برای شما ایده‌آل است اگر می‌خواهید در روش‌های آماری مورد نیاز برای علم داده (Data Science) و یادگیری ماشین (Machine Learning) دانش کسب کنید!

یادگیری آمار بخش ضروری تبدیل شدن به یک دانشمند داده حرفه‌ای است. بسیاری از فراگیران علم داده، پایتون را برای علم داده می‌آموزند و یادگیری آمار را نادیده می‌گیرند یا به تعویق می‌اندازند. یکی از دلایل این امر، کمبود منابع و دوره‌هایی است که آمار را برای علم داده و یادگیری ماشین آموزش می‌دهند.

آمار یک حوزه علمی گسترده است، اما خبر خوب برای فراگیران علم داده این است که تمام مباحث آمار برای علم داده و یادگیری ماشین ضروری نیست. با این حال، همین واقعیت مطالعه آمار را برای فراگیران دشوارتر می‌کند زیرا مطمئن نیستند از کجا شروع کنند و مرتبط‌ترین مباحث آماری برای علم داده کدامند.

این دوره برای پر کردن این شکاف طراحی شده است.

این دوره هم برای مبتدیان بدون پیش‌زمینه در آمار برای علم داده و هم برای کسانی که به دنبال گسترش دانش خود در زمینه آمار کاربردی برای علم داده هستند، طراحی شده است.

من این دوره را به گونه‌ای سازماندهی کرده‌ام که به عنوان یک کتابخانه ویدیویی برای شما باشد تا بتوانید در آینده از آن به عنوان مرجع استفاده کنید. هر سخنرانی در این دوره جامع، یک موضوع واحد را پوشش می‌دهد.

در این دوره جامع، شما را برای یادگیری رایج‌ترین و ضروری‌ترین روش‌های آماری برای تحلیل و مدل‌سازی داده راهنمایی خواهم کرد.

دوره من معادل یک دوره در سطح دانشگاه در زمینه آمار برای علم داده و یادگیری ماشین است که معمولاً هزاران دلار هزینه دارد. در اینجا، من به شما فرصت می‌دهم تا تمام این اطلاعات را با کسری از هزینه یاد بگیرید! این دوره شامل ۷۷ سخنرانی ویدیویی HD، تمرینات متعدد و دو پروژه همراه با راه‌حل است.

تمام مطالب ارائه شده در این دوره به صورت دفترچه‌های قابل دانلود و مفصل برای هر سخنرانی ارائه شده‌اند.

بسیاری از دانشجویان بر یادگیری کدهای پایتون برای علم داده تمرکز می‌کنند، اما این برای تبدیل شدن به یک دانشمند داده ماهر کافی نیست. شما همچنین باید اساس آماری متدهای پایتون را درک کنید. مدل‌ها و تحلیل داده را می‌توان به راحتی در پایتون ایجاد کرد، اما برای انتخاب روش صحیح یا بهترین مدل، باید روش‌های آماری مورد استفاده در این مدل‌ها را درک کنید. در ادامه برخی از مباحث کلیدی که در این دوره جامع خواهید آموخت، آورده شده‌اند:

  • انواع و ساختارهای داده
  • تحلیل اکتشافی داده (EDA)
  • معیارهای گرایش مرکزی
  • معیارهای پراکندگی
  • بصری‌سازی توزیع‌های داده
  • همبستگی، نمودارهای پراکندگی و نقشه‌های حرارتی
  • توزیع داده و نمونه‌برداری داده
  • مقیاس‌گذاری و تبدیل داده
  • فواصل اطمینان
  • معیارهای ارزیابی برای یادگیری ماشین
  • تکنیک‌های اعتبارسنجی مدل در یادگیری ماشین

همین امروز در این دوره ثبت‌نام کنید و دانش ضروری روش‌های آماری را برای علم داده کسب کنید!


سرفصل ها و درس ها

مقدمه Introduction

  • مرور کلی سرفصل‌های دوره Overview of Course Curriculum

  • نصب محیط ژوپیتر نوت‌بوک Installing Jupyter Notebook Environment

  • نحوه دانلود تمرینات و نوت‌بوک‌های دوره How to Download Exercises & Course Notebooks

انواع و ساختارهای داده Data Types and Structures

  • ساختارهای داده داخلی - تاپل و لیست Built-in Data Structures - Tuple and List

  • ساختارهای داده داخلی - دیکشنری و ست Built-in Data Structures - Dictionary and Set

  • آرایه‌های نام‌پای (Numpy) Numpy Arrays

  • سری‌ها و دیتافریم‌های پانداس (Pandas) Pandas Series and Dataframes

  • انواع داده (عددی یا دسته‌ای) Data Types (Numeric or Categorical)

  • تمرین: ایجاد ساختارهای داده در پایتون Exercise: Create Data Structures in Python

تحلیل اکتشافی داده (۱): معیارهای گرایش مرکزی Exploratory Data Analysis (1): Central Tendency Measures

  • میانگین (Average) Mean (Average)

  • میانگین وزنی Weighted Average

  • میانه Median

  • جامعه در مقابل نمونه Population vs. Sample

  • کاربرد در علم داده Application in Data Science

  • تمرین: محاسبه معیارهای گرایش مرکزی Exercise: Calculate Central Tendency Measures

تحلیل اکتشافی داده (۲): معیارهای پراکندگی Exploratory Data Analysis (2): Variability Measures

  • دامنه Range

  • واریانس و انحراف معیار Variance and Standard Deviation

  • صدک و چارک Percentile & Quartile

  • داده پرت – بخش اول Outlier – part 1

  • داده پرت – بخش دوم Outlier – part 2

  • خطای نمونه‌گیری Sampling Error

  • کاربرد در علم داده Application in Data Science

  • تمرین: محاسبه معیارهای پراکندگی Exercise: Calculate Variability Measures

تصویرسازی توزیع‌های داده Visualizing Data Distributions

  • نمودار جعبه‌ای (Box Plot) Box Plot

  • نمودار ویولن (Violin Plot) Violin Plot

  • هیستوگرام و نمودار چگالی Histogram and Density Plot

  • نمودار میله‌ای برای داده‌های دسته‌ای Bar Plot for Categorical Data

  • نمودار دایره‌ای برای داده‌های دسته‌ای Pie Chart for Categorical Data

  • کاربرد در علم داده Application in Data Science

  • تمرین: بررسی توزیع داده Exercise: Exploring Data Distribution

همبستگی، نمودارهای پراکندگی و نقشه‌های حرارتی Correlation, Scatterplots, and Heat Maps

  • ضرایب همبستگی و کوواریانس Correlation and Covariance Coefficients

  • همبستگی با استفاده از نمودار پراکندگی Correlation Using Scatter plot

  • نقشه‌برداری با نمودارهای پراکندگی Mapping with Scatter plots

  • نقشه‌های حرارتی Heat Maps

  • کاربرد در علم داده Application in Data Science

  • تمرین: ایجاد نمودارهای پراکندگی نقشه‌برداری شده و نقشه‌های حرارتی Exercise: Create Mapped Scatterplots and Heat Maps

پروژه نهایی تحلیل اکتشافی Capstone Project for Exploratory Analysis

  • توضیح پروژه Project Description

  • گام به گام حل پروژه Solution walk-through of The Project

توزیع‌های داده و نمونه‌گیری داده Data Distributions and Data Sampling

  • نمونه‌گیری تصادفی و اریبی Random Sampling and Bias

  • قضیه حد مرکزی Central Limit Theorem

  • توزیع نرمال Normal distribution

  • آزمون‌های نرمالیته برای داده‌های واقعی Normality Tests for Real-World Data

  • داده‌های چولگی: توزیع‌های زندگی واقعی Skewed Data: Real-life Distributions

  • احتمال: یک مقدمه کاربردی Probability: A Practical Introduction

  • توزیع‌های احتمالی رایج Common Probability Distributions

  • تمرین: توزیع نرمال و چولگی Exercise: Normal Distribution and Skewness

مقیاس‌بندی و تبدیل داده Data Scaling and Transformation

  • مقیاس‌بندی داده: استانداردسازی Data Scaling: Standardization

  • مقیاس‌بندی داده: نرمال‌سازی Data Scaling: Normalization

  • تبدیل‌های لگاریتمی و ریشه دوم Log and Square Root Transformations

  • تبدیل توانی (PowerTransformer) Power Transformation (PowerTransformer)

  • کاربرد در علم داده Application in Data Science

  • تمرین: مقیاس‌بندی و تبدیل داده Exercise: Data Scaling and Transformation

بازه‌های اطمینان (CI) Confidence Intervals (CI)

  • بازه‌های اطمینان برای داده‌های پیوسته C.I for Continuous Data

  • بازه‌های اطمینان برای داده‌های طبقه‌بندی C.I for Classification Data

  • بوت‌استرپینگ برای توزیع‌های نامعلوم Bootstrapping For Unknown Distributions

  • بازه‌های اطمینان ناپارامتری با بوت‌استرپینگ Nonparametric Confidence Interval with Bootstrapping

  • تمرین: ایجاد بازه اطمینان Exercise: Create Confidence Interval

معیارهای ارزیابی یادگیری ماشین Evaluation Metrics for Machine Learning

  • اریبی در مقابل واریانس Bias vs. Variance

  • بیش‌برازش و کم‌برازش Overfitting and Underfitting

  • معیارهای اطلاعات برای انتخاب مدل Information Criteria for Model Selection

  • معیارهای ارزیابی برای مدل‌های رگرسیون Evaluation Metrics for Regression Models

  • معیارهای ارزیابی برای مدل‌های طبقه‌بندی _بخش اول Evaluation Metrics for Classification Models _Part One

  • معیارهای ارزیابی برای مدل‌های طبقه‌بندی – بخش دوم Evaluation Metrics for Classification Models – Part Two

  • کاربرد در علم داده Application in Data Science

  • تمرین: ارزیابی مدل‌های یادگیری ماشین Exercise: Evaluating Machine Learning Models

تکنیک‌های اعتبارسنجی مدل در یادگیری ماشین Model Validation Techniques in Machine Learning

  • اعتبارسنجی Hold Out - تقسیم داده آموزش/آزمایش Hold Out Validation - Train/Test Split

  • اعتبارسنجی متقاطع K-Fold K-Fold Cross-Validation

  • اعتبارسنجی متقاطع Leave-One-Out (LOOCV) Leave-One-Out Cross-Validation (LOOCV)

  • کاربرد در علم داده Application in Data Science

  • تمرین: تکنیک‌های اعتبارسنجی در یادگیری ماشین Exercise: Validation Techniques in Machine Learning

پروژه پایانی Final project

  • توضیح پروژه Project Description

  • گام به گام حل پروژه – بخش اول Walk-through Solution of the Project – Part One

  • گام به گام حل پروژه – بخش دوم Walk-through Solution of the Project – Part Two

  • گام به گام حل پروژه – بخش سوم Walk-through Solution of the Project – Part Three

نمایش نظرات

آموزش آمار برای علم داده و یادگیری ماشین با پایتون
جزییات دوره
7.5 hours
74
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
2,176
4.8 از 5
دارد
دارد
دارد
Taher Assaf
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Taher Assaf Taher Assaf

با داشتن سابقه در علم و مدل سازی داده ها ، من در اوایل کار خود با تجارت فارکس و تجارت بورس سهام علاقه مند شدم. 15 سال پیش من سفر خود را به عنوان یک تاجر خرده فروشی خصوصی آغاز کرده ام و در این جاده پر از دست انداز خودآموزی و توسعه خود راه خود را طی کرده ام. برای تسلط بر برخی جنبه های تجارت فارکس که ممکن است سالها طول بکشد تا سایر مبتدیان درک کنند ، زمان زیادی لازم نبود. من خوش شانس بودم که با بسیاری از تجار باتجربه و گورو ، که از بسیاری جهات ، نحوه تجارت فارکس در حال حاضر را شکل داده اند ، ملاقات و دوستی برقرار کردم. آنها چشم و ذهن من را به روی تکنیک هایی باز کرده اند که هر دو مربوط به تجزیه و تحلیل اقدام قیمت و جنبه های روانشناختی هستند. و این دانش منحصر به فرد از آن خودیهای باورنکردنی نه تنها به من نشان داد که من برای موفقیت لازم هستم ، بلکه باعث شد که من بخواهم به معامله گران دیگر کمک کنم تا شروع دشوار تجارت را کنار بگذارند و به آنها کمک کنم تا منحنی یادگیری خود را کوتاه کنند وقت و هزینه برای آنها. من ده سال پیش مدرسه تجارت محلی خود را افتتاح کردم و هدف من تنها کمک به بازرگانان در آغاز کار خود بود.