آموزش تفکر آماری و علم داده با R - آخرین آپدیت

دانلود Statistical Thinking and Data Science with R.

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:

دوره جامع آمار، احتمالات و یادگیری ماشین با R برای تصمیم‌گیری‌های تجاری

بیاموزید چگونه از آمار برای تصمیم‌گیری‌های تجاری استفاده کنید.

از یادگیری R از ابتدا تا تسلط کامل بر آن.

مبانی احتمال، توزیع‌های پیوسته و گسسته، برازش توزیع‌ها و شبیه‌سازی‌های تجاری.

آزمون فرضیه برای مسائل مختلف کسب‌و‌کار، مدل‌های رگرسیون و استنباط آماری.

اندازه‌گیری ریسک نسبی، شانس و نسبت شانس برای گزینه‌ها.

تصمیم‌گیری مبتنی بر داده، پاکسازی، دستکاری و بصری‌سازی داده‌ها.

انتخاب ویژگی و مدل‌های رگرسیون منظم‌شده.

مدل‌های رگرسیون لجستیک دوجمله‌ای و چندجمله‌ای.

تشخیص و حذف داده‌های پرت.

معیارهای پراکندگی و مرکزی.

تحلیل بیزی برای تخمین توزیع‌ها.

بیاموزید چگونه از مدل‌های مرتب (tidy models)، بسته استاندارد یادگیری ماشین در R استفاده کنید.

به‌روزرسانی: یادگیری ماشین با مدل‌های مرتب در آخرین فصل گنجانده شده است (آگوست ۲۰۲۳).

نه تنها R را در این دوره می‌آموزید، بلکه یاد می‌گیرید چگونه از آمار و یادگیری ماشین برای تصمیم‌گیری استفاده کنید!

من شش سال است که از اکسل به R مهاجرت کرده‌ام و از آن زمان هرگز به عقب نگاه نکرده‌ام! با یازده سال تجربه در تدارکات، تدریس در دانشگاه‌ها، آموزش بیش از ۲۰۰۰ متخصص در زنجیره تامین و علم داده با استفاده از R و پایتون، و در نهایت راه‌اندازی کسب‌وکار مشاوره خود در دو سال گذشته. بسیار هیجان‌زده‌ام که این دوره را با شما به اشتراک بگذارم. هدف من این است که همه شما در R، تفکر آماری و یادگیری ماشین متخصص شوید. من تمام تکنیک‌هایی را که آموخته‌ام و تمرین کرده‌ام، در این مجموعه جامع علم داده با R گرد هم آورده‌ام.

پس از پایان این دوره، شما قادر خواهید بود:

  • R را از ابتدا بیاموزید.
  • احتمالات چیست؟ آزمایش‌های تصادفی، متغیرهای تصادفی و فضای نمونه؟
  • چگونه می‌توانیم داده‌های پرت را در داده‌ها تشخیص دهیم؟
  • چگونه می‌توانیم منابع خود را با استفاده از آمار و داده‌ها کارآمد کنیم؟
  • چگونه می‌توانیم فرضیه‌ای را مبنی بر اینکه یک تامین‌کننده محصولات بهتری نسبت به تامین‌کننده دیگر ارائه می‌دهد، آزمایش کنیم؟
  • چگونه می‌توانیم فرضیه‌ای را آزمایش کنیم که یک کمپین بازاریابی به طور قابل توجهی بهتر از یک کمپین بازاریابی دیگر است؟
  • تأثیر آخرین تبلیغ بر افزایش فروش چیست؟
  • چگونه می‌توانیم شبیه‌سازی‌هایی برای درک درآمد مورد انتظار از یک کسب‌وکار انجام دهیم؟
  • چگونه می‌توانیم مدل‌های یادگیری ماشین را برای طبقه‌بندی و رگرسیون با استفاده از آمار بسازیم؟
  • لگ شانس، نسبت شانس و احتمالات تولید شده از مدل‌های رگرسیون لجستیک چیست؟
  • مناسب‌ترین بصری‌سازی برای داده‌های دسته‌ای و پیوسته کدام است؟
  • چگونه عدم قطعیت را با توزیع‌ها ثبت کنیم؟ کدام توزیع مناسب‌ترین توزیع برای داده‌ها است؟
  • یادگیری ماشین را برای حل مشکلات به کار ببرید.

آیا به طور مرتب با یکی از این سوالات روبرو می‌شوید؟ اگر اینطور است، این دوره به عنوان یک راهنما برای شما عمل خواهد کرد.

آمار و احتمالات نیروی محرکه بسیاری از تصمیمات تجاری هستند که ما روزانه می‌گیریم. اگر در امور مالی، بازاریابی، زنجیره تامین، توسعه محصول یا علم داده کار می‌کنید؛ داشتن یک پیشینه آماری قوی، مهارت اصلی مورد نیاز شماست.

اگرچه یادگیری R تمرکز اصلی این دوره نیست، اما ما با غوطه‌ور شدن عمیق در مفاهیم آماری، به طور ضمنی R را خواهیم آموخت. مزیت حیاتی این دوره، یادگیری الگوریتم‌ها و یادگیری ماشین نیست، بلکه توسعه تفکر انتقادی ما و درک اینکه نتایج این مدل‌ها چه معنایی دارند، می‌باشد.

این دوره طوری طراحی شده است که شما را گام به گام در سفری از R و آمار همراهی کند. این دوره مملو از الگوها، تمرین‌ها، آزمون‌ها و منابعی است که به شما کمک می‌کند زبان اصلی R و مفاهیم آماری مورد نیاز برای علم داده و تجزیه و تحلیل کسب‌و‌کار را درک کنید. این دوره:

  • عملی است.
  • به شدت تحلیلی است.
  • پر از آزمون‌ها و تکالیف است.
  • آموزش‌های اکسل گنجانده شده است.
  • اسکریپت‌ها و آموزش‌های R ارائه می‌شود.
  • فهم و دنبال کردن آن آسان است.
  • با انجام دادن یاد می‌گیرید، بدون سخنرانی‌های خسته‌کننده.
  • جامع است.
  • مبتنی بر داده است.
  • شما را با زبان آماری R آشنا می‌کند.
  • یادگیری بصری‌سازی‌های مختلف داده‌ها با ggplot را به شما آموزش می‌دهد.
  • نحوه پاکسازی، تبدیل و دستکاری داده‌ها را به شما آموزش می‌دهد.

مشتاق دیدارتان در داخل دوره هستم :)

هایثم


سرفصل ها و درس ها

مقدمه Introduction

  • مقدمه Introduction

  • بهترین استفاده از این دوره Get the Best out of this course

  • سرفصل دوره Curriculum

  • انواع تجزیه و تحلیل Types of analytics

  • اهداف علم داده Objectives of data science

  • کاربردهای علم داده Applications of data science

  • فرآیند علم داده The data science Process

  • چرا R Why R

نصب R و R Studio Installing R and R Studio

  • به دنیای R خوش آمدید! Welcome to the World of R!

  • زبان آماری R چیست. What is R statistical Language.

  • چگونه R را نصب کنیم؟ How to install R?

  • چگونه RStudio را نصب کنیم؟ How to install Rstudio?

  • آموزش قدم به قدم A walk through tutorial

  • پروژه خود را تنظیم کنید Setup your project

  • نصب پکیج‌ها Install packages

  • خلاصه Summary

مبانی R R fundamentals

  • مقدمه Introduction

  • ساختارها و انواع مختلف داده در R Different data structures and types in R

  • انجام محاسبات حسابی و نوشتن توابع در R Do arithmetic calculations and write functions in R

  • ایجاد یک لیست. Creating a list.

  • وارد کردن داده‌ها در R و اکتشاف اولیه Importing Data in R and Basic exploration

  • انتخاب داده در یک دیتا فریم Selecting data in a data frame

  • دستور اگر-دیگر If else function

  • شرایط Conditions

  • توابع با شرایط Functions with Conditions

  • حلقه‌های For Forloops

  • اعمال تابع در داخل حلقه Applying a function inside the loop

  • حلقه For روی دیتا فریم For-loop on a data-frame

  • اعمال تابع روی دیتا فریم Applying the function on a data frame

  • انتساب Assignment

  • پاسخ تمرین بخش ۴ قسمت ۱ Assignment Section 4 answer Part 1

  • پاسخ تمرین بخش ۴ قسمت ۲ Assignment Section 4 answer part 2

  • خلاصه Summary

آمار توصیفی Descriptive statistics

  • مقدمه Intro

  • گرایش مرکزی Central tendency

  • معیارهای پراکندگی Measures of spread

  • محاسبه معیارهای پراکندگی و مرکزیت قسمت ۱ Calculating measures of spread and centrality Part 1

  • محاسبه معیارهای پراکندگی و مرکزیت قسمت ۲ Calculating measures of spread and centrality PART 2

  • تمرین گرایش مرکزی Central tendency assignment

  • شناسایی داده‌های پرت Detecting outliers

  • شناسایی داده‌های پرت در R Detecting outliers in R

پاکسازی و دستکاری داده‌ها Data cleaning and manipulation

  • مقدمه Intro

  • مقدمه‌ای بر dplyr Intro to dplyr

  • بررسی با Dplyr Investigate with Dplyr

  • فاکتورهای منحصر به فرد Unique invoices

  • میانگین ارزش سطل بر حسب کشور Average Bucket value per country

  • میانگین اقلام در یک فاکتور Average items in an invoice

  • ادغام Joining

  • تغییر تاریخ و زمان به تاریخ Changing date time to date

  • Pivot وسیع‌تر Pivot wider

  • Pivot طولانی‌تر Pivot longer

  • جدا کردن و چسباندن Separate and Paste

  • ترکیب همه چیز Putting it all together

  • تمرین: خطوط هوایی نیویورک Assignment : New York airlines

  • تمرین: پاسخ سوال ۱ Assignment : Question 1 answer

  • پاسخ تمرین سوال ۲ و ۳ Assignment question 2&3 answer

  • تمرین سوال ۴، ۵، ۶ Assignment question 4,5,6

  • تمرین سوال ۷ Assignment question 7

  • خلاصه Summary

بصری سازی Visulalization

  • مقدمه Introduction

  • نمودارهای خطی Line plots

  • نمودارهای پراکندگی Scatter plots

  • نمودارهای میله‌ای Bar plots

  • نمودارهای توزیع Distribution plots

  • نمودارهای جعبه‌ای Box plots

  • هیستوگرام‌ها Histograms

  • هیستوگرام‌ها ۲ Histograms 2

  • تمرین Assignment

  • پاسخ تمرین سوال ۱ و ۲ Assignment Solution Question 1 and 2

  • پاسخ تمرین قسمت ۲ Assignment Solution Part 2

  • خلاصه Summary

احتمالات Probabilities

  • مقدمه Intro

  • مقدمه احتمالات Probability introduction

  • واریانس و انحراف معیار Variance and standard deviation

  • همپوشانی احتمال Overlapping of probability

  • احتمال گسسته و پیوسته Desecrate and continuous probability

  • احتمال شرطی Conditional Probability

  • سوال ۱ احتمال Question 1 Probability

  • سوال ۲ احتمال Question 2 Probability

  • پرتاب تاس Rolling the dice

  • توزیع دوجمله‌ای Binomial distribution

  • سوال ۱ دوجمله‌ای Question 1 Binomial

  • سوال ۲ دوجمله‌ای Question 2 Binomial

  • حلقه زدن روی توزیع دوجمله‌ای For looping on a binomial distribution

  • تمرین دوجمله‌ای Binomial assignment

  • توزیع پواسون Poisson Distribution

  • توزیع پواسون در R Poisson distribution in R

  • توزیع‌های پیوسته Continuos Distributions

  • مثال توزیع نرمال Normal distributions example

  • مثال توزیع یکنواخت Uniform distribution example

  • قضیه حد مرکزی Central Limit theorem

  • ارتباطات Associations

  • محاسبه خطر نسبی در R Calculating Relative risk in R

  • ارتباط بین متغیرهای عددی Association among numerical variables

  • ماتریس همبستگی Correlation Matrix

  • علت و معلول Cause and effect

  • نظریه بیز Bayes theory

برازش توزیع‌ها Fitting Distributions

  • مقدمه توزیع‌ها Distributions Intro

  • شکل‌های توزیع Distribution shapes

  • آزمون‌های کای دو Chi-square Tests

  • آزمون کای دو در اکسل Chi-square test in excel

  • قسمت ۲ Part 2

  • پوشش ۹۰٪ توزیع Cover for 90% of distribution

  • تمرین توزیع در اکسل Assignment Distribution in Excel

  • پاسخ تمرین: تقاضای دوچرخه Assignment answer : Bike demand

  • توزیع‌ها در R Distributions in R

  • تمرین Assignment

  • پاسخ تمرین Assignment answer

شبیه سازی‌ها Simulations

  • مقدمه شبیه‌سازی Simulation Intro

  • شبیه‌سازی‌ها Simulations

  • مثال رستوران ۱ Restaurant Example 1

  • تعداد مشتریان Customer's number

  • درآمد مورد انتظار Expected revenue

  • تمرین شبیه‌سازی Simulation assignment

  • نتیجه‌گیری Conclusion

  • صف‌های انتظار Waiting lines

  • مثال Example

  • صف‌های انتظار در اکسل Waiting lines in Excel

  • صف‌های انتظار در R Waiting lines in R

  • شبیه‌سازی صف‌های انتظار ۴۰۰ بار Simulating waiting lines 400 times

شبیه‌سازی با محدودیت‌های ظرفیت Simulation with Capacity Constraints

  • صف انتظار در مرکز تماس Waiting line at a call centre

  • تعیین K مناسب Defining the right K

  • محدودیت‌های ظرفیت Capacity Constraints

  • تمرین Assignment

  • پاسخ تمرین Assignment solution

  • سرویس متوالی روی یک سیستم Sequential service on one system

  • سرویس‌های متعدد Many Services

  • شبیه‌سازی‌های سرویس متعدد در R Multiple service simulations in R

  • نتیجه‌گیری Conclusion

  • تمرین Assignment

  • پاسخ تمرین Assignment Solution

  • خلاصه Summary

آزمون فرض و فواصل اطمینان Hypothesis testing and Confidence intervals

  • آزمون فرض Hypothesis testing

  • آزمون فرض Hypothesis testing

  • نمونه‌گیری Sampling

  • هیستوگرام برای شناسایی میانگین Histogram for mean identification

  • نمودار جعبه‌ای Boxplot

  • آزمون T دو نمونه‌ای Two sample T-test

  • وزن قلب گربه‌ها Cats heart weight

  • آزمون یک نمونه‌ای One sample test

  • پیتزا فروشی Pizza Place

  • عدم نرمال بودن Non Normality

  • آزمون کای دو برای استقلال Chi-Square test for independence

  • آزمون کای دو در R Chi-square test in R

  • آزمون فیشر Fisher test

  • رانندگان بریتانیا UK drivers

  • آزمون T روی رانندگان T_test on drivers

  • آزمون‌های همبستگی Tests for association

  • آزمون فرض برای توزیع‌های دوجمله‌ای Hypothesis test for binomial distributions

  • بازنگری نظریه بیز Revisiting Bayes theory

  • استنتاج بیزی Bayesian inference

  • محاسبه تخمین پسین Calculating post estimate

  • شانس و نسبت شانس Odds and odds ratio

ANOVA و رگرسیون ANOVA and regression

  • تحلیل واریانس Analysis of variance

  • تحلیل واریانس در R Analysis of variance inside R

  • تفاوت‌های معنی‌دار صادقانه توکی Tukey Honest significant differences

  • تفسیر توکی Interpretation of Tukey

  • ANOVA دو طرفه two way ANOVA

  • مقدمه رگرسیون خطی Intro to linear Regression

  • رگرسیون خطی در اکسل Linear Regression in excel

  • مجموع مربعات خطاها Sum of squared errors

  • پاکسازی داده‌ها برای رگرسیون Cleaning the data for regression

  • EDA برای مسکن EDA for housing

  • مدل‌سازی یک متغیر one variable modeling

  • رگرسیون چندگانه Multiple Regression

  • تعامل مدل model interaction

  • مقایسه مدل‌ها با ANOVA Comparing models with ANOVA

  • تحلیل بیشتر داده‌ها Further data analysis

  • رگرسیون همه متغیرها Regressing all the variables

  • اهمیت ویژگی feature importance

  • Step AIC Step AIC

  • آزمون رگرسیون و ANOVA Quiz on regression and anova

رگرسیون لجستیک Logistic Regression

  • مقدمه Intro

  • رگرسیون لجستیک Logistic Regression

  • شهر در مقابل قیمت هر فوت مربع City vs Price per square foot

  • پیش‌بینی یک مشاهده Predicting one observation

  • سوال شانس و احتمال Odds and probability question

  • برازش همه متغیرها fitting all variables

  • درک پیش‌بینی‌کننده‌های چندگانه understanding multiple predictors

  • آزمون متغیرهای طبقه‌بندی شده Testing Categorical variables

  • نتیجه‌گیری درباره پیش‌بینی‌های چندگانه Conclusions about Multiple predictions

  • مقایسه سه مدل Comparing three models

  • لگاریتم شانس متغیر طبقه‌بندی شده Log odds of categorical Variable

  • رگرسیون لجستیک چندجمله‌ای Multinomial logistic regression

  • پیش‌بینی چندجمله‌ای Predicting the multinomial

  • آزمون وضعیت اجتماعی اقتصادی Testing social economic status

  • بهبود مدل improving the model

  • آزمون Quiz

منظم‌سازی مدل‌های رگرسیون Regularization of Regression models

  • مقدمه Intro

  • مدل‌های رگرسیون منظم شده Regularized regression models

  • تابع هزینه The loss function

  • هم‌خطی چندگانه Multi-Colinearity

  • تقسیم داده‌ها Splitting the data

  • رمزگذاری encoding

  • آموزش رگرسیون Ridge Training Ridge Regression

  • اعتبارسنجی متقابل Ridge Cross Validation Ridge

  • ضرایب Ridge Ridge coefficients

  • رگرسیون Lasso Lasso Regression

  • بصری‌سازی Lasso Visualization of lasso

  • کمترین خطای مربعی Lasso Minimum squared error Lasso

  • پیش‌بینی پس از اعتبارسنجی متقابل Prediction after Cross validation

  • ماتریس مدل برای رگرسیون لجستیک model matrix for logistic regression

  • ضرایب غیر صفر Non Zero Coefficients

  • ضرایب Lasso Lasso Coefficients

  • مدل‌های منظم شده Regularized models

یادگیری ماشین Machine learning

  • مقدمه‌ای بر یادگیری ماشین Intro to machine learning

  • نمایش درخت تصمیم Decision Tree demo

  • Kmeans Kmeans

  • بیش برازش Overfitting

  • Kmeans در R Kmeans in R

  • مجموع مربعات کل Total sum of squares

  • سیلوئت Silhouette

  • نمودار پراکندگی سه‌بعدی تعاملی Interactive three dimensional scatter plot

  • تمرین Assignment

  • پیش‌بینی با یادگیری ماشین Forecasting with machine learning

  • یادگیری نظارت شده: درخت تصمیم Supervised learning : Decision Tree

  • مقایسه مدل‌ها Comparing Models

  • جهت‌گیری داده‌های طبقه‌بندی Classification Data orientation

  • کاوش داده‌ها Exploring the data

  • ماتریس همبستگی Correlation Matrix

  • تقسیم Splitting

  • آموزش و آزمون Training and testing

  • کنترل برازش Control the fitting

  • طبقه‌بندی رگرسیون لجستیک Logistic Regression classfication

  • احتمالات رگرسیون لجستیک Probabilities of logistic regression

  • ماتریس سردرگمی Confusion matrix

  • ROC ROC

  • مدل درخت تصمیم Decision Tree model

  • تمرین Assignment

  • نتیجه‌گیری Conclusion

  • خلاصه Summary

مدل‌سازی پیشرفته، یادگیری ماشین با Tidymodels و TIdyverse Advanced Modeling , Machine Learning with Tidymodels and TIdyverse

  • Tidymodels Tidymodels

  • نمایش مطالعه موردی Case study demonstation

  • گروه‌بندی بر اساس و تغییر Group by and mutate

  • تبدیل به tsibble Converting to tsibble

  • روند و فصل‌بندی Trend and seasonality

  • تولید آینده Generating future

  • حذف NAs با Mutate_if Removing NAs with Mutate_if

  • تولید ویژگی‌های سری زمانی Generating time-series features

  • دریافت کلیدهای منحصر به فرد برای سطوح getting unique keys for levels

  • درون‌یابی مقدار گم شده در هر سطح imputing missing value per level

  • تقسیم داده‌ها برای یادگیری ماشین Splitting the data for machine learning

  • ثبت درآمد Logging revenue

  • دستور پخت recipe

  • تعریف مدل و گردش کار Model Definition and Workflows

  • تجدید نمونه‌برداری resampling

  • جمع‌آوری معیارها Collecting metrics

  • پیش‌بینی با مدل‌های نهایی Prediction with final models

  • مقایسه دقت comparing accuracy

  • انباشت مدل model stacking

  • پیش‌بینی آینده Predicting the future

  • بصری‌سازی آینده Visualizing the future

نمایش نظرات

آموزش تفکر آماری و علم داده با R
جزییات دوره
27 hours
243
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
18,181
4.4 از 5
دارد
دارد
دارد
Haytham Omar
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Haytham Omar Haytham Omar

مشاور زنجیره تامین "هرگز کتابی را از روی جلد دنبال نکنید ، در دنیایی که هر ثانیه تغییر می کند ، ما باید مقاوم و فعال باشیم." مشاور/توسعه دهنده/مربی مشاور مدیریت زنجیره تامین و هوش تجاری موسس - Rescale Analytics - دبی • دانشجوی دکتری در دانشگاه بوردو. • زنجیره تامین و مشاور علم داده برای چندین مشتری ملی و چند ملیتی در امارات و فرانسه. • دانشمند داده ، کارشناسی ارشد مدیریت زنجیره تامین جهانی از Bordeaux Ecole de Management ، بوردو ، فرانسه او در حال حاضر کارگاه ها و سمینارهایی در زمینه زنجیره تامین و علم داده و همچنین پروژه های مشاوره ای برای Sephora ، گروه شرف و داروسازی آستر برگزار می کند.