آموزش مدیریت داده‌های گم‌شده در R - آخرین آپدیت

دانلود Handling Missing Data in R

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:

داده‌های گم‌شده یا مفقود (Missing Data) در پروژه‌های واقعی همه جا وجود دارند - و اکثر تیم‌ها هنوز هم بدون تحلیل، فقط داده‌ها را جایگذاری کرده و امیدوارند که نتیجه درست باشد! در این دوره آموزشی، شما یک جریان کاری (Workflow) واضح و جامع را در زبان برنامه نویسی R پیاده‌سازی می‌کنید تا بتوانید با اطمینان کامل، مقادیر گم‌شده را ارزیابی، جایگذاری (Imputation) و تحلیل کنید.

ما ابتدا به سرعت بررسی می‌کنیم که داده‌ها چرا و در کجا مفقود شده‌اند، مکانیزم‌های گم‌شدگی داده‌ها (MCAR/MAR/MNAR) را به زبان ساده معرفی می‌کنیم و سپس مستقیماً وارد برنامه‌نویسی R می‌شویم: از استانداردسازی مقادیر NA و ساخت مدل‌های پایه‌ای جایگذاری داده‌ها گرفته تا اجرای روش انتساب چندگانه (Multiple Imputation - MICE) روی مجموعه داده‌ها. شما یاد می‌گیرید که چگونه روش‌های جایگذاری را با تکنیک ماسک‌گذاری (Masking) تست کنید، روش‌ها را با استفاده از معیارهایی مانند MAE و RMSE و شاخص‌های عملکرد مدل (KPIs) مانند AUC و دقت (Accuracy) مقایسه کنید و تصمیم بگیرید که آیا استفاده از یک روش پیچیده واقعاً ارزشش را دارد یا خیر.

در پایان این دوره، شما یک پایپ‌لاین (Pipeline) قابل تکرار در R به همراه یک یادداشت تصمیم‌گیری کوتاه خواهید داشت که به وضوح توضیح می‌دهد چه داده‌هایی را جایگزین کرده‌اید، چه داده‌هایی را رها کرده‌اید و چرا؛ سندی ارزشمند که می‌توانید به مدیر، کارفرما یا استاد خود ارائه دهید. این دوره برای تحلیل‌گران داده، دانشمندان داده و کاربران R طراحی شده است که به دنبال ابزارهای کاربردی و واقعی برای تبدیل داده‌های نامنظم به مدل‌های قابل دفاع و دقیق هستند.

برای یادگیری این دوره نیازی به ریاضیات پیشرفته ندارید: اگر می‌توانید یک فایل CSV را بارگذاری کنید، کدهای پایه R را اجرا کنید و نمودارهای ساده را تحلیل کنید، آمادگی لازم را دارید. تمرکز ما روی توضیحات واضح، اسکریپت‌های خوانا و بررسی چالش‌های دنیای واقعی است، نه تئوری‌های انتزاعی. شما می‌توانید از قالب‌های آماده ارائه شده در این دوره در پروژه‌های شخصی خود استفاده کرده و آن‌ها را روی داده‌های جدید اعمال کنید.


سرفصل ها و درس ها

درس‌ها Lessons

  • مقدمه Introduction

  • درس ۱: جریان کاری + استانداردسازی مقادیر NA Lesson 1: workflow + standardisation NA

  • درس ۲: بررسی و حسابرسی داده‌های گم‌شده Lesson 2: Missingness audit

  • درس ۳: مکانیزم‌های گم‌شدگی داده‌ها Lesson 3: Missingness mechanisms

  • درس ۴: روش‌های پایه‌ای جایگذاری داده‌ها Lesson 4: Baseline imputation

  • درس ۵: انتساب چندگانه یا جایگذاری چندگانه (Multiple Imputation) Lesson 5: multiple imputation

  • درس ۶: مقایسه روش‌های پایه‌ای در مقابل جایگذاری چندگانه Lesson 6: compare baseline vs multiple imputation

  • درس ۷: بررسی تاثیرات روش‌های انتساب بر مراحل بعدی تحلیل Lesson 7: Downstream impact on Imputation Methods

  • درس ۸: یادداشت تصمیم‌گیری نهایی Lesson 8: Decision Note

  • پروژه شخصی شما Your Personal Project

  • جمع‌بندی و نتیجه‌گیری Conclusion

نمایش نظرات

آموزش مدیریت داده‌های گم‌شده در R
جزییات دوره
1h 23m
11
Skillshare (اسکیل شیر) Skillshare (اسکیل شیر)
(آخرین آپدیت)
- از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Jimmy Mignogna Jimmy Mignogna

دانشمند داده . مدرس آمار . دکتری (PhD)