لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش پاکسازی داده ها و تضمین کیفیت در R
دانلود Data Cleaning and Quality Assurance in R
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
آمادهسازی دادهها برای تجزیه و تحلیل میتواند یک کار دلهرهآور باشد، بهویژه زمانی که با مقادیر از دست رفته، موارد دورافتاده و قالبهای ناسازگاری که یکپارچگی بینش شما را به خطر میاندازد، سروکار دارید.
در این دوره، پاکسازی داده ها و تضمین کیفیت در R، شما توانایی مدیریت مجموعه داده های ناسازگار و واقعی و تبدیل آنها به قالب های قابل اعتماد و قابل تجزیه را به دست خواهید آورد.
ابتدا، استراتژیهایی را برای شناسایی و رسیدگی به دادههای از دست رفته، از جمله خلاصهسازی الگوهای گمشده و تعیین مقادیر با استفاده از تکنیکهای آماری و شرطی، بررسی خواهید کرد.
در مرحله بعد، نحوه تشخیص و مدیریت موارد پرت را در دادههای عددی و دستهبندی با استفاده از تجسمها، روشهای آماری و جایگزینهای هدفمند خواهید یافت. در نهایت، یاد خواهید گرفت که چگونه با تبدیل انواع داده ها، استانداردسازی واحدها و اجرای بررسی های اعتبارسنجی برای حفظ یکپارچگی داده ها، از سازگاری داده ها اطمینان حاصل کنید.
وقتی این دوره را به پایان رساندید، مهارت ها و دانش پاکسازی و آماده سازی داده ها را خواهید داشت که برای پیش پردازش با اطمینان مجموعه داده ها برای تجزیه و تحلیل لازم است.
سرفصل ها و درس ها
شناسایی و آدرس دهی داده های از دست رفته
Identifying and Addressing Missing Data
معرفی نانیار و موش
Introducing naniar and mice
نسخه ی نمایشی: استفاده از naniar برای تجسم مقادیر گمشده
Demo: Using naniar to Visualize Missing Values
Janani Ravi یک معمار و مهندس داده خبره Google cloud است.
جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.
نمایش نظرات