آموزش داده های نامعتبر، تکراری و گمشده را در پایتون مدیریت کنید

Manage Invalid, Duplicate, and Missing Data in Python

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: پاک کردن داده ها یکی از آن کارهایی است که تخیلی نیست، اما کلیدی برای هر برنامه داده ای است. این دوره به شما مهارت ها و دانش پاکسازی داده ها در پانداها را می آموزد که برای تبدیل مجموعه داده های خود از خام و بی فایده به تمیز و مفید لازم است. صرف نظر از خط کاری شما. داده ها همه جا هست امروز، ما در هر ثانیه داده های بیشتری نسبت به قبل تولید می کنیم. با این حال، این داده ها معمولا خام، کثیف و اغلب غیرقابل استفاده هستند. در این دوره، مدیریت داده‌های نامعتبر، تکراری و گمشده در پایتون، این توانایی را به دست خواهید آورد که داده‌های خود را پاک کنید تا برای هر برنامه‌ای که ممکن است نیاز داشته باشید قابل استفاده باشد. ابتدا، نحوه مدیریت مقادیر از دست رفته و نحوه پر کردن ستون‌های NaN را بررسی خواهید کرد. در مرحله بعد، نحوه برخورد با ردیف های تکراری در زیر مجموعه ای از ستون ها را خواهید دید. در نهایت، یاد خواهید گرفت که چگونه با مقادیر نامعتبر کنار بیایید و چگونه آنها را رفع یا حذف کنید. وقتی این دوره را به پایان رساندید، مهارت ها و دانش پاکسازی داده ها در پانداها را خواهید داشت که برای تبدیل مجموعه داده های خود از خام و بی فایده به تمیز و مفید لازم است.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

چرا داده های پاک؟ Why Clean Data?

  • معرفی Introduction

  • گرفتن بهترین ها از این دوره Getting the Best out of This Course

  • بررسی نسخه Version Check

  • در پایان این دوره چه کاری را می توانید انجام دهید؟ What Will You Be Able to Do When Finishing This Course?

  • طرح کلی دوره Outline of the Course

مدیریت ارزش های گمشده در داده های شما Handling Missing Values in Your Data

  • خلاصه: استفاده از شاخص ها در پانداها Recap: Using Indexers in Pandas

  • نسخه ی نمایشی: NaNs را شناسایی کنید - قسمت 1 Demo: Identify NaNs - Part1

  • نسخه ی نمایشی: NaNs را شناسایی کنید - قسمت 2 Demo: Identify NaNs - Part2

  • نسخه ی نمایشی: سطرها یا ستون هایی را با تعدادی NaN رها کنید - قسمت 1 Demo: Drop Rows or Columns with a Number of NaNs - Part1

  • نسخه ی نمایشی: سطرها یا ستون هایی را با تعدادی NaN رها کنید - قسمت 2 Demo: Drop Rows or Columns with a Number of NaNs - Part2

  • نسخه ی نمایشی: سطرها یا ستون هایی را با تعدادی NaN رها کنید - قسمت 3 Demo: Drop Rows or Columns with a Number of NaNs - Part3

  • نسخه ی نمایشی: استفاده از پرکننده ها برای جایگزینی NaNs Demo: Using Fillers to Replace NaNs

  • نکات و نکات کلیدی Key Takeaways and Tips

مدیریت مقادیر تکراری در داده های شما Handling Duplicate Values in Your Data

  • نسخه ی نمایشی: ردیف های تکراری را با موارد تکراری شناسایی کنید Demo: Identify Duplicate Rows with duplicated

  • نسخه ی نمایشی: اگر برخی از ستون ها تکراری هستند با drop_duplicates سطرها را رها کنید Demo: Drop Rows if Some Columns Are Duplicate with drop_duplicates

  • نکات و نکات کلیدی Key Takeaways and Tips

مدیریت مقادیر نامعتبر در داده های شما Handling Invalid Values in Your Data

  • نسخه ی نمایشی: استفاده از توابع با Apply برای شناسایی ردیف های نامعتبر و رفع آنها - قسمت 1 Demo: Using Functions with Apply to Detect Invalid Rows and Fix Them - Part1

  • نسخه ی نمایشی: استفاده از توابع با Apply برای شناسایی ردیف های نامعتبر و رفع آنها - قسمت 2 Demo: Using Functions with Apply to Detect Invalid Rows and Fix Them - Part2

  • نسخه ی نمایشی: استفاده از Replace برای معتبر کردن داده ها Demo: Using Replace to Make Data Valid

  • نکات و نکات کلیدی Key Takeaways and Tips

نمایش نظرات

آموزش داده های نامعتبر، تکراری و گمشده را در پایتون مدیریت کنید
جزییات دوره
0h 57m
21
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
از 5
دارد
دارد
دارد
Axel Sirota
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Axel Sirota Axel Sirota

آکسل سیروتا دارای مدرک کارشناسی ارشد ریاضیات است که علاقه زیادی به عملیات یادگیری عمیق و یادگیری ماشین دارد. وی پس از تحقیق در زمینه احتمال ، آمار و بهینه سازی یادگیری ماشین ، در حال حاضر در JAMPP به عنوان یک مهندس تحقیق در زمینه یادگیری ماشین مشغول به کار است که از داده های مشتری برای پیش بینی دقیق در زمان واقعی پیشنهاد استفاده می کند.