🔔 با توجه به بهبود نسبی اینترنت، آمادهسازی دورهها آغاز شده است. به دلیل تداوم برخی اختلالات، بارگذاری دورهها ممکن است با کمی تأخیر انجام شود. مدت اشتراکهای تهیهشده محفوظ است.
لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش داده های نامعتبر، تکراری و گمشده را در پایتون مدیریت کنید
- آخرین آپدیت
Manage Invalid, Duplicate, and Missing Data in Python
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
پاک کردن داده ها یکی از آن کارهایی است که تخیلی نیست، اما کلیدی برای هر برنامه داده ای است. این دوره به شما مهارت ها و دانش پاکسازی داده ها در پانداها را می آموزد که برای تبدیل مجموعه داده های خود از خام و بی فایده به تمیز و مفید لازم است. صرف نظر از خط کاری شما. داده ها همه جا هست امروز، ما در هر ثانیه داده های بیشتری نسبت به قبل تولید می کنیم. با این حال، این داده ها معمولا خام، کثیف و اغلب غیرقابل استفاده هستند. در این دوره، مدیریت دادههای نامعتبر، تکراری و گمشده در پایتون، این توانایی را به دست خواهید آورد که دادههای خود را پاک کنید تا برای هر برنامهای که ممکن است نیاز داشته باشید قابل استفاده باشد. ابتدا، نحوه مدیریت مقادیر از دست رفته و نحوه پر کردن ستونهای NaN را بررسی خواهید کرد. در مرحله بعد، نحوه برخورد با ردیف های تکراری در زیر مجموعه ای از ستون ها را خواهید دید. در نهایت، یاد خواهید گرفت که چگونه با مقادیر نامعتبر کنار بیایید و چگونه آنها را رفع یا حذف کنید. وقتی این دوره را به پایان رساندید، مهارت ها و دانش پاکسازی داده ها در پانداها را خواهید داشت که برای تبدیل مجموعه داده های خود از خام و بی فایده به تمیز و مفید لازم است.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
بررسی اجمالی دوره
Course Overview
چرا داده های پاک؟
Why Clean Data?
معرفی
Introduction
گرفتن بهترین ها از این دوره
Getting the Best out of This Course
بررسی نسخه
Version Check
در پایان این دوره چه کاری را می توانید انجام دهید؟
What Will You Be Able to Do When Finishing This Course?
طرح کلی دوره
Outline of the Course
مدیریت ارزش های گمشده در داده های شما
Handling Missing Values in Your Data
خلاصه: استفاده از شاخص ها در پانداها
Recap: Using Indexers in Pandas
نسخه ی نمایشی: NaNs را شناسایی کنید - قسمت 1
Demo: Identify NaNs - Part1
نسخه ی نمایشی: NaNs را شناسایی کنید - قسمت 2
Demo: Identify NaNs - Part2
نسخه ی نمایشی: سطرها یا ستون هایی را با تعدادی NaN رها کنید - قسمت 1
Demo: Drop Rows or Columns with a Number of NaNs - Part1
نسخه ی نمایشی: سطرها یا ستون هایی را با تعدادی NaN رها کنید - قسمت 2
Demo: Drop Rows or Columns with a Number of NaNs - Part2
نسخه ی نمایشی: سطرها یا ستون هایی را با تعدادی NaN رها کنید - قسمت 3
Demo: Drop Rows or Columns with a Number of NaNs - Part3
نسخه ی نمایشی: استفاده از پرکننده ها برای جایگزینی NaNs
Demo: Using Fillers to Replace NaNs
نکات و نکات کلیدی
Key Takeaways and Tips
مدیریت مقادیر تکراری در داده های شما
Handling Duplicate Values in Your Data
نسخه ی نمایشی: ردیف های تکراری را با موارد تکراری شناسایی کنید
Demo: Identify Duplicate Rows with duplicated
نسخه ی نمایشی: اگر برخی از ستون ها تکراری هستند با drop_duplicates سطرها را رها کنید
Demo: Drop Rows if Some Columns Are Duplicate with drop_duplicates
نکات و نکات کلیدی
Key Takeaways and Tips
مدیریت مقادیر نامعتبر در داده های شما
Handling Invalid Values in Your Data
نسخه ی نمایشی: استفاده از توابع با Apply برای شناسایی ردیف های نامعتبر و رفع آنها - قسمت 1
Demo: Using Functions with Apply to Detect Invalid Rows and Fix Them - Part1
نسخه ی نمایشی: استفاده از توابع با Apply برای شناسایی ردیف های نامعتبر و رفع آنها - قسمت 2
Demo: Using Functions with Apply to Detect Invalid Rows and Fix Them - Part2
نسخه ی نمایشی: استفاده از Replace برای معتبر کردن داده ها
Demo: Using Replace to Make Data Valid
آکسل سیروتا دارای مدرک کارشناسی ارشد ریاضیات است که علاقه زیادی به عملیات یادگیری عمیق و یادگیری ماشین دارد. وی پس از تحقیق در زمینه احتمال ، آمار و بهینه سازی یادگیری ماشین ، در حال حاضر در JAMPP به عنوان یک مهندس تحقیق در زمینه یادگیری ماشین مشغول به کار است که از داده های مشتری برای پیش بینی دقیق در زمان واقعی پیشنهاد استفاده می کند.
نمایش نظرات