پاکسازی داده ها در آموزش ضروری پایتون

Data Cleaning in Python Essential Training

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:

آیا باید بدانید که چگونه داده ها را برای شرکت خود تمیز و منظم نگه دارید؟ در این دوره ، مربی Miki Tebeka توضیح می دهد که چرا داده های تمیز بسیار مهم هستند ، چه چیزی می تواند باعث خطا شود و چگونه می توان خطاها را تشخیص داده ، از آنها جلوگیری کرده و آنها را تمیز نگه داشت. میکی انواع خطاهایی که ممکن است در داده ها رخ دهد و همچنین مقادیر مفقود شده یا مقادیر بد در داده ها را توضیح می دهد. او می گوید که چگونه خطاهای انسانی ، خطاهای معرفی شده توسط ماشین و خطاهای طراحی می توانند به داده های شما راه پیدا کنند ، سپس نحوه تشخیص این خطاها را به شما نشان می دهد. میکی با تکنیک هایی مانند امضای دیجیتال ، خطوط داده و اتوماسیون و معاملات به پیشگیری از خطا می پردازد. وی با روش هایی که می توانید خطاها را برطرف کنید ، از جمله تغییر نام فیلدها ، رفع انواع ، پیوستن و تقسیم داده ها و موارد دیگر ، به پایان می رساند.


سرفصل ها و درس ها

معرفی Introduction

  • چرا داده های پاک مهم هستند؟ Why is clean data important?

  • آنچه باید بدانید What you should know

1. داده های بد 1. Bad Data

  • انواع خطاها Types of errors

  • ارزش از دست رفته Missing values

  • ارزش های بد Bad values

  • تکراری Duplicates

  • فصلنامه Chapter Quiz

2. علل خطاها 2. Causes of Errors

  • خطاهای انسانی Human errors

  • خطاهای ماشین Machine errors

  • خطاهای طراحی Design errors

  • چالش: طراحی رابط کاربری Challenge: UI design

  • راه حل: طراحی رابط کاربری Solution: UI design

  • فصل مسابقه Chapter Quiz

3. تشخیص خطاها 3. Detecting Errors

  • طرحواره ها Schemas

  • اعتبار سنجی Validation

  • یافتن داده های مفقود شده Finding missing data

  • دانش حوزه Domain knowledge

  • زیر گروه ها Subgroups

  • چالش: داده های بد را پیدا کنید Challenge: Find bad data

  • راه حل: داده های بد را پیدا کنید Solution: Find bad data

  • فصل مسابقه Chapter Quiz

4. جلوگیری از خطاها 4. Preventing Errors

  • قالب های سریال سازی Serialization formats

  • امضای دیجیتالی Digital signatures

  • خطوط داده و اتوماسیون Data pipelines and automation

  • معاملات Transactions

  • سازماندهی داده ها و داده های مرتب Data organization and tidy data

  • معیارهای کیفیت پردازش و داده ها Process and data quality metrics

  • چالش: ETL Challenge: ETL

  • راه حل: ETL Solution: ETL

  • فصل مسابقه Chapter Quiz

5. رفع خطاها 5. Fixing Errors

  • تغییر نام زمینه ها Renaming fields

  • رفع انواع Fixing types

  • پیوستن و تقسیم داده ها Joining and splitting data

  • حذف اطلاعات بد Deleting bad data

  • پر کردن مقادیر از دست رفته Filling missing values

  • تغییر شکل داده ها Reshaping data

  • چالش: درآمد کارگاه Challenge: Workshop earnings

  • راه حل: درآمد کارگاه Solution: Workshop earnings

  • فصلنامه Chapter Quiz

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

پاکسازی داده ها در آموزش ضروری پایتون
جزییات دوره
49m
40
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
-
- از 5
ندارد
دارد
دارد
Miki Tebeka
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Miki Tebeka Miki Tebeka

مدیر عامل در 353Solutions

Miki Tebeka مدیرعامل 353Solutions است.

در کار خود در 353Solutions، Miki کارگاه های عملی ارائه می دهد که به متخصصان کمک می کند درک خود را از Python تقویت کنند. و برو. علاوه بر این، او خدمات مشاوره ای متناسب با تخصص در ساخت زیرساخت های کلان داده را ارائه می دهد. همانطور که کار او در 353Solutions نشان می دهد، او در Python and Go و همچنین C++، JavaScript، Clojure و موارد دیگر مهارت بالایی دارد.