لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
پاکسازی داده ها در آموزش ضروری پایتون
Data Cleaning in Python Essential Training
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
آیا باید بدانید که چگونه داده ها را برای شرکت خود تمیز و منظم نگه دارید؟ در این دوره ، مربی Miki Tebeka توضیح می دهد که چرا داده های تمیز بسیار مهم هستند ، چه چیزی می تواند باعث خطا شود و چگونه می توان خطاها را تشخیص داده ، از آنها جلوگیری کرده و آنها را تمیز نگه داشت. میکی انواع خطاهایی که ممکن است در داده ها رخ دهد و همچنین مقادیر مفقود شده یا مقادیر بد در داده ها را توضیح می دهد. او می گوید که چگونه خطاهای انسانی ، خطاهای معرفی شده توسط ماشین و خطاهای طراحی می توانند به داده های شما راه پیدا کنند ، سپس نحوه تشخیص این خطاها را به شما نشان می دهد. میکی با تکنیک هایی مانند امضای دیجیتال ، خطوط داده و اتوماسیون و معاملات به پیشگیری از خطا می پردازد. وی با روش هایی که می توانید خطاها را برطرف کنید ، از جمله تغییر نام فیلدها ، رفع انواع ، پیوستن و تقسیم داده ها و موارد دیگر ، به پایان می رساند.
سرفصل ها و درس ها
معرفی
Introduction
چرا داده های پاک مهم هستند؟
Why is clean data important?
آنچه باید بدانید
What you should know
1. داده های بد
1. Bad Data
انواع خطاها
Types of errors
ارزش از دست رفته
Missing values
ارزش های بد
Bad values
تکراری
Duplicates
فصلنامه
Chapter Quiz
2. علل خطاها
2. Causes of Errors
خطاهای انسانی
Human errors
خطاهای ماشین
Machine errors
خطاهای طراحی
Design errors
چالش: طراحی رابط کاربری
Challenge: UI design
راه حل: طراحی رابط کاربری
Solution: UI design
فصل مسابقه
Chapter Quiz
3. تشخیص خطاها
3. Detecting Errors
طرحواره ها
Schemas
اعتبار سنجی
Validation
یافتن داده های مفقود شده
Finding missing data
دانش حوزه
Domain knowledge
زیر گروه ها
Subgroups
چالش: داده های بد را پیدا کنید
Challenge: Find bad data
راه حل: داده های بد را پیدا کنید
Solution: Find bad data
فصل مسابقه
Chapter Quiz
4. جلوگیری از خطاها
4. Preventing Errors
قالب های سریال سازی
Serialization formats
امضای دیجیتالی
Digital signatures
خطوط داده و اتوماسیون
Data pipelines and automation
معاملات
Transactions
سازماندهی داده ها و داده های مرتب
Data organization and tidy data
معیارهای کیفیت پردازش و داده ها
Process and data quality metrics
در کار خود در 353Solutions، Miki کارگاه های عملی ارائه می دهد که به متخصصان کمک می کند درک خود را از Python تقویت کنند. و برو. علاوه بر این، او خدمات مشاوره ای متناسب با تخصص در ساخت زیرساخت های کلان داده را ارائه می دهد. همانطور که کار او در 353Solutions نشان می دهد، او در Python and Go و همچنین C++، JavaScript، Clojure و موارد دیگر مهارت بالایی دارد.
نمایش نظرات