پاکسازی داده ها در آموزش ضروری پایتون

Data Cleaning in Python Essential Training

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: اگر به دنبال راه‌های کارآمدتری برای آماده‌سازی داده‌های خود برای تجزیه و تحلیل هستید، زمان آن رسیده است که مجموعه مهارت‌های خود را ارتقا دهید و رویکرد خود را برای پاکسازی داده‌ها ارزیابی مجدد کنید. در این دوره، مربی Miki Tebeka برخی از مهم‌ترین ویژگی‌های پاکسازی و جمع‌آوری داده‌های تولیدی را با مثال‌های کدنویسی عملی با استفاده از پایتون برای آزمایش مهارت‌های شما به شما نشان می‌دهد. در مورد ارزش سازمانی داده های تمیز با کیفیت بالا بیاموزید، توانایی خود را برای تشخیص خطاهای رایج و رفع سریع آنها در حین پیشرفت توسعه دهید. در طول مسیر، Miki استراتژی‌های تمیز کردنی را ارائه می‌کند که می‌تواند به بهینه‌سازی گردش کار شما کمک کند، از جمله نکاتی برای تجزیه و تحلیل علّی و ابزارهای آسان برای جلوگیری از خطا.

این دوره با GitHub Codespaces یکپارچه شده است، یک محیط توسعه دهنده ابر فوری که تمام عملکردهای IDE مورد علاقه شما را بدون نیاز به هیچ گونه راه اندازی ماشین محلی ارائه می دهد. با GitHub Codespaces، می‌توانید در هر زمان و در هر زمانی از هر ماشینی تمرین عملی داشته باشید، در حالی که از ابزاری استفاده می‌کنید که احتمالاً در محل کار با آن مواجه خواهید شد. برای یادگیری نحوه شروع، ویدیوی «استفاده از فضاهای کد GitHub با این دوره» را بررسی کنید.

سرفصل ها و درس ها

معرفی Introduction

  • استفاده از GitHub Codespaces با این دوره Using GitHub Codespaces with this course

  • چرا داده های پاک مهم هستند؟ Why is clean data important?

  • آنچه شما باید بدانید What you should know

1. داده های بد 1. Bad Data

  • ارزش های بد Bad values

  • موارد تکراری Duplicates

  • ارزش از دست رفته Missing values

  • انواع خطاها Types of errors

2. علل خطاها 2. Causes of Errors

  • راه حل: طراحی UI Solution: UI design

  • خطاهای ماشین Machine errors

  • چالش: طراحی UI Challenge: UI design

  • خطاهای انسانی Human errors

  • خطاهای طراحی Design errors

3. تشخیص خطاها 3. Detecting Errors

  • راه حل: داده های بد را پیدا کنید Solution: Find bad data

  • اعتبار سنجی Validation

  • چالش: داده های بد را پیدا کنید Challenge: Find bad data

  • دانش دامنه Domain knowledge

  • زیر گروه ها Subgroups

  • طرحواره ها Schemas

  • یافتن داده های از دست رفته Finding missing data

4. جلوگیری از خطاها 4. Preventing Errors

  • فرمت های سریال سازی Serialization formats

  • چالش: ETL Challenge: ETL

  • معاملات Transactions

  • امضای دیجیتالی Digital signature

  • معیارهای کیفیت فرآیند و داده Process and data quality metrics

  • راه حل: ETL Solution: ETL

  • سازماندهی داده ها و داده های مرتب Data organization and tidy data

  • خطوط لوله داده و اتوماسیون Data pipelines and automation

5. رفع خطاها 5. Fixing Errors

  • چالش: درآمد کارگاهی Challenge: Workshop earnings

  • حذف داده های بد Deleting bad data

  • انواع تعمیر Fixing types

  • پر کردن مقادیر از دست رفته Filling missing values

  • راه حل: درآمد کارگاهی Solution: Workshop earnings

  • پیوستن و تقسیم داده ها Joining and splitting data

  • تغییر شکل داده ها Reshaping data

  • تغییر نام فیلدها Renaming fields

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

پاکسازی داده ها در آموزش ضروری پایتون
جزییات دوره
1h 5m
36
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
19,156
- از 5
ندارد
دارد
دارد
Miki Tebeka
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Miki Tebeka Miki Tebeka

مدیر عامل در 353Solutions

Miki Tebeka مدیرعامل 353Solutions است.

در کار خود در 353Solutions، Miki کارگاه های عملی ارائه می دهد که به متخصصان کمک می کند درک خود را از Python تقویت کنند. و برو. علاوه بر این، او خدمات مشاوره ای متناسب با تخصص در ساخت زیرساخت های کلان داده را ارائه می دهد. همانطور که کار او در 353Solutions نشان می دهد، او در Python and Go و همچنین C++، JavaScript، Clojure و موارد دیگر مهارت بالایی دارد.