لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
پاکسازی داده ها در آموزش ضروری پایتون
Data Cleaning in Python Essential Training
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
اگر به دنبال راههای کارآمدتری برای آمادهسازی دادههای خود برای تجزیه و تحلیل هستید، زمان آن رسیده است که مجموعه مهارتهای خود را ارتقا دهید و رویکرد خود را برای پاکسازی دادهها ارزیابی مجدد کنید. در این دوره، مربی Miki Tebeka برخی از مهمترین ویژگیهای پاکسازی و جمعآوری دادههای تولیدی را با مثالهای کدنویسی عملی با استفاده از پایتون برای آزمایش مهارتهای شما به شما نشان میدهد. در مورد ارزش سازمانی داده های تمیز با کیفیت بالا بیاموزید، توانایی خود را برای تشخیص خطاهای رایج و رفع سریع آنها در حین پیشرفت توسعه دهید. در طول مسیر، Miki استراتژیهای تمیز کردنی را ارائه میکند که میتواند به بهینهسازی گردش کار شما کمک کند، از جمله نکاتی برای تجزیه و تحلیل علّی و ابزارهای آسان برای جلوگیری از خطا.
این دوره با GitHub Codespaces یکپارچه شده است، یک محیط توسعه دهنده ابر فوری که تمام عملکردهای IDE مورد علاقه شما را بدون نیاز به هیچ گونه راه اندازی ماشین محلی ارائه می دهد. با GitHub Codespaces، میتوانید در هر زمان و در هر زمانی از هر ماشینی تمرین عملی داشته باشید، در حالی که از ابزاری استفاده میکنید که احتمالاً در محل کار با آن مواجه خواهید شد. برای یادگیری نحوه شروع، ویدیوی «استفاده از فضاهای کد GitHub با این دوره» را بررسی کنید.
سرفصل ها و درس ها
معرفی
Introduction
استفاده از GitHub Codespaces با این دوره
Using GitHub Codespaces with this course
چرا داده های پاک مهم هستند؟
Why is clean data important?
آنچه شما باید بدانید
What you should know
1. داده های بد
1. Bad Data
ارزش های بد
Bad values
موارد تکراری
Duplicates
ارزش از دست رفته
Missing values
انواع خطاها
Types of errors
2. علل خطاها
2. Causes of Errors
راه حل: طراحی UI
Solution: UI design
خطاهای ماشین
Machine errors
چالش: طراحی UI
Challenge: UI design
خطاهای انسانی
Human errors
خطاهای طراحی
Design errors
3. تشخیص خطاها
3. Detecting Errors
راه حل: داده های بد را پیدا کنید
Solution: Find bad data
اعتبار سنجی
Validation
چالش: داده های بد را پیدا کنید
Challenge: Find bad data
دانش دامنه
Domain knowledge
زیر گروه ها
Subgroups
طرحواره ها
Schemas
یافتن داده های از دست رفته
Finding missing data
4. جلوگیری از خطاها
4. Preventing Errors
فرمت های سریال سازی
Serialization formats
چالش: ETL
Challenge: ETL
معاملات
Transactions
امضای دیجیتالی
Digital signature
معیارهای کیفیت فرآیند و داده
Process and data quality metrics
راه حل: ETL
Solution: ETL
سازماندهی داده ها و داده های مرتب
Data organization and tidy data
خطوط لوله داده و اتوماسیون
Data pipelines and automation
در کار خود در 353Solutions، Miki کارگاه های عملی ارائه می دهد که به متخصصان کمک می کند درک خود را از Python تقویت کنند. و برو. علاوه بر این، او خدمات مشاوره ای متناسب با تخصص در ساخت زیرساخت های کلان داده را ارائه می دهد. همانطور که کار او در 353Solutions نشان می دهد، او در Python and Go و همچنین C++، JavaScript، Clojure و موارد دیگر مهارت بالایی دارد.
نمایش نظرات