آموزش تمیز کردن داده ها: Python Data Playbook

Cleaning Data: Python Data Playbook

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره: تمیز کردن مجموعه داده یک قسمت اساسی در هر پروژه داده ای است ، اما می تواند چالش برانگیز باشد. این دوره اصول تمیز کردن مجموعه داده ها با پانداها را به شما می آموزد و روشهایی را به شما می آموزد که می توانید بلافاصله در پروژه های دنیای واقعی اعمال کنید. در هسته هر پروژه موفق که شامل یک مجموعه داده دنیای واقعی است ، دانش کاملی در مورد تمیز کردن آن است مجموعه داده از داده های گمشده ، بد یا نادرست. در این دوره ، Cleaning Data: Python Data Playbook ، شما می آموزید که چگونه از pandas برای تمیز کردن مجموعه داده های دنیای واقعی استفاده کنید. ابتدا یاد خواهید گرفت که چگونه داده های خود را درک ، مشاهده و کاوش کنید. در مرحله بعدی ، نحوه دستیابی به فقط داده هایی را که می خواهید در مجموعه داده خود نگه دارید ، جستجو خواهید کرد. سرانجام ، روش های مختلفی برای مدیریت داده های بد و از دست رفته کشف خواهید کرد. وقتی این دوره را به پایان رسانید ، دانش بنیادی در زمینه تمیز کردن مجموعه داده های دنیای واقعی با پانداها خواهید داشت که به شما کمک خواهد کرد تا وقتی که به سمت کار روی علوم داده دنیای واقعی یا مشکلات یادگیری ماشین می روید ، به شما کمک کند.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

درک اطلاعات شما Understanding Your Data

  • مقدمه Introduction

  • مشاهده و تبدیل انواع Viewing and Converting Types

  • جمع آوری داده ها Aggregating Data

  • عادی سازی داده ها Normalizing Data

  • تبدیل داده ها Transforming Data

  • فیلتر کردن داده ها Filtering Data

  • مرور Review

حذف و رفع ستون ها با پاندا Removing and Fixing Columns with pandas

  • مقدمه Introduction

  • رها کردن ستون ها Dropping Columns

  • تغییر پوشش ستون Changing Column Casing

  • تغییر نام ستون ها Renaming Columns

  • مرور Review

مجموعه داده ها و نمایه سازی Indexing and Filtering Datasets

  • مقدمه Introduction

  • فیلتر مستقیم با براکت های مربعی Direct Filtering with Square Brackets

  • نمایه سازی داده با .loc Data Indexing with .loc

  • با استفاده از .iloc برای دسترسی به ردیف ها یا ستون های خاص Using .iloc to Access Specific Rows or Columns

  • فیلتر کردن داده ها با str.contains Filtering Data with str.contains

  • مرور Review

مدیریت داده های بد ، مفقود شده و تکراری Handling Bad, Missing, and Duplicate Data

  • مقدمه Introduction

  • برداشتن فضای سفید Stripping White Space

  • جایگزینی داده های بد با NaN Replacing Bad Data with NaN

  • پر کردن داده های از دست رفته با یک مقدار Filling Missing Data with a Value

  • ردیف داده ها را رها کنید Dropping Rows of Data

  • شناسایی و رها کردن داده های تکراری Identifying and Dropping Duplicate Data

  • مرور Review

نمایش نظرات

آموزش تمیز کردن داده ها: Python Data Playbook
جزییات دوره
1h 8m
26
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
44
4.7 از 5
دارد
دارد
دارد
Chris Achard
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Chris Achard Chris Achard

Chris یک مشاور نرم افزاری مستقل است که در زمینه یادگیری وب ، موبایل و ماشین تمرکز دارد. او در درجه اول از React.js با Node.js یا Ruby on Rails برای برنامه های وب ، React Native برای برنامه های تلفن همراه و Python برای یادگیری ماشین و علم داده استفاده می کند. او یک کتاب الکترونیکی درباره React نوشته است و از آموزش توسعه نرم افزار به دیگران هیجان زده است. اخیراً ، او در حال آزمایش مدل های هوش مصنوعی مولد و سایر تکنیک های پیشرفته هوش مصنوعی است.