نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره:
تمیز کردن مجموعه داده یک قسمت اساسی در هر پروژه داده ای است ، اما می تواند چالش برانگیز باشد. این دوره اصول تمیز کردن مجموعه داده ها با پانداها را به شما می آموزد و روشهایی را به شما می آموزد که می توانید بلافاصله در پروژه های دنیای واقعی اعمال کنید. در هسته هر پروژه موفق که شامل یک مجموعه داده دنیای واقعی است ، دانش کاملی در مورد تمیز کردن آن است مجموعه داده از داده های گمشده ، بد یا نادرست. در این دوره ، Cleaning Data: Python Data Playbook ، شما می آموزید که چگونه از pandas برای تمیز کردن مجموعه داده های دنیای واقعی استفاده کنید. ابتدا یاد خواهید گرفت که چگونه داده های خود را درک ، مشاهده و کاوش کنید. در مرحله بعدی ، نحوه دستیابی به فقط داده هایی را که می خواهید در مجموعه داده خود نگه دارید ، جستجو خواهید کرد. سرانجام ، روش های مختلفی برای مدیریت داده های بد و از دست رفته کشف خواهید کرد. وقتی این دوره را به پایان رسانید ، دانش بنیادی در زمینه تمیز کردن مجموعه داده های دنیای واقعی با پانداها خواهید داشت که به شما کمک خواهد کرد تا وقتی که به سمت کار روی علوم داده دنیای واقعی یا مشکلات یادگیری ماشین می روید ، به شما کمک کند.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
-
بررسی اجمالی دوره
Course Overview
درک اطلاعات شما
Understanding Your Data
-
مقدمه
Introduction
-
مشاهده و تبدیل انواع
Viewing and Converting Types
-
جمع آوری داده ها
Aggregating Data
-
عادی سازی داده ها
Normalizing Data
-
تبدیل داده ها
Transforming Data
-
فیلتر کردن داده ها
Filtering Data
-
مرور
Review
حذف و رفع ستون ها با پاندا
Removing and Fixing Columns with pandas
-
مقدمه
Introduction
-
رها کردن ستون ها
Dropping Columns
-
تغییر پوشش ستون
Changing Column Casing
-
تغییر نام ستون ها
Renaming Columns
-
مرور
Review
مجموعه داده ها و نمایه سازی
Indexing and Filtering Datasets
-
مقدمه
Introduction
-
فیلتر مستقیم با براکت های مربعی
Direct Filtering with Square Brackets
-
نمایه سازی داده با .loc
Data Indexing with .loc
-
با استفاده از .iloc برای دسترسی به ردیف ها یا ستون های خاص
Using .iloc to Access Specific Rows or Columns
-
فیلتر کردن داده ها با str.contains
Filtering Data with str.contains
-
مرور
Review
مدیریت داده های بد ، مفقود شده و تکراری
Handling Bad, Missing, and Duplicate Data
-
مقدمه
Introduction
-
برداشتن فضای سفید
Stripping White Space
-
جایگزینی داده های بد با NaN
Replacing Bad Data with NaN
-
پر کردن داده های از دست رفته با یک مقدار
Filling Missing Data with a Value
-
ردیف داده ها را رها کنید
Dropping Rows of Data
-
شناسایی و رها کردن داده های تکراری
Identifying and Dropping Duplicate Data
-
مرور
Review
نمایش نظرات