آموزش دستکاری داده ها در پایتون: دوره سقوط پانداها

Data Manipulation in Python: A Pandas Crash Course

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: یاد بگیرید که چگونه از پایتون و پانداها برای تجزیه و تحلیل داده ها و دستکاری داده ها استفاده کنید. تبدیل، پاکسازی و ادغام داده ها با پایتون. تجسم داده ها با استفاده از روش هایی از هیستوگرام تا کاهش ابعاد. ایجاد، ذخیره و سریال‌سازی فریم‌های داده در قالب‌های مختلف و خارج از آن. داده ها را به راحتی تمیز و قالب بندی کنید. مقادیر از دست رفته را شناسایی و هوشمندانه پر کنید. داده های خود را گروه بندی، جمع آوری و خلاصه کنید. منابع داده را در یک کل زیبا ادغام کنید. مانند یک حرفه ای، داده ها را محوری و جداول بندی کنید. داده های سری زمانی را با هم ترکیب، خلاصه و بررسی کنید. به طور یکپارچه با داده های مناطق زمانی مختلف کار کنید. تله ها و دام های رایجی که افراد مبتدی را به دام می اندازد و نحوه اجتناب از آنها را بیاموزید. پیش نیازها: دانش پایه پایتون

در دنیای واقعی، داده‌ها چیزی جز تمیز هستند، به همین دلیل است که کتابخانه‌های پایتون مانند پانداها بسیار ارزشمند هستند.


اگر دستکاری داده‌ها جریان کار تجزیه و تحلیل داده‌های شما را به عقب تنظیم می‌کند، این دوره کلید بازگشت قدرت شماست.


مالک داده‌هایتان باشید، اجازه ندهید داده‌هایتان مالک شما شوند!


زمانی که دستکاری و آماده‌سازی داده‌ها تا ۸۰ درصد از کار شما را به عنوان یک دانشمند داده تشکیل می‌دهد، یادگیری تکنیک‌های جمع‌آوری داده‌ها که داده‌های خام را برای تجزیه و تحلیل تا حد ممکن به محصول نهایی می‌برد، برای موفقیت ضروری است.


تجزیه و تحلیل داده‌ها با پاندای کتابخانه پایتون، دستیابی به نتایج بهتر، افزایش بهره‌وری، صرف زمان بیشتر برای حل مسئله و زمان کمتری برای بحث در مورد داده‌ها را برای شما آسان‌تر می‌کند و بینش‌های خود را به‌طور مؤثرتر منتقل می‌کند.


این دوره شما را برای انجام این کار آماده می کند!


با Pandas DataFrame، خود را برای یادگیری روش‌های دستکاری، آماده‌سازی، مرتب‌سازی، ترکیب و پاک‌سازی داده‌های پیشرفته برای تبدیل بیت‌های آشفته داده به محصول پیش‌تحلیل نهایی آماده کنید. دقیقاً به همین دلیل است که Pandas محبوب‌ترین کتابخانه پایتون در علم داده است و به همین دلیل است که دانشمندان داده در Google، Facebook، JP Morgan، و تقریباً هر شرکت بزرگ دیگری که داده‌ها را تجزیه و تحلیل می‌کند، از پانداها استفاده می‌کنند.


اگر می خواهید یاد بگیرید که چگونه از پانداها برای دستکاری، تبدیل، چرخش، پشته، ادغام و تجمیع داده های خود برای آماده سازی تجسم، تجزیه و تحلیل آماری یا یادگیری ماشینی استفاده کنید، این دوره برای شما مناسب است.


در اینجا چیزی است که هنگام ثبت نام نزد استاد خود، Ph.D. ساموئل هینتون:


  • تکنیک‌های متداول و پیشرفته دستکاری داده‌های پانداها را بیاموزید تا داده‌های خام را به محصول نهایی برای تجزیه‌وتحلیل تا حد امکان کارآمد ببرید.

  • با صرف زمان بیشتر برای حل مسئله و زمان کمتری برای بحث در مورد داده ها، به نتایج بهتری دست یابید.

  • با نحوه شکل‌دهی و دستکاری داده‌ها برای ساده‌تر کردن تحلیل آماری و یادگیری ماشینی تا حد امکان آشنا شوید.

  • از آخرین نسخه Python و کتابخانه استاندارد صنعت Pandas استفاده کنید.

انجام تجزیه و تحلیل داده‌ها با کتابخانه Pandas پایتون می‌تواند به شما کمک زیادی کند، اما دارای معایبی است. و این دوره به شما کمک می کند تا آنها را به طور مستقیم شکست دهید:


1. پانداها منحنی یادگیری تند دارند: با شیرجه رفتن در کتابخانه پانداها، شیب یادگیری تندتر و تندتر می شود. این دوره، کاربران مبتدی و متوسط ​​را به راحتی به تمام جنبه های پانداها راهنمایی می کند.


2. اسناد ناکافی: بدون مستندات مناسب، یادگیری یک کتابخانه جدید دشوار است. وقتی صحبت از عملکردهای پیشرفته می شود، مستندات پاندا به ندرت مفید است. این دوره به شما کمک می کند تا تکنیک های پیشرفته پانداها را به راحتی درک کنید و در زمان شما در جستجوی کمک صرفه جویی می کند.


پس از این دوره، شما احساس راحتی می کنید که در مجموعه داده های پیچیده و ناهمگن با اطمینان کامل بدانید که می توانید یک نتیجه مفید برای مرحله بعدی تجزیه و تحلیل داده ها ایجاد کنید.


در اینجا نگاهی دقیق تر به برنامه درسی آمده است:

  • بارگیری و ایجاد Pandas DataFrames

  • نمایش داده‌های شما با نمودارهای اصلی و تجسم‌های یک بعدی، دو بعدی و چند بعدی.

  • انجام دستکاری‌های پایه DataFrame: نمایه‌سازی، برچسب‌گذاری، برش سفارشی، فیلتر کردن و موارد دیگر.

  • انجام دستکاری‌های پیشرفته Pandas DataFrame: چند نمایه‌سازی، انباشته‌سازی، فهرست‌بندی سلسله مراتبی، چرخش، ذوب و موارد دیگر.

  • انجام گروه‌بندی DataFrame: تجمیع، انتساب و موارد دیگر.

  • تسلط بر دستکاری‌های سری زمانی: فهرست‌بندی مجدد، نمونه‌برداری مجدد، توابع چرخشی، زنجیره‌سازی و فیلتر کردن روش، و موارد دیگر.

  • ادغام Pandas DataFrames

در نهایت، این دوره دارای یک برگه تقلب و تمرینات عملی است که بر اساس مثال های واقعی ساخته شده اند. بنابراین نه تنها تئوری را یاد خواهید گرفت، بلکه با پانداها نیز تمرین عملی خواهید داشت.


سرفصل ها و درس ها

معرفی Introduction

  • من کی هستم؟ و نحوه دریافت کمک Who Am I? And how to get help

  • راه اندازی پایتون و ویرایشگرها Setting up python and editors

  • نصب زنده Live Install

  • مواد را دریافت کنید Get the materials

معرفی Introduction

  • معرفی Introduction

  • معرفی Introduction

  • من کی هستم؟ و نحوه دریافت کمک Who Am I? And how to get help

  • جایزه: مسیر یادگیری BONUS: Learning Path

  • جایزه: مسیر یادگیری BONUS: Learning Path

  • راه اندازی پایتون و ویرایشگرها Setting up python and editors

  • نصب زنده Live Install

  • مواد را دریافت کنید Get the materials

مبانی مجموعه داده Dataset Basics

  • یافتن مجموعه داده ها Finding Datasets

  • نوت بوک های Jupyter و بارگیری داده ها Jupyter Notebooks and Loading Data

  • پانداها در مقابل نامپی Pandas vs Numpy

  • ایجاد DataFrame Creating DataFrames

مبانی مجموعه داده Dataset Basics

  • یافتن مجموعه داده ها Finding Datasets

  • نوت بوک های Jupyter و بارگیری داده ها Jupyter Notebooks and Loading Data

  • پانداها در مقابل نامپی Pandas vs Numpy

  • ایجاد DataFrame Creating DataFrames

  • ذخیره و سریال سازی Saving and Serialising

  • ذخیره و سریال سازی Saving and Serialising

  • بازرسی DataFrames Inspecting DataFrames

  • بازرسی DataFrames Inspecting DataFrames

کاوش بصری Visual exploration

  • مقدمه و طرح های فوق العاده ابتدایی Introduction and super basic plots

  • تجسم توزیع های 1 بعدی Visualising 1D distributions

  • تجسم توزیع های دو بعدی Visualising 2D distributions

  • خلاصه Summary

کاوش بصری Visual exploration

  • مقدمه و طرح های فوق العاده ابتدایی Introduction and super basic plots

  • پانداها در مقابل Matplotlib Pandas vs Matplotlib

  • پانداها در مقابل Matplotlib Pandas vs Matplotlib

  • تجسم توزیع های 1 بعدی Visualising 1D distributions

  • تجسم توزیع های دو بعدی Visualising 2D distributions

  • حالت دادن به خروجی های جدول پانداها Styling Pandas Table outputs

  • حالت دادن به خروجی های جدول پانداها Styling Pandas Table outputs

  • تجسم ابعاد بالاتر Higher dimension visualisations

  • تجسم ابعاد بالاتر Higher dimension visualisations

  • خلاصه Summary

دستکاری داده های پایه Basic Data Manipulations

  • حذف و اضافه کردن داده ها Removing and adding data

  • خلاصه Summary

دستکاری داده های پایه Basic Data Manipulations

  • معرفی، برچسب گذاری و سفارش Introduction, Labelling and Ordering

  • معرفی، برچسب گذاری و سفارش Introduction, Labelling and Ordering

  • برش و فیلتر کردن Slicing and Filtering

  • برش و فیلتر کردن Slicing and Filtering

  • جایگزینی و آستانه گذاری Replacing and Thresholding

  • جایگزینی و آستانه گذاری Replacing and Thresholding

  • حذف و اضافه کردن داده ها Removing and adding data

  • اعمال، نقشه و توابع برداری Apply, map and vectorised functions

  • اعمال، نقشه و توابع برداری Apply, map and vectorised functions

  • خلاصه Summary

گروه بندی Grouping

  • انتساب هوشمند Intelligent imputation

  • خلاصه Summary

گروه بندی Grouping

  • معرفی و انگیزه Introduction and motivation

  • معرفی و انگیزه Introduction and motivation

  • نحو اصلی گروه بندی Basic grouping syntax

  • نحو اصلی گروه بندی Basic grouping syntax

  • انتساب هوشمند Intelligent imputation

  • تجمیع گروه بندی Grouping aggregation

  • تجمیع گروه بندی Grouping aggregation

  • خلاصه Summary

ادغام Merging

  • انواع مختلف ادغام Different types of merging

ادغام Merging

  • مقدمه و نحو اولیه Introduction and basic syntax

  • مقدمه و نحو اولیه Introduction and basic syntax

  • انواع مختلف ادغام Different types of merging

  • توابع ادغام مفید Helpful merging functions

  • توابع ادغام مفید Helpful merging functions

  • خلاصه Summary

دستکاری پیشرفته - MultiIdex، Pivoting و موارد دیگر Advanced Manipulation - MultiIndex, Pivoting and more

  • حاشیه های محوری Pivot Margins

  • خلاصه Summary

دستکاری پیشرفته - MultiIdex، Pivoting و موارد دیگر Advanced Manipulation - MultiIndex, Pivoting and more

  • مقدمه و مولتی ایندکس های اساسی Introduction and basic MultiIndexes

  • مقدمه و مولتی ایندکس های اساسی Introduction and basic MultiIndexes

  • MultiIndex II - MultiIndex Strikes Back MultiIndex II - MultiIndex Strikes Back

  • MultiIndex II - MultiIndex Strikes Back MultiIndex II - MultiIndex Strikes Back

  • انباشته کردن و جدا کردن Stacking and Unstacking

  • انباشته کردن و جدا کردن Stacking and Unstacking

  • چرخش Pivoting

  • چرخش Pivoting

  • حاشیه های محوری Pivot Margins

  • Crosstab Crosstab

  • Crosstab Crosstab

  • ذوب شدن Melting

  • ذوب شدن Melting

  • خلاصه Summary

داده های سری زمانی Time Series Data

  • مقدمه و شاخص تاریخ Introduction and the Datetime Index

  • فهرست بندی مجدد Reindexing

  • نمونه گیری مجدد Resampling

  • خلاصه Summary

داده های سری زمانی Time Series Data

  • مقدمه و شاخص تاریخ Introduction and the Datetime Index

  • فهرست بندی مجدد Reindexing

  • نمونه گیری مجدد Resampling

  • توابع نورد Rolling functions

  • توابع نورد Rolling functions

  • محدوده های زمانی Time Zones

  • محدوده های زمانی Time Zones

  • خلاصه Summary

  • خلاصه Summary

نتیجه Conclusion

  • خلاصه و تشکر A recap and a thank you

  • Extra - Chapter 3 Visualization Runthrough Extra - Chapter 3 Visualisation Runthrough

  • اضافی - فصل 5 گروه بندی Runthrough Extra - Chapter 5 Grouping Runthrough

  • اضافی - فصل 6 ادغام Runthrough Extra - Chapter 6 Merging Runthrough

  • Extra - Chapter 7 Advanced Runthrough Extra - Chapter 7 Advanced Runthrough

  • Extra - Chapter 8 TimeSeries Runthrough Extra - Chapter 8 TimeSeries Runthrough

نتیجه Conclusion

  • خلاصه و تشکر A recap and a thank you

  • اضافی - سفارشی کردن نوت بوک های Jupyter Extra - Customising Jupyter Notebooks

  • اضافی - سفارشی کردن نوت بوک های Jupyter Extra - Customising Jupyter Notebooks

  • Extra - Chapter 2 Data Runthrough Extra - Chapter 2 Data Runthrough

  • Extra - Chapter 2 Data Runthrough Extra - Chapter 2 Data Runthrough

  • Extra - Chapter 3 Visualization Runthrough Extra - Chapter 3 Visualisation Runthrough

  • اضافی - فصل 4 مبانی Runthrough Extra - Chapter 4 Basics Runthrough

  • اضافی - فصل 4 مبانی Runthrough Extra - Chapter 4 Basics Runthrough

  • اضافی - فصل 5 گروه بندی Runthrough Extra - Chapter 5 Grouping Runthrough

  • اضافی - فصل 6 ادغام Runthrough Extra - Chapter 6 Merging Runthrough

  • Extra - Chapter 7 Advanced Runthrough Extra - Chapter 7 Advanced Runthrough

  • Extra - Chapter 8 TimeSeries Runthrough Extra - Chapter 8 TimeSeries Runthrough

نمایش نظرات

آموزش دستکاری داده ها در پایتون: دوره سقوط پانداها
جزییات دوره
9 hours
57
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
38,376
4.5 از 5
دارد
دارد
دارد
Samuel Hinton
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Samuel Hinton Samuel Hinton

اخترفیزیکدان ، مهندس نرم افزار و مجری سلام ، من سام هستم و یک اخترفیزیکدان ، دانشمند داده ، مهندس رباتیک و نرم افزار ، ستاره شناس و مجری عمومی هستم. کار اصلی من شامل بررسی ماهیت انرژی تاریک است ، با این حال زمان زیادی را نیز صرف حمایت از توسعه منبع باز و شیوه های مناسب کدگذاری می کنم. با سالها تجربه از صنعت نرم افزار مالی گرفته تا خطوط لوله یادگیری ماشین طبقه بندی اشیا in در آسمان شب و تجربه آموزش در آمار ، مهندسی نرم افزار ، دستکاری داده ها ، فیزیک محاسباتی و موارد دیگر ، من به افزایش سطح مهارت برنامه نویسی اختصاص داده ام در زمینه های علمی و آوردن دانش اولیه کدگذاری برای هر دانش آموز مشتاق. در بالای کار تحقیقاتی خود ، من کارگاه های ملی برنامه نویسی با محتوای مختلف از تازه کاران کامل تا کارشناسان تحقیق را اجرا کرده ام. من خوشحالم که دانش و محتوای خود را به مخاطبان بیشتری می رسانم ، و امیدوارم که نگرش مستقیم و من به تدریس به دانش آموزان اجازه دهد تا مفاهیم اصلی را درک کنند و در وقت و استرس دانش آموزان صرفه جویی کنند!