آموزش پایتون و پانداها برای دستکاری داده ها

دانلود Python and Pandas for Data Manipulation

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:

این آموزش میانی پایتون و پاندا برای دستکاری داده ها، پزشکان داده را برای دستکاری و تجزیه و تحلیل داده هایی که از منابع متعدد، بزرگ و کوچک، با پانداها وارد می شود، آماده می کند.

اگر برای اولین بار است که به نام کتابخانه پایتون برخورد می کنید که در اقتصاد سنجی برای تبدیل مجموعه داده های ساختار یافته چند بعدی استفاده می شود، باید بدانید که پانداها یک نام فریبنده زیبا برای یک ابزار تجزیه و تحلیل و دستکاری داده واقعاً بسیار قدرتمند است. اگر از پایتون برای تجزیه و تحلیل داده‌ها استفاده می‌کنید، Pandas مسلماً تنها ابزاری است که داده‌ها را تغییر می‌دهد - داده‌های خام را به قالبی متفاوت تبدیل می‌کند تا مفیدتر باشد.

پس از این دوره آموزشی پانداها، داده‌های خود را به سرعت و به راحتی انتخاب، فیلتر، مرتب‌سازی، تمیز کردن و ترکیب می‌کنید.

برای هر کسی که یک تیم فناوری اطلاعات را رهبری می‌کند، این آموزش منبع باز می‌تواند برای استفاده از متخصصان داده جدید، در برنامه‌های آموزشی فردی یا تیمی، یا به عنوان یک منبع مرجع منبع باز استفاده شود.

پایتون و پانداها برای دستکاری داده ها: آنچه باید بدانید

این آموزش Python and Pandas for Data Manipulation ویدیوهایی دارد که موضوعاتی مانند:

  • استخراج معنا از اعداد
  • مدیریت منابع داده بزرگ و استخراج داده های مناسب از آنها
  • واردات، تمیز کردن، و محاسبه آمار
  • تجسم داده ها و اتخاذ تصمیمات هوشمندانه
چه کسی باید پایتون و پانداها را برای آموزش دستکاری داده ها بگیرد؟

این آموزش Python and Pandas for Data Manipulation به عنوان آموزش منبع باز در سطح مرتبط در نظر گرفته می شود، به این معنی که برای تحلیلگران داده طراحی شده است. این دوره مهارت‌های پایتون برای متخصصان جدید فناوری اطلاعات با حداقل یک سال تجربه در زمینه علم داده و متخصصان داده با تجربه که به دنبال تأیید مهارت‌های داده خود هستند، ارزشمند است.

متخصصان جدید یا مشتاق داده. تقریباً هیچ زمانی در حرفه علم داده یا تجزیه و تحلیل داده شما وجود ندارد که برای آموزش پانداها خیلی زود باشد. البته، مهم است که ابتدا اصول اولیه را بدون رد شدن از ابزارهای پیشرفته یاد بگیرید. اما همانطور که این دوره آموزشی پانداها نشان می‌دهد، دستکاری و وارد کردن داده‌ها فقط با پانداها آسان‌تر نیست - در برخی موارد، فقط ممکن است.

متخصصان باتجربه داده‌ها. اگر چندین سال است که با داده‌ها کار می‌کنید، احتمالاً برخی از کارهایی که پانداها می‌توانند انجام دهند را دیده‌اید. شاید وقتی آنها را دیدید متوجه این موضوع نشدید، اما پانداها و دیتا فریم ها استخراج، فیلتر کردن و تبدیل داده های دنیای واقعی را در سطحی دیگر ممکن می کنند. این دوره به شما نشان می دهد که چگونه از پانداها استفاده کنید و شغل داده خود را ارتقا دهید.


سرفصل ها و درس ها

نصب و راه اندازی Installation and Setup

  • معرفی Introduction

  • نصب آناکوندا Anaconda Installation

  • محیط های کوندا Conda Environments

  • چالش Challenge

  • پاسخ سوال چالش (اختیاری) Challenge Question Answers (optional)

  • فایل های تکمیلی Supplemental Files

نوت بوک ژوپیتر Jupyter Notebook

  • معرفی Introduction

  • تاریخچه مختصر Brief History

  • رابط کاربری User Interface

  • بررسی انواع داده ها Data Types Review

  • انواع سلول Cell Types

  • میانبرها Shortcuts

  • چالش کد Code Challenge

معرفی سری Series Introduction

  • معرفی Introduction

  • یک سری از یک لیست ایجاد کنید Create a Series from a list

  • ایجاد یک سری از یک فرهنگ لغت Create a Series from a dictionary

  • فایل های CSV را بخوانید Read CSV files

  • فایل های اکسل را بخوانید Read Excel files

  • عملکرد سر و دم Head and tail functions

  • ویژگی های سری Series attributes

  • روش های سری Series methods

  • فایل های تکمیلی Supplemental Files

ویژگی ها و روش های سری Series Attributes and Methods

  • معرفی Introduction

  • پارامتر و آرگومان ها Parameter and arguments

  • مرتب سازی مقادیر Sorting values

  • ویژگی های سری Series attributes

  • روش های سری Series Methods

  • جهش درونی Inplace Mutation

  • مرتب سازی شاخص های سری Sorting Series Indices

  • چالش Challenge

  • فایل های تکمیلی Supplemental Files

مبانی سری Series Basics

  • معرفی Introduction

  • کلمه کلیدی in The in keyword

  • استخراج بر اساس موقعیت Extract by position

  • استخراج با برچسب Extract by label

  • متد get(). The get() method

  • روش های ریاضی Math methods

  • متدهای idxmin() و idxmax(). The idxmin() and idxmax() methods

  • ارزش های منحصر به فرد Unique values

  • متد application(). The apply() method

  • چالش Challenge

  • فایل های تکمیلی Supplemental Files

مقدمه DataFrame DataFrame Introduction

  • مقدمه DataFrame DataFrame Introduction

  • ویژگی های مشترک سری Series shared attributes

  • روش های مشترک Shared methods

  • استخراج ستون ها Extracting columns

  • استخراج دو یا چند ستون Extracting two or more columns

  • اضافه کردن ستون ها Adding columns

  • عملیات پخش Broadcasting Operations

  • DataFrames value_counts( ) DataFrames value_counts( )

  • چالش Challenge

پاکسازی DataFrame DataFrame Cleaning

  • معرفی Introduction

  • مدیریت مقادیر تهی Handling null values

  • مقادیر null را رها کنید Drop null values

  • مقادیر گمشده را وارد کنید Impute missing values

  • مقادیر null و نه null را تشخیص دهید Detect null and not null values

  • چالش Challenge

مرتب سازی DataFrame DataFrame Sorting

  • معرفی Introduction

  • تغییر انواع داده ها Changing data types

  • مرتب سازی مقادیر Sorting values

  • مرتب سازی بر اساس شاخص ها Sort by indices

  • رتبه بندی یک سری Ranking a Series

  • چالش Challenge

فیلتر کردن داده ها Filtering Data

  • معرفی Introduction

  • بهينه سازي Optimization

  • فیلتر شرطی Conditional Filtering

  • فیلتر کردن با AND و OR Filtering with AND and OR

  • روش گنجاندن Inclusion method

  • چالش Challenge

فیلتر کردن موارد تکراری Filtering Duplicates

  • معرفی Introduction

  • بررسی موارد تکراری Checking for duplicates

  • موارد تکراری را رها کنید Drop duplicates

  • ارزش های منحصر به فرد Unique values

  • گنجاندن با () Inclusion with between()

  • چالش Challenge

  • ویدئوی راه حل Solution video

استخراج مقادیر Extracting Values

  • معرفی Introduction

  • تنظیم و تنظیم مجدد شاخص ها Setting and resetting indices

  • استخراج با loc Extraction with loc

  • استخراج با iloc Extraction with iloc

  • تنظیم مقادیر جدید Setting new values

  • چندین مقدار تنظیم کنید Set multiple values

  • چالش Challenge

روش های استخراج Extraction Methods

  • معرفی Introduction

  • روش قطره The drop method

  • برگرداندن کوچکترین و بزرگترین مقادیر Returning smallest and largest values

  • روش کجا The where method

  • روش پرس و جو The query method

  • روش کپی The copy method

  • چالش Challenge

مبانی داده های متنی Text Data Basics

  • معرفی Introduction

  • دستکاری داده های متنی Manipulating text data

  • روش های رشته ای String methods

  • روش رشته جایگزینی The replace string method

  • روش های رشته فیلتر کردن Filtering string methods

  • چالش Challenge

تقسیم و حذف داده های متنی Splitting and Stripping Text Data

  • معرفی Introduction

  • رشته های نواری Strip strings

  • روش های ستون و نمایه Column and index methods

  • تقسیم رشته ها Splitting strings

  • تقسیم بیشتر More splitting

  • چالش Challenge

روش های گروه بندی Grouping Methods

  • معرفی Introduction

  • گروه بندی Grouping

  • عملیات group_by group_by operations

  • روش get_group get_group method

  • روش های group_by The group_by methods

  • چالش Challenge

ترکیب DataFrames Combining DataFrames

  • معرفی Introduction

  • ترکیب DataFrames Combining DataFrames

  • الحاق Concatenation

  • پیوندهای داخلی Inner joins

  • اتصالات بیرونی Outer joins

  • چالش Challenge

داده های سری زمانی Time Series Data

  • معرفی Introduction

  • پایتون Datetime Python Datetime

  • مهر زمانی پانداها Pandas Timestamp

  • فهرست تاریخ DatetimeIndex

  • روش to_datetime The to_datetime method

  • مقدمه محدوده تاریخ Date Ranges Introduction

  • چالش Challenge

محدوده تاریخ Date Ranges

  • معرفی Introduction

  • محدوده تاریخ قسمت 1 Date ranges part 1

  • محدوده تاریخ قسمت 2 Date ranges part 2

  • محدوده تاریخ قسمت 3 Date ranges part 3

  • اکسسوری dt The dt accessor

  • چالش Challenge

  • فایل های تکمیلی Supplemental Files

DataReader DataReader

  • معرفی و راه اندازی Introduction & setup

  • خواندن داده‌های ارزهای دیجیتال Reading cryptocurrency data

  • انتخاب ردیف های Datetime Selecting Datetime rows

  • ویژگی ها و روش های مهر زمانی Timestamp attributes & methods

  • چالش Challenge

  • فایل های تکمیلی Supplemental Files

تجسم Visualization

  • معرفی Introduction

  • Matplotlib و PyPlot Matplotlib & PyPlot

  • سفارشی سازی تجسم ها Customizing visualizations

  • ایجاد نمودارها Creating charts

  • چالش Challenge

  • فایل های تکمیلی Supplemental Files

نمایش نظرات

آموزش پایتون و پانداها برای دستکاری داده ها
جزییات دوره
18h
120
CBTNuggets CBTNuggets
(آخرین آپدیت)
-
- از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Jonathan Barrios Jonathan Barrios

"کمک به متخصصان داده در مورد داده ها و دیدن موفقیت آنها یکی از بزرگترین علایق من به عنوان یک مربی است. من دوست دارم یاد بگیرم، دانش خود را به اشتراک بگذارم و به دیگران کمک کنم تا موفق شوند - به همین دلیل است که من مشتاق هستم که یک مربی در CBT Nuggets باشم. " جاناتان کار خود را به عنوان یک توسعه دهنده کامل شروع کرد و به سرعت علاقه مند شد تا تجربه آموزش آنلاین خود را با علم داده و دانش یادگیری ماشین خود ترکیب کند. جاناتان یک برنامه نویس، مربی تجزیه و تحلیل داده ها، و نویسنده برنامه درسی برای چندین پلتفرم آموزش آنلاین پیشرو بوده است و هیجان زده است که مهارت ها و تجربه آموزشی خود را با پزشکان مشتاق داده در CBT Nuggets به اشتراک بگذارد.

ارتباط با جاناتان:

توسعه نرم افزار کامل، تجزیه و تحلیل داده، علم داده، یادگیری ماشین و فناوری های ابری مانند AWS و Google Cloud. HTML، CSS، جاوا اسکریپت، PHP، Python، SQL، NoSQL، و فریمورک‌ها/کتابخانه‌هایی مانند Laravel، Vue، Tailwind، React، Gatsby، Django، NumPy، پانداها، Matplotlilb، Scrappy، BeautifulSoup، SciPy-Soup، SciPy، Seaborn، Learn، Tensorflow و PySpark.