لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش The Ultimate Pandas Bootcamp: Advanced Python Data Analysis
The Ultimate Pandas Bootcamp: Advanced Python Data Analysis
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
بر کتابخانه قدرتمند پانداها برای تجزیه و تحلیل، دستکاری و تجسم داده ها مسلط شوید. بیش از 10 مجموعه داده و پاداش گنجانده شده است! همه چیز را در مورد پانداها بیاموزید - از ابتدا! درک عمیق و عملی از ساختارهای داده پانداها به دست آورید. هر مجموعه داده ای را تغییر دهید، تمیز کنید، فیلتر کنید، گروه بای، محور قرار دهید، و در غیر این صورت دستکاری کنید. موضوعات مرتبط با علوم کامپیوتر مانند مولدهای اعداد تصادفی، عملگرهای باینری، نشانگرهای حافظه و موارد دیگر را درک کنید! خواندن دادههای وب، ترشیها، فایلهای اکسل را درست در پانداها تمرین کنید. صدها روش، ویژگی و تکنیک برای دستکاری داده ها در پانداها و پایتون ها را کشف و یاد بگیرید. پیش نیازها: یک کامپیوتر (ویندوز/مک/لینوکس). همین! هیچ دانش قبلی از پایتون لازم نیست. هیچ دانش قبلی در مورد پانداها لازم نیست.
به بهترین منبع آنلاین برای یادگیری و تسلط بر تجزیه و تحلیل داده ها با پانداها و پایتون خوش آمدید.
در بیش از 32 ساعت، بیش از 10 مجموعه داده و بیش از 50 چالش مهارتی، نه تنها پانداهای 1.x، بلکه دهها مفهوم علوم کامپیوتر، آمار و برنامهنویسی را نیز به طور عملی به دست خواهید آورد.
ما صدها روش، ویژگی و تکنیک را در پانداها و پایتون تجزیه، درک و تمرین خواهیم کرد که اساساً روش کار با دادهها را تغییر میدهند.
در The Ultimate Pandas Bootcamp (2022) شما با نسخه های قدیمی پانداها کار نخواهید کرد و دستورات تکراری را روی همان مجموعه داده خسته کننده می نویسید. درعوض، راهحلهای قابل اعتماد و پایتونیک برای مشکلات دادههای جالب و واقعی را یاد میگیرید، در حالی که با مجموعه دادههای متنوعی کار میکنید که از سروهای شراب، فروش بازیهای ویدیویی و امتیازات SAT گرفته تا قیمت سهام، حقوق دانشگاه و موارد دیگر را شامل میشود!
تحلیل دادهها یک علم کاربردی است، به همین دلیل است که در هر بخش، آنچه را که در چالشهای مهارتی اختصاصی میآموزید، متوقف کرده و تمرین میکنید، و سپس راهحلهای مفصلی را دنبال میکنید که در آن ما اغلب راهحلهای جایگزین را بررسی و مقایسه میکنیم.
تجزیه و تحلیل داده ها یکی از مهارت های مورد تقاضا در تمام صنایع و تعداد فزاینده ای از نقش ها است. و پایتون به طور فزاینده ای زبان انتخابی است.
Pandas یک کتابخانه متنباز فوقالعاده است که تجسم آن روندها است: بر اساس زبان برنامهنویسی پایتون، پانداها کتابخانه تجزیه و تحلیل دادههای واقعی در جامعه علوم داده پایتون است.
––––– ساختار برنامه درسی –––––
در طول بیش از 31 ساعت، ما همه چیزهایی را که پانداها ارائه میدهند، از دستکاری سریها و قابهای داده، ادغام مجموعههای داده، مدیریت سریهای زمانی، تجمعها، فیلتر کردن، مرتبسازی و موارد دیگر پوشش خواهیم داد!
چهار بخش اول بوت کمپ برنامه درسی اصلی را تشکیل می دهد. شما با سری ها و دیتافریم ها آشنا می شوید و درک عمیقی از ساختارهای داده پانداها خواهید داشت.
· سری در یک نگاه
· روشها و مدیریت سری
· معرفی DataFrames
· DataFrames بیشتر در عمق
در هشت بخش بعدی، به موضوعات پیشرفتهتر میپردازید و مهارتهای پانداهای خود را به سطح دیگری میبرید، یاد میگیرید که چگونه با مجموعههای داده متعدد کار کنید، سریهای زمانی را دستکاری کنید، دادهها را تجسم کنید، توابع سفارشی بنویسید تا دادهها را تغییر دهید و خیلی چیزهای دیگر.
· کار با چند قاب داده
· چند بعدی شدن
· GroupBy And Aggregates
· تغییر شکل با محورها
· کار با تاریخ و زمان
· عبارات منظم و دستکاری متن
· تجسم داده ها
· قالبهای داده و ورودی/خروجی
پاندا و پایتون دست به دست هم می دهند، به همین دلیل است که این بوت کمپ همچنین شامل مقدمه ای کامل از زبان برنامه نویسی پایتون است تا شما را در کمترین زمان برای نوشتن کدهای پایتون آماده کند.
این دوره آموزشی نهایی در یکی از با ارزش ترین مهارت های امروزی است. امیدوارم متعهد شوید که در تجزیه و تحلیل داده ها با پانداها تسلط داشته باشید.
می بینمت داخل!
سرفصل ها و درس ها
معرفی
Introduction
ساختار دوره
Course Structure
پانداها مجرد نیست
Pandas Is Not Single
آناکوندا
Anaconda
نوت بوک های Jupyter
Jupyter Notebooks
Cloud vs Local
Cloud vs Local
سلام پایتون
Hello, Python
NumPy
NumPy
تمامی منابع دوره
All Course Resources
سریال در یک نگاه
Series At A Glance
بخش معرفی
Section Intro
سریال چیست؟
What Is A Series?
پارامترها در مقابل آرگومان ها
Parameters vs Arguments
در داده ها چیست؟
What’s In The Data?
ویژگی .dtype
The .dtype Attribute
جایزه: واقعاً dtype('o') چیست؟
BONUS: What Is dtype('o'), Really?
Index And RangeIndex
Index And RangeIndex
نام سریال و فهرست
Series And Index Names
چالش مهارت
Skill Challenge
راه حل
Solution
راه حلی دیگر
Another Solution
روش های head() And tail().
The head() And tail() Methods
استخراج بر اساس موقعیت شاخص
Extracting By Index Position
دسترسی به عناصر با برچسب
Accessing Elements By Label
پاداش: متدهای add_prefix() و add_suffix().
BONUS: The add_prefix() And add_suffix() Methods
با استفاده از علامت گذاری نقطه
Using Dot Notation
ماسک های بولی و نمایه ساز .loc
Boolean Masks And The .loc Indexer
استخراج بر اساس موقعیت با .iloc
Extracting By Position With .iloc
پاداش: استفاده از Calables با .loc و .iloc
BONUS: Using Callables With .loc And .iloc
انتخاب با .get()
Selecting With .get()
خلاصه انتخاب
Selection Recap
چالش مهارت
Skill Challenge
راه حل
Solution
خلاصه نوت بوک بخش
Section Recap Notebook
روش ها و مدیریت سری
Series Methods And Handling
بخش معرفی
Section Intro
خواندن در داده ها با read_csv()
Reading In Data With read_csv()
سایزبندی سری با .size، .shape، And len()
Series Sizing With .size, .shape, And len()
ارزش های منحصر به فرد و یکنواختی سری
Unique Values And Series Monotonicity
روش count().
The count() Method
دسترسی و شمارش NA
Accessing And Counting NAs
پاداش: یک رویکرد دیگر
BONUS: Another Approach
طرف دیگر: notnull() و notna()
The Other Side: notnull() And notna()
پاداش: Booleans به معنای واقعی کلمه اعداد در پایتون هستند
BONUS: Booleans Are Literally Numbers In Python
چالش مهارت
Skill Challenge
راه حل
Solution
انداختن و پر کردن NA
Dropping And Filling NAs
آمار توصیفی
Descriptive Statistics
روش describe().
The describe() Method
mode() و value_counts()
mode() And value_counts()
idxmax() و idxmin()
idxmax() And idxmin()
مرتب سازی با sort_values()
Sorting With sort_values()
nlargest() و nsmallest()
nlargest() And nsmallest()
مرتب سازی با sort_index()
Sorting With sort_index()
چالش مهارت
Skill Challenge
راه حل
Solution
محاسبات سری و fill_value()
Series Arithmetics And fill_value()
جایزه: محاسبه واریانس و انحراف استاندارد
BONUS: Calculating Variance And Standard Deviation
عملیات تجمعی
Cumulative Operations
تفاوت های زوجی با diff()
Pairwise Differences With diff()
تکرار سری
Series Iteration
فیلتر کردن: filter()، Where()، و mask()
Filtering: filter(), where(), And mask()
تبدیل با update()، application() و map()
Transforming With update(), apply() And map()
چالش مهارت
Skill Challenge
راه حل I - خواندن داده ها
Solution I - Reading Data
راه حل دوم - میانگین، میانه، و انحراف استاندارد
Solution II - Mean, Median, And Standard Deviation
راه حل III - نمرات Z
Solution III - Z-scores
خلاصه نوت بوک بخش
Section Recap Notebook
کار با DataFrames
Working With DataFrames
بخش معرفی
Section Intro
دیتا فریم چیست؟
What Is A DataFrame
ایجاد یک DataFrame
Creating A DataFrame
پاداش - چهار راه دیگر برای ساخت دیتا فریم
BONUS - Four More Ways To Build DataFrames
روش info().
The info() Method
خواندن در داده های تغذیه
Reading In Nutrition Data
مقداری پاکسازی: حذف فهرست تکراری
Some Cleanup: Removing The Duplicated Index
روش نمونه ()
The sample() Method
جایزه - نمونه برداری با جایگزینی یا وزن
BONUS - Sampling With Replacement Or Weights
جایزه - اعداد تصادفی چگونه تولید می شوند؟
BONUS - How Are Random Numbers Generated?
محورهای DataFrame
DataFrame Axes
تغییر شاخص
Changing The Index
استخراج از DataFrames توسط Label
Extracting From DataFrames By Label
استخراج DataFrame بر اساس موقعیت
DataFrame Extraction by Position
دسترسی یک ارزش با .at و .iat
Single Value Access With .at And .iat
BONUS - متد get_loc().
BONUS - The get_loc() Method
چالش مهارت
Skill Challenge
راه حل
Solution
پاکسازی بیشتر: رفتن به عدد
More Cleanup: Going Numeric
روش astype().
The astype() Method
DataFrame replace() + A Glimpse At Regex
DataFrame replace() + A Glimpse At Regex
بخش اول: جمع آوری واحدها
Part I: Collecting The Units
متد rename().
The rename() Method
DataFrame dropna()
DataFrame dropna()
جایزه - dropna() با زیر مجموعه
BONUS - dropna() With Subset
بخش دوم: ادغام واحدها با نام ستون ها
Part II: Merging Units With Column Names
بخش سوم: حذف واحدها از ارزش ها
Part III: Removing Units From Values
فیلتر کردن به صورت دو بعدی
Filtering in 2D
مرتب سازی DataFrame
DataFrame Sorting
استفاده از Series between() با DataFrames
Using Series between() With DataFrames
پاداش - حداقل، حداکثر و Idx[MinMax]، و غذاهای خوب
BONUS - Min, Max and Idx[MinMax], And Good Foods
DataFrame nlargest() و nsmallest()
DataFrame nlargest() And nsmallest()
چالش مهارت
Skill Challenge
راه حل
Solution
چالش مهارتی دیگر
Another Skill Challenge
راه حل
Solution
خلاصه نوت بوک بخش
Section Recap Notebook
DataFrames در عمق
DataFrames In Depth
بخش معرفی
Section Intro
معرفی یک مجموعه داده جدید
Introducing A New Dataset
بررسی سریع: نمایه سازی با ماسک های بولی
Quick Review: Indexing With Boolean Masks
رویکردهای بیشتر برای پوشش بولی
More Approaches To Boolean Masking
عملگرهای باینری با Booleans
Binary Operators With Booleans
BONUS - XOR و Complement Binary Ops
BONUS - XOR and Complement Binary Ops
شرایط ترکیبی
Combining Conditions
شرایط به عنوان متغیر
Conditions As Variables
چالش مهارت
Skill Challenge
راه حل
Solution
نمایه سازی 2 بعدی
2d Indexing
نمایه سازی فانتزی با lookup()
Fancy Indexing With lookup()
مرتب سازی بر اساس نمایه یا ستون
Sorting By Index Or Column
مرتب سازی در مقابل مرتب سازی مجدد
Sorting vs. Reordering
جایزه - راه دیگری
BONUS - Another Way
15. جایزه - لطفا از مرتب سازی مانند این اجتناب کنید
15. BONUS - Please Avoid Sorting Like This
چالش مهارت
Skill Challenge
راه حل
Solution
شناسایی فریبکاران
Identifying Dupes
حذف موارد تکراری
Removing Duplicates
حذف ردیف های DataFrame
Removing DataFrame Rows
پاداش - حذف ستون ها
BONUS - Removing Columns
جایزه - روش دیگر: pop()
BONUS - Another Way: pop()
جایزه - یک جایگزین پیچیده
BONUS - A Sophisticated Alternative
مقادیر تهی در DataFrames
Null Values In DataFrames
حذف و پر کردن NAهای DataFrame
Dropping And Filling DataFrame NAs
جایزه - متدها و محورها با fillna()
BONUS - Methods And Axes With fillna()
چالش مهارت
Skill Challenge
راه حل
Solution
محاسبه انباشته ها با agg()
Calculating Aggregates With agg()
تبدیل های هم شکل
Same-shape Transforms
انعطاف بیشتر با application()
More Flexibility With apply()
عملیات عناصر با applicationmap()
Element-wise Operations With applymap()
چالش مهارت
Skill Challenge
راه حل
Solution
تنظیم مقادیر DataFrame
Setting DataFrame Values
هشدار SettingWithCopy
The SettingWithCopy Warning
مشاهده در مقابل کپی
View vs Copy
اضافه کردن ستون های DataFrame
Adding DataFrame Columns
افزودن ردیف به DataFrames
Adding Rows To DataFrames
پاداش - چگونه DataFrame ها در حافظه ذخیره می شوند
BONUS - How Are DataFrames Stored In Memory
چالش مهارت
Skill Challenge
راه حل
Solution
خلاصه نوت بوک بخش
Section Recap Notebook
کار با چندین دیتا فریم
Working With Multiple DataFrames
بخش معرفی
Section Intro
معرفی (پنج؟) مجموعه داده های جدید
Introducing (Five?) New Datasets
الحاق DataFrames
Concatenating DataFrames
موضوع شاخص تکراری
The Duplicated Index Issue
اجرای شاخص های منحصر به فرد
Enforcing Unique Indices
BONUS - ایجاد چند شاخص با concat()
BONUS - Creating Multiple Indices With concat()
الحاق محور ستون
Column Axis Concatenation
روش append(): یک مورد خاص از concat()
The append() Method: A Special Case Of concat()
Concat در ستون های مختلف
Concat On Different Columns
چالش مهارت
Skill Challenge
راه حل
Solution
روش merge().
The merge() Method
Params چپ_روشن و راست_روشن
The left_on And right_on Params
اتصالات درونی در مقابل بیرونی
Inner vs Outer Joins
الحاقات چپ در مقابل راست
Left vs Right Joins
پیوستن های یک به یک و یک به چند
One-to-One and One-to-Many Joins
ملحقات چند به چند
Many-to-Many Joins
ادغام بر اساس شاخص
Merging By Index
روش join()
The join() Method
چالش مهارت
Skill Challenge
راه حل
Solution
خلاصه نوت بوک بخش
Section Recap Notebook
چند بعدی شدن
Going MultiDimensional
بخش معرفی
Section Intro
معرفی داده های جدید
Introducing New Data
Index And RangeIndex
Index And RangeIndex
ایجاد مولتی ایندکس
Creating A MultiIndex
MultiIndex از read_csv()
MultiIndex From read_csv()
نمایه سازی سلسله مراتب داده فریم ها
Indexing Hierarchical DataFrames
نمایه سازی محدوده ها و برش ها
Indexing Ranges And Slices
جایزه - استفاده: با pd.IndexSlice!
BONUS - Use : With pd.IndexSlice!
مقاطع با xs()
Cross Sections With xs()
چالش مهارت
Skill Challenge
راه حل
Solution
آناتومی یک شی چند شاخص
The Anatomy Of A MultiIndex Object
اضافه کردن یک سطح دیگر
Adding Another Level
مخلوط کردن سطوح
Shuffling Levels
حذف سطوح چند شاخص
Removing MultiIndex Levels
MultiIndex sort_index()
MultiIndex sort_index()
روش های چند شاخص بیشتر
More MultiIndex Methods
تغییر شکل با stack()
Reshaping With stack()
The Flipside: unstack()
The Flipside: unstack()
جایزه: ایجاد ستون های چند سطحی به صورت دستی
BONUS: Creating MultiLevel Columns Manually
یک راه ساده تر: transpose()
An Easier Way: transpose()
جایزه - در مورد پانل ها چطور؟
BONUS - What About Panels?
چالش مهارت
Skill Challenge
راه حل
Solution
خلاصه نوت بوک بخش
Section Recap Notebook
GroupBy And Aggregates
GroupBy And Aggregates
بخش معرفی
Section Intro
داده های جدید: فروش بازی
New Data: Game Sales
بررسی تجمعات ساده
Simple Aggregations Review
مصالح مشروط
Conditional Aggregates
الگوی تقسیم-اعمال-ترکیب
The Split-Apply-Combine Pattern
روش groupby().
The groupby() Method
شی DataFrameGroupBy
The DataFrameGroupBy Object
سفارشی کردن فهرست برای نگاشت گروه
Customizing Index To Group Mappings
جایزه - سری groupby()
BONUS - Series groupby()
چالش مهارت
Skill Challenge
راه حل
Solution
تکرار از طریق گروه ها
Iterating Through Groups
زیرگروه های دستچین
Handpicking Subgroups
گروه بندی چند شاخص
MultiIndex Grouping
مصالح با تنظیم دقیق
Fine-tuned Aggregates
تجمعات نامگذاری شده
Named Aggregations
متد فیلتر().
The filter() Method
تحولات GroupBy
GroupBy Transformations
جایزه - همچنین اعمال () وجود دارد
BONUS - There's Also apply()
چالش مهارت
Skill Challenge
راه حل
Solution
خلاصه نوت بوک بخش
Section Recap Notebook
تغییر شکل با محورها
Reshaping With Pivots
بخش معرفی
Section Intro
داده های جدید: نمرات SAT شهر نیویورک
New Data: New York City SAT Scores
داده های محوری
Pivoting Data
لغو محورها
Undoing Pivots
در مورد مصالح چیست؟
What About Aggregates?
pivot_table()
The pivot_table()
پاداش: مشکل با درصد متوسط
BONUS: The Problem With Average Percentage
تکرار جداول محوری با GroupBy
Replicating Pivot Tables With GroupBy
اضافه کردن حاشیه ها
Adding Margins
جداول محوری چند ایندکس
MultiIndex Pivot Tables
اعمال چندین تابع
Applying Multiple Functions
چالش مهارت
Skill Challenge
راه حل
Solution
خلاصه نوت بوک بخش
Section Recap Notebook
رسیدگی به تاریخ و زمان
Handling Date And Time
بخش معرفی
Section Intro
ماژول تاریخ پایتون
The Python datetime Module
تجزیه تاریخ از متن
Parsing Dates From Text
حتی بهتر: dateutil
Even Better: dateutil
از Datetime تا String
From Datetime To String
زمان های اجرا با Numpy
Performant Datetimes With Numpy
مهر زمانی پانداها
The Pandas Timestamp
مجموعه داده ما: قیمت برنت
Our Dataset: Brent Prices
تجزیه تاریخ و فهرست تاریخ
Date Parsing And DatetimeIndex
یک میانبر جالب: read_csv() با parse_dates
A Cool Shorcut: read_csv() With parse_dates
نمایش نظرات