دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش بوت کمپ کامل پانداها 2022: علم داده با پایتون - آخرین آپدیت

The Complete Pandas Bootcamp 2022: Data Science with Python

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: پانداها به طور کامل توضیح دادند | 150+ تمرین | مهارت های ضروری برای یادگیری ماشین و امور مالی | + Scikit-Learn و Seaborn مهارت های مدیریت داده و تجزیه و تحلیل داده خود را به سطح فوق العاده ای برسانید. همه روش‌ها و گردش‌های کاری مرتبط Pandas را با مجموعه داده‌های واقعی بیاموزید و تمرین کنید Pandas را بر اساس نسخه جدید 1.x بیاموزید (دوران نسخه‌های 0.x به پایان رسیده‌اند) داده‌های آشفته را وارد کنید، تمیز کنید، و ادغام کنید و داده‌ها را برای یادگیری ماشین آماده کنید. پروژه یادگیری ماشینی A-Z را با پانداها، Scikit-Learn و Seaborn تکمیل کنید. تجزیه و تحلیل، تجسم و درک داده های خود با پانداها، Matplotlib و Seaborn تمرین کنید و مهارت های پانداهای خود را با آزمون ها، بیش از 150 تمرین و پروژه های جامع وارد کردن داده های مالی/Sto از منابع وب و تجزیه و تحلیل آنها با پانداها مهم ترین گردش کار پانداها برای امور مالی را بیاموزید و به آنها مسلط شوید یاد بگیرید که چگونه به بهترین شکل از نسخه 0.x به نسخه جدید 1.x منتقل شوید. کانسپت هایی با سایپرز پیش نیازها: یک کامپیوتر رومیزی (ویندوز، مک یا لینوکس) که قادر به ذخیره و اجرای آناکوندا است. این دوره شما را با نصب نرم افزار رایگان لازم راهنمایی می کند. یک اتصال اینترنتی با قابلیت پخش ویدیو در حالت ایده آل، برخی از مبانی صفحه گسترده/مبانی برنامه نویسی (اجباری نیست، دوره شما را از طریق اصول اولیه راهنمایی می کند)

به جامع ترین بوت کمپ پانداهای وب با 34 ساعت محتوای ویدیویی، بیش از 150 تمرین و دو پروژه نهایی بزرگ و جامع برای آزمایش مهارت های شما خوش آمدید! این دوره یک هدف دارد: ارتقای مهارت های مدیریت داده خود را به سطح بعدی برای ایجاد حرفه خود در علوم داده، یادگیری ماشین، شرکت مالی.

این دوره دارای پنج بخش است:

مبانی پانداها - از صفر تا قهرمان (قسمت 1).
گردش کار کامل داده A-Z با پانداها: وارد کردن، تمیز کردن، ادغام، جمع آوری و آماده سازی داده ها برای یادگیری ماشین. (قسمت 2)
دو چالش جامع پروژه که اغلب در مراکز استخدام/ارزیابی شغل علوم داده استفاده می شود: مهارت های خود را بیازمایید! (قسمت 3).
برنامه 1: پانداها برای امور مالی، سرمایه گذاری و سایر داده های سری زمانی (قسمت 4)
کاربرد 2: یادگیری ماشینی با پانداها و یادگیری scikit (قسمت 5)

چرا باید پانداها را یاد بگیرید؟

جهان بیشتر و بیشتر مبتنی بر داده است. دانشمندان داده با حقوق بیش از 100 هزار دلار در حال افزایش هستند. زمان آن فرا رسیده است که از ماشین های جعبه صابون (نرم افزار صفحه گسترده مانند اکسل) به ماشین های مسابقه ای با تنظیم بالا (پاندا) تغییر دهید!

Python یک بستر/محیط عالی برای علم داده با ابزارهای قدرتمند برای علم، آمار، امور مالی و یادگیری ماشین است. کتابخانه پانداها قلب علم داده پایتون است. پانداها شما را قادر می‌سازد تا داده‌های خود را وارد کنید، تمیز کنید، ملحق کنید/ادغام کنید، دستکاری کنید، و عمیقاً درک کنید و در نهایت داده‌ها را برای تجزیه و تحلیل آماری، یادگیری ماشینی یا ارائه داده‌های بیشتر آماده یا پردازش کنید. در واقعیت، همه این وظایف به مهارت بالایی در پانداها نیاز دارد! دانشمندان داده معمولاً تا 85 درصد از زمان خود را صرف دستکاری داده ها در پانداها می کنند.

می توانید همین الان شروع کنید؟

یک سوال متداول از مبتدیان پایتون این است: "آیا قبل از شروع کار با پانداها باید در کدنویسی پایتون متخصص شوم؟"

پاسخ واضح این است: "نه! آیا باید قبل از شروع با اکسل یک توسعه دهنده نرم افزار مایکروسافت شوید؟ احتمالا نه!"

شما به برخی از اصول اولیه پایتون مانند انواع داده، عملیات/عملگرهای ساده، فهرست‌ها و آرایه‌های ناچیز نیاز دارید. در ضمیمه این دوره، می‌توانید یک دوره خرابی پایتون را پیدا کنید. این مقدمه پایتون سفارشی است و برای اهداف علم داده کافی است!

علاوه بر این، این دوره مفاهیم اساسی آماری (کد نویسی با scipy) را پوشش می دهد.

به عنوان خلاصه، اگر در اصل می خواهید از Python برای Data Science یا به عنوان جایگزینی برای Excel استفاده کنید، این دوره کاملاً مطابقت دارد!

چرا باید این دوره را بگذرانید؟

این مرتبط ترین و جامع ترین دوره در مورد پانداها است.
این به‌روزترین و اولین دوره‌ای است که Pandas نسخه 1.x را پوشش می‌دهد. کتابخانه پانداها در چند ماه گذشته پیشرفت های گسترده ای را تجربه کرده است. کار با کدهای قدیمی و تکیه بر آن می تواند دردناک باشد.
پانداها یک ابزار مجزا نیست. همراه با کتابخانه های دیگر: Matplotlib و Seaborn برای تجسم داده ها | Numpy، Scipy و Scikit-Learn برای یادگیری ماشین، محاسبات علمی و آماری. این دوره همه این کتابخانه ها را پوشش می دهد.
در پروژه های دنیای واقعی، کدنویسی و جنبه تجاری کارها به یک اندازه مهم هستند. این احتمالاً تنها دوره پانداها است که هر دو را آموزش می‌دهد: کدنویسی عمیق پانداها و تفکر تصویر بزرگ.
به‌عنوان یک دایره‌المعارف پانداها عمل می‌کند که همه روش‌ها، ویژگی‌ها و گردش‌های کاری مرتبط را برای پروژه‌های دنیای واقعی پوشش می‌دهد. اگر با هر روش یا گردش کاری مشکل دارید، به احتمال زیاد در این دوره راهنمایی دریافت خواهید کرد و راه حلی برای آن پیدا خواهید کرد.
گردش کامل داده های دنیای واقعی A-Z را نشان می دهد و توضیح می دهد: شروع با وارد کردن داده های آشفته، پاک کردن داده ها، ادغام و الحاق داده ها، گروه بندی و تجمیع داده ها، تجزیه و تحلیل داده های توضیحی تا آماده سازی و پردازش داده ها برای آمار، یادگیری ماشین، امور مالی و ارائه داده ها
کدگذاری پانداها بر روی داده های واقعی و مشکلات دنیای واقعی را توضیح می دهد. بدون اطلاعات اسباب بازی! این بهترین راه برای یادگیری و درک پانداها است.
این به شما فرصت های زیادی برای تمرین و کدنویسی به تنهایی می دهد. یاد گرفتن از طریق انجام دادن. در تمرین‌ها، می‌توانید سطح دشواری را با نکات اختیاری و راهنمایی/دستورالعمل انتخاب کنید.
پانداها یک ابزار بسیار قدرتمند است. اما همچنین دارای مشکلاتی است که می تواند منجر به خطاهای ناخواسته و کشف نشده در داده های شما شود. این دوره همچنین بر روی اشتباهات و خطاهای رایج تمرکز دارد و به شما می آموزد که چه کارهایی را نباید انجام دهید.
رضایت تضمین شده: در غیر این صورت، پول خود را با ضمانت بازگشت 30 روزه پس بگیرید.

من مشتاق دیدار شما در دوره هستم!

سرفصل ها و درس ها

شروع شدن Getting Started

بررسی اجمالی/سؤالات متداول دانشجو Overview / Student FAQ
نکات: چگونه از این دوره بیشترین بهره را ببرید Tips: How to get the most out of this course
آیا می دانستید که ...؟ Did you know that...?
سوالات متداول بیشتر/اطلاعات مهم More FAQ / Important Information
نصب آناکوندا Installation of Anaconda
باز کردن یک نوت بوک Jupyter Opening a Jupyter Notebook
نحوه استفاده از نوت بوک های Jupyter How to use Jupyter Notebooks
چگونه با پانداها نسخه 1.0 مقابله کنیم How to tackle Pandas Version 1.0

---- قسمت 1: پانداها از صفر تا قهرمان (بلوک های ساختمانی) ---- ---- PART 1: PANDAS FROM ZERO TO HERO (BUILDING BLOCKS) ----

مقدمه ای بر داده های جدولی/پانداها Intro to Tabular Data / Pandas
دانلود: قسمت 1 مطالب درسی Download: Part 1 Course Materials

مبانی پانداها (اصول DataFrame I) Pandas Basics (DataFrame Basics I)

اولین Pandas DataFrame خود را ایجاد کنید (از csv) Create your very first Pandas DataFrame (from csv)
بارگیری یک فایل CSV در پانداها Loading a CSV-file into Pandas
گزینه های نمایش پانداها و متدهای head() & tail() Pandas Display Options and the methods head() & tail()
اولین بازرسی داده ها First Data Inspection
آمار خلاصه Summary Statistics
توابع، ویژگی ها و روش های داخلی با پانداها Built-in Functions, Attributes and Methods with Pandas
کار را آسان کنید: تکمیل TAB و نکته ابزار Make it easy: TAB Completion and Tooltip
مراحل اول First Steps
مجموعه داده های خود را کاوش کنید: تمرین کدگذاری Jupyter 1 (مقدمه) Explore your own Dataset: Jupyter Coding Exercise 1 (Intro)
مجموعه داده های خود را کاوش کنید: تمرین کدگذاری Jupyter 1 (راه حل) Explore your own Dataset: Jupyter Coding Exercise 1 (Solution)
انتخاب ستون ها Selecting Columns
انتخاب یک ستون با علامت نقطه Selecting one Column with the "dot notation"
انتخاب ستون ها Selecting Columns
نمایه سازی مبتنی بر صفر و نمایه سازی منفی Zero-based Indexing and Negative Indexing
انتخاب ردیف‌ها با iloc (نمایه‌گذاری مبتنی بر موقعیت) Selecting Rows with iloc (position-based indexing)
برش سطرها و ستون ها با iloc (نمایه گذاری مبتنی بر موقعیت) Slicing Rows and Columns with iloc (position-based indexing)
برگه های تقلب نمایه سازی مبتنی بر موقعیت Position-based Indexing Cheat Sheets
نمایه سازی مبتنی بر موقعیت 1 Position-based Indexing 1
نمایه سازی مبتنی بر موقعیت 2 Position-based Indexing 2
انتخاب ردیف‌هایی با loc (نمایه‌گذاری مبتنی بر برچسب) Selecting Rows with loc (label-based indexing)
برش سطرها و ستون ها با loc (نمایه گذاری مبتنی بر برچسب) Slicing Rows and Columns with loc (label-based indexing)
برگه های تقلب نمایه سازی مبتنی بر برچسب Label-based Indexing Cheat Sheets
نمایه سازی مبتنی بر برچسب 1 Label-based Indexing 1
نمایه سازی مبتنی بر برچسب 2 Label-based Indexing 2
نمایه سازی و برش با reindex() Indexing and Slicing with reindex()
خلاصه، بهترین شیوه ها و چشم انداز Summary, Best Practices and Outlook
نمایه سازی و برش Indexing and Slicing
تمرین کدگذاری Jupyter 2 - مقدمه Jupyter Coding Exercise 2 - Intro
تمرین کدگذاری ژوپیتر 2 - راه حل Jupyter Coding Exercise 2 - Solution
نمایه سازی و برش پیشرفته (اختیاری) Advanced Indexing and Slicing (optional)

سری پانداها و اشیاء شاخص Pandas Series and Index Objects

مقدمه Intro
گام های اول با سری پانداها First Steps with Pandas Series
تجزیه و تحلیل سری های عددی با ()()unnique و value_counts() Analyzing Numerical Series with unique(), nunique() and value_counts()
حداکثر مقدار در یک ستون عددی Maximum Value in a numerical column
مقادیر منحصر به فرد در یک ستون متنی Unique Values in a Text Column
رایج ترین مقدار در یک ستون عددی Most common Value in a numerical column
تجزیه و تحلیل سری های غیر عددی با ()، nunique()، value_counts() Analyzing non-numerical Series with unique(), nunique(), value_counts()
رایج ترین مقدار در یک ستون متنی Most common value in a text column
ایجاد سری پانداها از ابتدا Creating Pandas Series from scratch
ایجاد سری پانداها (قسمت 1) Creating Pandas Series (Part 1)
ایجاد سری پانداها (قسمت 2) Creating Pandas Series (Part 2)
نمایه سازی و برش سری پانداها Indexing and Slicing Pandas Series
مرتب سازی "درجا" Sorting "inplace"
مرتب سازی سری ها و مقدمه ای بر پارامتر - inplace Sorting of Series and Introduction to the inplace - parameter
nlargest() و nsmallest() nlargest() and nsmallest()
n بزرگترین مقدار در سری پانداها The n largest values in a Pandas Series
idxmin() و idxmax() idxmin() and idxmax()
دستکاری سری پانداها Manipulating Pandas Series
سری پانداها Pandas Series
تمرین کدگذاری Jupyter 3 (مقدمه) Jupyter Coding Exercise 3 (Intro)
تمرین کدگذاری ژوپیتر 3 (راه حل) Jupyter Coding Exercise 3 (Solution)
اولین قدم ها با اشیاء شاخص پاندا First Steps with Pandas Index Objects
ایجاد اشیاء شاخص از ابتدا Creating Index Objects from Scratch
انتخاب برچسب های ستون یک DataFrame Selecting Column Labels of a DataFrame
تغییر فهرست ردیف با set_index() و reset_index() Changing Row Index with set_index() and reset_index()
تنظیم مجدد یک شاخص Resetting an Index
تغییر برچسب های ستون Changing Column Labels
تغییر نام برچسب‌های فهرست و ستون با rename() Renaming Index & Column Labels with rename()
تغییر نام برچسب های ستون Renaming Column Labels
اشیاء شاخص پانداها Pandas Index objects
تمرین کدگذاری Jupyter 4 (مقدمه) Jupyter Coding Exercise 4 (Intro)
تمرین کدگذاری ژوپیتر 4 (راه حل) Jupyter Coding Exercise 4 (Solution)

DataFrame Basics II DataFrame Basics II

مقدمه Intro
فیلتر کردن DataFrame با یک شرط Filtering DataFrames by one Condition
فیلتر کردن با یک شرط Filtering with one Condition
فیلتر کردن DataFrame بر اساس بسیاری از شرایط (AND) Filtering DataFrames by many Conditions (AND)
فیلتر کردن DataFrame بر اساس بسیاری از شرایط (OR) Filtering DataFrames by many Conditions (OR)
فیلتر کردن با بسیاری از شرایط Filtering with many Conditions
فیلترینگ پیشرفته با بین()، isin() و ~ Advanced Filtering with between(), isin() and ~
فیلترینگ پیشرفته Advanced Filtering
any() و all() any() and all()
جستجو با هر() Search with any()
حذف ستون ها Removing Columns
حذف ردیف ها Removing Rows
حذف ستون ها Removing Columns
اضافه کردن ستون های جدید به DataFrame Adding new Columns to a DataFrame
ایجاد ستون ها بر اساس ستون های دیگر Creating Columns based on other Columns
اضافه کردن ستون های جدید Adding new Columns
اضافه کردن ستون با insert() Adding Columns with insert()
ایجاد DataFrame از ابتدا با pd.DataFrame() Creating DataFrames from Scratch with pd.DataFrame()
ایجاد DataFrame های جدید Creating new DataFrames
افزودن ردیف های جدید (رویکرد عملی) Adding new Rows (hands-on approach)
DataFrame Basics II DataFrame Basics II
تمرین کدگذاری Jupyter 5 (مقدمه) Jupyter Coding Exercise 5 (Intro)
تمرین کدگذاری ژوپیتر 5 (راه حل) Jupyter Coding Exercise 5 (Solution)

دستکاری عناصر در یک DataFrame/Slice +++ مهم، مشکلات را بدانید!+++ Manipulating Elements in a DataFrame / Slice +++Important, know the Pitfalls!+++

مقدمه Intro
بهترین تمرین (چگونه باید آن را انجام دهید) Best Practice (How you should do it)
نمایه سازی زنجیره ای: چگونه نباید آن را انجام دهید (قسمت 1) Chained Indexing: How you should NOT do it (Part 1)
نمایه سازی زنجیره ای: چگونه نباید آن را انجام دهید (قسمت 2) Chained Indexing: How you should NOT do it (Part 2)
مشاهده در مقابل کپی View vs. Copy
قوانین ساده چه باید کرد وقتی... Simple Rules what to do when...
دستکاری DataFrames/Slices Manipulating DataFrames / Slices
تمرین کدنویسی 6 (مقدمه) Coding Exercise 6 (Intro)
تمرین کدنویسی 6 (راه حل) Coding Exercise 6 (Solution)

DataFrame Basics III DataFrame Basics III

مقدمه Intro
مرتب سازی DataFrame با sort_index() و sort_values() (به روز رسانی نسخه 1.0) Sorting DataFrames with sort_index() and sort_values() (Version 1.0 Update)
رتبه بندی DataFrame با rank() Ranking DataFrames with rank()
nunique() و nlargest()/nsmallest() با DataFrames nunique() and nlargest() / nsmallest() with DataFrames
خلاصه آمار و انباشت Summary Statistics and Accumulations
متد agg(). The agg() method
تمرین کدنویسی 7 (مقدمه) Coding Exercise 7 (Intro)
تمرین کدنویسی 7 (راه حل) Coding Exercise 7 (Solution)
توابع تعریف شده توسط کاربر با application()، map() و applicationmap() User-defined Functions with apply(), map() and applymap()
نمایه سازی سلسله مراتبی (قسمت 1) Hierarchical Indexing (Part 1)
نمایه سازی سلسله مراتبی (قسمت 2) Hierarchical Indexing (Part 2)
عملیات رشته (قسمت 1) String Operations (Part 1)
عملیات رشته (قسمت 2) String Operations (Part 2)
تمرین کدنویسی 8 (مقدمه) Coding Exercise 8 (Intro)
تمرین کدنویسی 8 (راه حل) Coding Exercise 8 (Solution)

تجسم با Matplotlib Visualization with Matplotlib

مقدمه Intro
متد plot(). The plot() method
سفارشی سازی پلات ها Customization of Plots
هیستوگرام (قسمت 1) Histograms (Part 1)
هیستوگرام (قسمت 2) Histograms (Part 2)
Barcharts و Piecharts Barcharts and Piecharts
نمودارهای پراکنده Scatterplots
تمرین کدنویسی 9 (مقدمه) Coding Exercise 9 (Intro)
تمرین کدنویسی 9 (راه حل) Coding Exercise 9 (Solution)

---- قسمت 2: جریان کار داده های کامل A-Z ---- ---- PART 2: FULL DATA WORKFLOW A-Z ----

به بخش 2 خوش آمدید: گردش کار کامل داده A-Z Welcome to PART 2: Full Data Workflow A-Z
دانلود: قسمت دوم مطالب درسی Download: Part 2 Course Materials

وارد کردن داده ها Importing Data

وارد کردن فایل‌های csv با pd.read_csv Importing csv-files with pd.read_csv
وارد کردن فایل‌های csv آشفته با pd.read_csv Importing messy csv-files with pd.read_csv
وارد کردن داده از اکسل با ()pd.read_excel Importing Data from Excel with pd.read_excel()
وارد کردن داده های آشفته از اکسل با ()pd.read_excel Importing messy Data from Excel with pd.read_excel()
وارد کردن داده ها از وب با ()pd.read_html Importing Data from the Web with pd.read_html()
تمرین کدنویسی 10 Coding Exercise 10

پاک کردن داده ها Cleaning Data

اولین بازرسی و مدیریت داده های متناقض First Inspection & Handling of inconsistent Data
عملیات رشته String Operations
تغییر نوع داده ستون ها با astype() Changing Datatype of Columns with astype()
مقادیر مقدماتی NA/مقادیر گمشده Intro NA values / missing values
تشخیص مقادیر از دست رفته Detection of missing Values
حذف مقادیر از دست رفته Removing missing values
جایگزینی مقادیر از دست رفته Replacing missing values
Intro Duplicates Intro Duplicates
تشخیص موارد تکراری Detection of Duplicates
مدیریت/حذف موارد تکراری Handling / Removing Duplicates
پارامتر ignore_index (جدید در Pandas 1.0) The ignore_index parameter (NEW in Pandas 1.0)
تشخیص نقاط پرت Detection of Outliers
مدیریت/حذف موارد پرت Handling / Removing Outliers
داده های طبقه بندی شده Categorical Data
Pandas نسخه 1.0: dtypes جدید و pd.NA Pandas Version 1.0: New dtypes and pd.NA
تمرین کدنویسی 11 (مقدمه) Coding Exercise 11 (Intro)
تمرین کدنویسی 11 (راه حل) Coding Exercise 11 (Solution)

ادغام، پیوستن، و الحاق داده ها Merging, Joining, and Concatenating Data

مقدمه Intro
افزودن ردیف با append() و pd.concat() (قسمت 1) Adding Rows with append() and pd.concat() (Part 1)
اضافه کردن سطرها با pd.concat() (قسمت 2) Adding Rows with pd.concat() (Part 2)
حساب با اشیاء پاندا/تراز داده ها Arithmetic with Pandas Objects / Data Alignment
EXCURSUS: مقایسه دو DataFrame/شناسایی تفاوت ها EXCURSUS: Comparing two DataFrames / Identify Differences
اتصالات بیرونی با merge() Outer Joins with merge()
اتصالات داخلی با merge() Inner Joins with merge()
اتصالات بیرونی (بدون تقاطع) با merge() Outer Joins (without Intersection) with merge()
اتصالات چپ (بدون تقاطع) با merge() Left Joins (without Intersection) with merge()
اتصال سمت راست (بدون تقاطع) با merge() Right Joins (without Intersection) with merge()
پیوستن به چپ با merge() Left Joins with merge()
اتصال سمت راست با merge() Right Joins with merge()
پیوستن به نام‌ها/نمایه‌های مختلف ستون Joining on different Column Names / Indexes
پیوستن به بیش از یک ستون Joining on more than one Column
() pd.merge و join() pd.merge() and join()
تمرین کدگذاری 12 Coding Exercise 12

عملیات GroupBy GroupBy Operations

مقدمه Intro
درک شی GroupBy Understanding the GroupBy Object
تقسیم با کلیدهای زیادی Splitting with many Keys
split-apply-combine توضیح داده شد split-apply-combine explained
split-apply-combine اعمال شد split-apply-combine applied
GroupBy 1 GroupBy 1
تجمیع پیشرفته با agg() Advanced aggregation with agg()
GroupBy Aggregation با Relabeling (جدید - Pandas نسخه 0.25) GroupBy Aggregation with Relabeling (NEW - Pandas Version 0.25)
تبدیل با transform() Transformation with transform()
جایگزینی مقادیر NA با مقادیر خاص گروه Replacing NA Values by group-specific Values
تعمیم split-apply-combine با application() Generalizing split-apply-combine with apply()
نمایه سازی سلسله مراتبی با Groupby Hierarchical Indexing with Groupby
stack() و unstack() stack() and unstack()
GroupBy 2 GroupBy 2
تمرین کدنویسی 13 (مقدمه) Coding Exercise 13 (Intro)
تمرین کدنویسی 13 (راه حل) Coding Exercise 13 (Solution)

تغییر شکل و چرخش DataFrame Reshaping and Pivoting DataFrames

مقدمه Intro
جابجایی سطرها و ستون ها Transposing Rows and Columns
چرخش DataFrame با pivot() Pivoting DataFrames with pivot()
محدودیت های pivot() Limits of pivot()
جدول محوری() pivot_table()
pd.crosstab() pd.crosstab()
ذوب DataFrame با melt() melting DataFrames with melt()
تمرین کدنویسی 14 Coding Exercise 14

آماده سازی داده ها و ایجاد ویژگی Data Preparation and Feature Creation

مقدمه Intro
عملیات حسابی (قسمت 1) Arithmetic Operations (Part 1)
عملیات حسابی (قسمت 2) Arithmetic Operations (Part 2)
تبدیل/نقشه برداری با map() Transformation/Mapping with map()
دگرگونی مشروط Conditional Transformation
گسسته سازی و Binning با ()pd.cut (قسمت 1) Discretization and Binning with pd.cut() (Part 1)
گسسته سازی و Binning با ()pd.cut (قسمت 2) Discretization and Binning with pd.cut() (Part 2)
گسسته سازی و Binning با ()pd.qcut Discretization and Binning with pd.qcut()
کف و درپوش Floors and Caps
مقیاس بندی/استانداردسازی Scaling / Standardization
ایجاد متغیرهای ساختگی Creating Dummy Variables
عملیات رشته String Operations
تمرین کدگذاری 15 Coding Exercise 15

تجسم پیشرفته با Seaborn Advanced Visualization with Seaborn

مقدمه Intro
اولین قدم ها در Seaborn First Steps in Seaborn
قطعه های طبقه بندی شده Categorical Plots
پلات های مشترک/پلات های رگرسیون Joint Plots / Regression Plots
Matrixplots/Heatmaps Matrixplots / Heatmaps
تمرین کدنویسی 16 Coding Exercise 16

---- قسمت 3: چالش های پروژه جامع ---- ---- PART 3: COMPREHENSIVE PROJECT CHALLENGES ----

معرفی و دانلودها Intro and Downloads

چالش دستکاری داده ها و تجمیع (جدول مدال های المپیک) Data Manipulation and Aggregation Challenge (Olympic Medal Tables)

جداول مدال المپیک (دستورالعمل و نکات) Olympic Medal Tables (Instruction & Hints)
جداول مدال های المپیک (راه حل قسمت 1) Olympic Medal Tables (Solution Part 1)
جداول مدال های المپیک (راه حل قسمت 2) Olympic Medal Tables (Solution Part 2)
جداول مدال های المپیک (راه حل قسمت 3) Olympic Medal Tables (Solution Part 3)

چالش تجزیه و تحلیل داده های توضیحی Explanatory Data Analysis Challenge

معرفی و بررسی اجمالی چالش Challenge Introduction and Overview
ادغام و الحاق (راه حل قسمت 1) Merging and Concatenating (Solution Part 1)
پاکسازی داده 1 (راه حل قسمت 2) Data Cleaning 1 (Solution Part 2)
پاکسازی داده 2 (راه حل قسمت 3) Data Cleaning 2 (Solution Part 3)
موفق ترین کشورها (راه حل قسمت 4) The most successful Countries (Solution Part 4)
تأثیر تولید ناخالص داخلی، جمعیت و سیاست (راه حل قسمت 5) Impact of GDP, Population and Politics (Solution Part 5)
تجزیه و تحلیل آماری و آزمون فرضیه (راه حل قسمت 6) Statistical Analysis and Hypothesis Testing (Solution Part 6)
تجمیع و رتبه بندی (راه حل قسمت 7) Aggregating and Ranking (Solution Part 7)
بازی‌های تابستانی در مقابل بازی‌های زمستانی - آیا مکان اهمیت دارد؟ (راه حل قسمت 8) Summer Games vs. Winter Games - does Location matter? (Solution Part 8)
مردان در مقابل زنان - آیا فرهنگ و مذهب اهمیت دارد؟ (راه حل قسمت 9) Men vs. Women - do Culture & Religion matter? (Solution Part 9)
ورزش و سنت های ملی (راه حل بخش 10) National Sports and Traditions (Solution Part 10)

---- قسمت 4: پانداها برای امور مالی، سرمایه گذاری و سری زمانی ---- ---- PART 4: PANDAS FOR FINANCE, INVESTING & TIME SERIES ----

به بخش 4: امور مالی و سرمایه گذاری با پانداها خوش آمدید Welcome to PART 4: Finance and Investments with Pandas
دانلود: قسمت چهارم مطالب درسی Download: Part 4 Course Materials

مبانی سری زمانی Time Series Basics

وارد کردن داده‌های سری زمانی از فایل‌های csv Importing Time Series Data from csv-files
تبدیل رشته ها به اشیاء datetime با ()pd.to_datetime Converting strings to datetime objects with pd.to_datetime()
تجزیه و تحلیل اولیه/تجسم سری های زمانی Initial Analysis / Visualization of Time Series
فهرست بندی و برش سری های زمانی Indexing and Slicing Time Series
ایجاد یک DatetimeIndex سفارشی با pd.date_range() Creating a customized DatetimeIndex with pd.date_range()
اطلاعات بیشتر در pd.date_range() More on pd.date_range()
نمونه برداری از سری زمانی با resample() (قسمت 1) Downsampling Time Series with resample() (Part 1)
نمونه برداری از سری زمانی با نمونه مجدد (قسمت 2) Downsampling Time Series with resample (Part 2)
شی PeriodIndex The PeriodIndex object
نمایه سازی پیشرفته با reindex() Advanced Indexing with reindex()

پانداها برای امور مالی و سرمایه گذاری Pandas for Finance and Investing

مقدمه Intro
آماده شدن (نصب بسته مورد نیاز) Getting Ready (Installing required package)
وارد کردن داده های قیمت سهام از Yahoo Finance (هنوز کار می کند!) Importing Stock Price Data from Yahoo Finance (it still works!)
بازرسی اولیه و تجسم Initial Inspection and Visualization
عادی سازی سری زمانی به مقدار پایه (100) Normalizing Time Series to a Base Value (100)
متد ()shift The shift() method
متدهای diff() و pct_change() The methods diff() and pct_change()
اندازه گیری عملکرد سهام با بازده MEAN و STD از بازده Measuring Stock Performance with MEAN Returns and STD of Returns
سری زمانی مالی - بازده و ریسک Financial Time Series - Return and Risk
سری زمانی مالی - کوواریانس و همبستگی Financial Time Series - Covariance and Correlation
ویژگی ها و روش های مفید DatetimeIndex Helpful DatetimeIndex Attributes and Methods
پر کردن مقادیر NA با bfill، ffill و interpolation Filling NA Values with bfill, ffill and interpolation
تمرین کدنویسی 17 Coding Exercise 17

---- قسمت 5: یادگیری ماشینی با پانداها و SCIKIT-LEARN ---- ---- PART 5: MACHINE LEARNING WITH PANDAS AND SCIKIT-LEARN ----

بررسی اجمالی و دانلودها Overview & Downloads

مقدمه ای بر رگرسیون و طبقه بندی Introduction to Regression and Classification

یادگیری ماشین - یک مرور کلی Machine Learning - an Overview
رگرسیون خطی با scikit-learn - یک مقدمه ساده Linear Regression with scikit-learn - a simple Introduction
پیش بینی با رگرسیون خطی Making Predictions with Linear Regression
بیش از حد برازش Overfitting
کم تناسب Underfitting
رگرسیون لجستیک با scikit-learn - یک مقدمه ساده (قسمت 1) Logistic Regression with scikit-learn - a simple Introduction (Part 1)
رگرسیون لجستیک با scikit-learn - یک مقدمه ساده (قسمت 2) Logistic Regression with scikit-learn - a simple Introduction (Part 2)

جایزه: پروژه یادگیری ماشین A-Z (رگرسیون) BONUS: Machine Learning Project A-Z (Regression)

معرفی پروژه Project Intro
وارد کردن مجموعه داده و اولین بازرسی Importing the Dataset and first Inspection
پاک کردن داده ها و ایجاد ویژگی های بیشتر Cleaning the Data and Creating more Features
تجزیه و تحلیل داده های توضیحی (قسمت 1) Explanatory Data Analysis (Part 1)
تجزیه و تحلیل داده های توضیحی (قسمت 2) Explanatory Data Analysis (Part 2)
مهندسی ویژگی (قسمت 1) Feature Engineering (Part 1)
مهندسی ویژگی (قسمت 2) Feature Engineering (Part 2)
تقسیم داده ها به مجموعه آموزشی و مجموعه تست Splitting the Data into Training Set and Test Set
آموزش مدل یادگیری ماشینی Training the Machine Learning Model
تست/ارزیابی مدل با مجموعه تست Testing/Evaluating the Model with the Test Set
اهمیت ویژگی Feature Importance

+++ چه چیزهایی در PANDAS VERSION 1.0 جدید است؟ - راهنمای عملی +++ +++ WHAT´S NEW IN PANDAS VERSION 1.0? - A HANDS-ON GUIDE +++

مقدمه و نمای کلی Intro and Overview
نحوه آپدیت پانداها به نسخه 1.0 How to update Pandas to Version 1.0
دانلود برای این بخش Downloads for this Section
خلاصه مهم: گزینه های نمایش پانداها (تغییر در نسخه 0.25) Important Recap: Pandas Display Options (Changed in Version 0.25)
روش Info() - خروجی جدید و توسعه یافته Info() method - new and extended output
dtypes جدید پسوند (dtypes "nullable"): چرا به آنها نیاز داریم؟ NEW Extension dtypes ("nullable" dtypes): Why do we need them?
ایجاد پسوند جدید dtypes با convert_dtypes() Creating the NEW extension dtypes with convert_dtypes()
مقدار جدید pd.NA برای مقادیر از دست رفته NEW pd.NA value for missing values
جدید "nullable" Int64Dtype The NEW "nullable" Int64Dtype
StringDtype جدید The NEW StringDtype
جدید "nullable" BooleanDtype The NEW "nullable" BooleanDtype
اضافه کردن پارامتر ignore_index Addition of the ignore_index parameter
حذف نسخه قبلی Removal of prior Version Deprecations

---- ضمیمه: مبانی پایتون، NUMPY و آمار ---- ---- APPENDIX: PYTHON BASICS, NUMPY & STATISTICS ----

به ضمیمه خوش آمدید Welcome to the Appendix

مبانی پایتون Python Basics

دانلودها Downloads
مقدمه Intro
مراحل اول First Steps
متغیرها Variables
انواع داده ها: اعداد صحیح و شناور Data Types: Integers and Floats
انواع داده ها: رشته ها Data Types: Strings
انواع داده ها: فهرست ها (قسمت 1) Data Types: Lists (Part 1)
انواع داده ها: فهرست ها (قسمت 2) Data Types: Lists (Part 2)
انواع داده ها: تاپلی Data Types: Tuples
انواع داده ها: مجموعه ها Data Types: Sets
اپراتورها و بولی ها Operators & Booleans
اظهارات مشروط (اگر، elif، else، while) Conditional Statements (if, elif, else, while)
برای حلقه ها For Loops
کلمات کلیدی شکستن، پاس، ادامه دادن Key words break, pass, continue
تولید اعداد تصادفی Generating Random Numbers
توابع تعریف شده توسط کاربر (قسمت 1) User Defined Functions (Part 1)
توابع تعریف شده توسط کاربر (قسمت 2) User Defined Functions (Part 2)
توابع تعریف شده توسط کاربر (قسمت 3) User Defined Functions (Part 3)
تجسم با Matplotlib Visualization with Matplotlib
مبانی پایتون Python Basics
آزمون مبانی پایتون: راه حل Python Basics Quiz: Solution

بسته Numpy The Numpy Package

دانلودها Downloads
مقدمه ای بر Numpy Arrays Introduction to Numpy Arrays
آرایه های Numpy: برداری Numpy Arrays: Vectorization
آرایه های Numpy: نمایه سازی و برش Numpy Arrays: Indexing and Slicing
آرایه‌های Numpy: شکل و ابعاد Numpy Arrays: Shape and Dimensions
آرایه های Numpy: نمایه سازی و برش آرایه های چند بعدی Numpy Arrays: Indexing and Slicing of multi-dimensional Arrays
آرایه های Numpy: نمایه سازی بولی Numpy Arrays: Boolean Indexing
تولید اعداد تصادفی Generating Random Numbers
مسائل مربوط به عملکرد Performance Issues
مطالعه موردی: کتابخانه استاندارد Numpy در مقابل پایتون Case Study: Numpy vs. Python Standard Library
آمار خلاصه Summary Statistics
تجسم و رگرسیون (خطی). Visualization and (Linear) Regression
ناپخته Numpy
امتحان Numpy: راه حل Numpy Quiz: Solution

مفاهیم آماری Statistical Concepts

آمار - مرور کلی، اصطلاحات و واژگان Statistics - Overview, Terms and Vocabulary
دانلود برای این بخش Downloads for this Section
جمعیت در مقابل نمونه Population vs. Sample
تجسم توزیع فرکانس با ()plt.hist Visualizing Frequency Distributions with plt.hist()
فرکانس های نسبی و تجمعی با ()plt.hist Relative and Cumulative Frequencies with plt.hist()
معیارهای گرایش مرکزی (نظریه) Measures of Central Tendency (Theory)
معیارهای کدگذاری گرایش مرکزی - میانگین و میانه Coding Measures of Central Tendency - Mean and Median
معیارهای کدگذاری گرایش مرکزی - میانگین هندسی Coding Measures of Central Tendency - Geometric Mean
تغییرپذیری حول گرایش مرکزی/پراکندگی (نظریه) Variability around the Central Tendency / Dispersion (Theory)
حداقل، حداکثر و محدوده با Python/Numpy Minimum, Maximum and Range with Python/Numpy
صدک با پایتون/Numpy Percentiles with Python/Numpy
واریانس و انحراف استاندارد با Python/Numpy Variance and Standard Deviation with Python/Numpy
انحراف و کورتوزیس (نظریه) Skew and Kurtosis (Theory)
نحوه محاسبه Skew و Kurtosis با scipy.stats How to calculate Skew and Kurtosis with scipy.stats
نحوه تولید اعداد تصادفی با Numpy How to generate Random Numbers with Numpy
تکرارپذیری با np.random.seed() Reproducibility with np.random.seed()
توزیع احتمالات - بررسی اجمالی Probability Distributions - Overview
توزیع های یکنواخت گسسته Discrete Uniform Distributions
توزیع های یکنواخت پیوسته Continuous Uniform Distributions
توزیع نرمال (نظریه) The Normal Distribution (Theory)
ایجاد یک متغیر تصادفی با توزیع معمولی Creating a normally distributed Random Variable
توزیع عادی - تابع چگالی احتمال (pdf) با scipy.stats Normal Distribution - Probability Density Function (pdf) with scipy.stats
توزیع عادی - تابع توزیع تجمعی (cdf) با scipy.stats Normal Distribution - Cumulative Distribution Function (cdf) with scipy.stats
توزیع نرمال استاندارد و مقادیر Z The Standard Normal Distribution and Z-Values
ویژگی های توزیع نرمال استاندارد (نظریه) Properties of the Standard Normal Distribution (Theory)
احتمالات و Z-Values با scipy.stats Probabilities and Z-Values with scipy.stats
فواصل اطمینان با scipy.stats Confidence Intervals with scipy.stats
کوواریانس و ضریب همبستگی (نظریه) Covariance and Correlation Coefficient (Theory)
تمیز کردن و آماده سازی پایگاه داده ها - فیلم ها (قسمت 1) Cleaning and preparing the Data - Movies Database (Part 1)
تمیز کردن و آماده سازی پایگاه داده - فیلم ها (قسمت 2) Cleaning and preparing the Data - Movies Database (Part 2)
نحوه محاسبه کوواریانس و همبستگی در پایتون How to calculate Covariance and Correlation in Python
همبستگی و پراکندگی - تفسیر بصری Correlation and Scatterplots – visual Interpretation
رگرسیون خطی چیست؟ (تئوری) What is Linear Regression? (Theory)
یک مدل رگرسیون خطی ساده با numpy و scipy A simple Linear Regression Model with numpy & Scipy
نحوه تفسیر ضریب فاصله و شیب How to interpret Intercept and Slope Coefficient
مطالعه موردی (قسمت 1): مدل بازار (مدل تک عاملی) Case Study (Part 1): The Market Model (Single Factor Model)
مطالعه موردی (بخش 2): مدل بازار (مدل تک عاملی) Case Study (Part 2): The Market Model (Single Factor Model)

بعد چی؟ (چشم انداز و منابع اضافی) What´s next? (outlook and additional resources)

سخنرانی پاداش Bonus Lecture

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش بوت کمپ کامل پانداها 2022: علم داده با پایتون

جزییات دوره

زمان دوره: 33.5 hours

تعداد ویدیو ها: 325

شرکت: Udemy (یودمی)

تاریخ انتشار مرجع: (آخرین آپدیت)

ثبت نام مرجع : 22,520

امتیاز مرجع: 4.6 از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Alexander Hagmann

لینک کوتاه این دوره

https://donyad.com/d/8dd679

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

دنیاد

برنامه نویسی

توسعه

آموزش بوت کمپ کامل پانداها 2022: علم داده با پایتون - آخرین آپدیت

The Complete Pandas Bootcamp 2022: Data Science with Python

شروع شدن Getting Started

بررسی اجمالی/سؤالات متداول دانشجو Overview / Student FAQ

نکات: چگونه از این دوره بیشترین بهره را ببرید Tips: How to get the most out of this course

آیا می دانستید که ...؟ Did you know that...?

سوالات متداول بیشتر/اطلاعات مهم More FAQ / Important Information

نصب آناکوندا Installation of Anaconda

باز کردن یک نوت بوک Jupyter Opening a Jupyter Notebook

نحوه استفاده از نوت بوک های Jupyter How to use Jupyter Notebooks

چگونه با پانداها نسخه 1.0 مقابله کنیم How to tackle Pandas Version 1.0

---- قسمت 1: پانداها از صفر تا قهرمان (بلوک های ساختمانی) ---- ---- PART 1: PANDAS FROM ZERO TO HERO (BUILDING BLOCKS) ----

مقدمه ای بر داده های جدولی/پانداها Intro to Tabular Data / Pandas

دانلود: قسمت 1 مطالب درسی Download: Part 1 Course Materials

مبانی پانداها (اصول DataFrame I) Pandas Basics (DataFrame Basics I)

اولین Pandas DataFrame خود را ایجاد کنید (از csv) Create your very first Pandas DataFrame (from csv)

بارگیری یک فایل CSV در پانداها Loading a CSV-file into Pandas

گزینه های نمایش پانداها و متدهای head() & tail() Pandas Display Options and the methods head() & tail()

اولین بازرسی داده ها First Data Inspection

آمار خلاصه Summary Statistics

توابع، ویژگی ها و روش های داخلی با پانداها Built-in Functions, Attributes and Methods with Pandas

کار را آسان کنید: تکمیل TAB و نکته ابزار Make it easy: TAB Completion and Tooltip

مراحل اول First Steps

مجموعه داده های خود را کاوش کنید: تمرین کدگذاری Jupyter 1 (مقدمه) Explore your own Dataset: Jupyter Coding Exercise 1 (Intro)

مجموعه داده های خود را کاوش کنید: تمرین کدگذاری Jupyter 1 (راه حل) Explore your own Dataset: Jupyter Coding Exercise 1 (Solution)

انتخاب ستون ها Selecting Columns

انتخاب یک ستون با علامت نقطه Selecting one Column with the "dot notation"

انتخاب ستون ها Selecting Columns

نمایه سازی مبتنی بر صفر و نمایه سازی منفی Zero-based Indexing and Negative Indexing

انتخاب ردیف‌ها با iloc (نمایه‌گذاری مبتنی بر موقعیت) Selecting Rows with iloc (position-based indexing)

برش سطرها و ستون ها با iloc (نمایه گذاری مبتنی بر موقعیت) Slicing Rows and Columns with iloc (position-based indexing)

برگه های تقلب نمایه سازی مبتنی بر موقعیت Position-based Indexing Cheat Sheets

نمایه سازی مبتنی بر موقعیت 1 Position-based Indexing 1

نمایه سازی مبتنی بر موقعیت 2 Position-based Indexing 2

انتخاب ردیف‌هایی با loc (نمایه‌گذاری مبتنی بر برچسب) Selecting Rows with loc (label-based indexing)

برش سطرها و ستون ها با loc (نمایه گذاری مبتنی بر برچسب) Slicing Rows and Columns with loc (label-based indexing)

برگه های تقلب نمایه سازی مبتنی بر برچسب Label-based Indexing Cheat Sheets

نمایه سازی مبتنی بر برچسب 1 Label-based Indexing 1

نمایه سازی مبتنی بر برچسب 2 Label-based Indexing 2

نمایه سازی و برش با reindex() Indexing and Slicing with reindex()

خلاصه، بهترین شیوه ها و چشم انداز Summary, Best Practices and Outlook

نمایه سازی و برش Indexing and Slicing

تمرین کدگذاری Jupyter 2 - مقدمه Jupyter Coding Exercise 2 - Intro

تمرین کدگذاری ژوپیتر 2 - راه حل Jupyter Coding Exercise 2 - Solution

نمایه سازی و برش پیشرفته (اختیاری) Advanced Indexing and Slicing (optional)

سری پانداها و اشیاء شاخص Pandas Series and Index Objects

مقدمه Intro

گام های اول با سری پانداها First Steps with Pandas Series

تجزیه و تحلیل سری های عددی با ()()unnique و value_counts() Analyzing Numerical Series with unique(), nunique() and value_counts()

حداکثر مقدار در یک ستون عددی Maximum Value in a numerical column

مقادیر منحصر به فرد در یک ستون متنی Unique Values in a Text Column

رایج ترین مقدار در یک ستون عددی Most common Value in a numerical column

تجزیه و تحلیل سری های غیر عددی با ()، nunique()، value_counts() Analyzing non-numerical Series with unique(), nunique(), value_counts()

رایج ترین مقدار در یک ستون متنی Most common value in a text column

ایجاد سری پانداها از ابتدا Creating Pandas Series from scratch

ایجاد سری پانداها (قسمت 1) Creating Pandas Series (Part 1)

ایجاد سری پانداها (قسمت 2) Creating Pandas Series (Part 2)

نمایه سازی و برش سری پانداها Indexing and Slicing Pandas Series

مرتب سازی "درجا" Sorting "inplace"

مرتب سازی سری ها و مقدمه ای بر پارامتر - inplace Sorting of Series and Introduction to the inplace - parameter

nlargest() و nsmallest() nlargest() and nsmallest()

n بزرگترین مقدار در سری پانداها The n largest values in a Pandas Series

idxmin() و idxmax() idxmin() and idxmax()

دستکاری سری پانداها Manipulating Pandas Series

سری پانداها Pandas Series

تمرین کدگذاری Jupyter 3 (مقدمه) Jupyter Coding Exercise 3 (Intro)

تمرین کدگذاری ژوپیتر 3 (راه حل) Jupyter Coding Exercise 3 (Solution)

اولین قدم ها با اشیاء شاخص پاندا First Steps with Pandas Index Objects

ایجاد اشیاء شاخص از ابتدا Creating Index Objects from Scratch

انتخاب برچسب های ستون یک DataFrame Selecting Column Labels of a DataFrame

تغییر فهرست ردیف با set_index() و reset_index() Changing Row Index with set_index() and reset_index()

تنظیم مجدد یک شاخص Resetting an Index

تغییر برچسب های ستون Changing Column Labels

تغییر نام برچسب‌های فهرست و ستون با rename() Renaming Index & Column Labels with rename()

تغییر نام برچسب های ستون Renaming Column Labels

اشیاء شاخص پانداها Pandas Index objects

تمرین کدگذاری Jupyter 4 (مقدمه) Jupyter Coding Exercise 4 (Intro)

تمرین کدگذاری ژوپیتر 4 (راه حل) Jupyter Coding Exercise 4 (Solution)