آموزش بوت کمپ کامل پانداها 2022: علم داده با پایتون

The Complete Pandas Bootcamp 2022: Data Science with Python

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: پانداها به طور کامل توضیح دادند | 150+ تمرین | مهارت های ضروری برای یادگیری ماشین و امور مالی | + Scikit-Learn و Seaborn مهارت های مدیریت داده و تجزیه و تحلیل داده خود را به سطح فوق العاده ای برسانید. همه روش‌ها و گردش‌های کاری مرتبط Pandas را با مجموعه داده‌های واقعی بیاموزید و تمرین کنید Pandas را بر اساس نسخه جدید 1.x بیاموزید (دوران نسخه‌های 0.x به پایان رسیده‌اند) داده‌های آشفته را وارد کنید، تمیز کنید، و ادغام کنید و داده‌ها را برای یادگیری ماشین آماده کنید. پروژه یادگیری ماشینی A-Z را با پانداها، Scikit-Learn و Seaborn تکمیل کنید. تجزیه و تحلیل، تجسم و درک داده های خود با پانداها، Matplotlib و Seaborn تمرین کنید و مهارت های پانداهای خود را با آزمون ها، بیش از 150 تمرین و پروژه های جامع وارد کردن داده های مالی/Sto از منابع وب و تجزیه و تحلیل آنها با پانداها مهم ترین گردش کار پانداها برای امور مالی را بیاموزید و به آنها مسلط شوید یاد بگیرید که چگونه به بهترین شکل از نسخه 0.x به نسخه جدید 1.x منتقل شوید. کانسپت هایی با سایپرز پیش نیازها: یک کامپیوتر رومیزی (ویندوز، مک یا لینوکس) که قادر به ذخیره و اجرای آناکوندا است. این دوره شما را با نصب نرم افزار رایگان لازم راهنمایی می کند. یک اتصال اینترنتی با قابلیت پخش ویدیو در حالت ایده آل، برخی از مبانی صفحه گسترده/مبانی برنامه نویسی (اجباری نیست، دوره شما را از طریق اصول اولیه راهنمایی می کند)

به جامع ترین بوت کمپ پانداهای وب با 34 ساعت محتوای ویدیویی، بیش از 150 تمرین و دو پروژه نهایی بزرگ و جامع برای آزمایش مهارت های شما خوش آمدید! این دوره یک هدف دارد: ارتقای مهارت های مدیریت داده خود را به سطح بعدی برای ایجاد حرفه خود در علوم داده، یادگیری ماشین، شرکت مالی.

این دوره دارای پنج بخش است:

  • مبانی پانداها - از صفر تا قهرمان (قسمت 1).

  • گردش کار کامل داده A-Z با پانداها: وارد کردن، تمیز کردن، ادغام، جمع آوری و آماده سازی داده ها برای یادگیری ماشین. (قسمت 2)

  • دو چالش جامع پروژه که اغلب در مراکز استخدام/ارزیابی شغل علوم داده استفاده می شود: مهارت های خود را بیازمایید! (قسمت 3).

  • برنامه 1: پانداها برای امور مالی، سرمایه گذاری و سایر داده های سری زمانی (قسمت 4)

  • کاربرد 2: یادگیری ماشینی با پانداها و یادگیری scikit (قسمت 5)


چرا باید پانداها را یاد بگیرید؟

جهان بیشتر و بیشتر مبتنی بر داده است. دانشمندان داده با حقوق بیش از 100 هزار دلار در حال افزایش هستند. زمان آن فرا رسیده است که از ماشین های جعبه صابون (نرم افزار صفحه گسترده مانند اکسل) به ماشین های مسابقه ای با تنظیم بالا (پاندا) تغییر دهید!

Python یک بستر/محیط عالی برای علم داده با ابزارهای قدرتمند برای علم، آمار، امور مالی و یادگیری ماشین است. کتابخانه پانداها قلب علم داده پایتون است. پانداها شما را قادر می‌سازد تا داده‌های خود را وارد کنید، تمیز کنید، ملحق کنید/ادغام کنید، دستکاری کنید، و عمیقاً درک کنید و در نهایت داده‌ها را برای تجزیه و تحلیل آماری، یادگیری ماشینی یا ارائه داده‌های بیشتر آماده یا پردازش کنید. در واقعیت، همه این وظایف به مهارت بالایی در پانداها نیاز دارد! دانشمندان داده معمولاً تا 85 درصد از زمان خود را صرف دستکاری داده ها در پانداها می کنند.


می توانید همین الان شروع کنید؟

یک سوال متداول از مبتدیان پایتون این است: "آیا قبل از شروع کار با پانداها باید در کدنویسی پایتون متخصص شوم؟"

پاسخ واضح این است: "نه! آیا باید قبل از شروع با اکسل یک توسعه دهنده نرم افزار مایکروسافت شوید؟ احتمالا نه!"

شما به برخی از اصول اولیه پایتون مانند انواع داده، عملیات/عملگرهای ساده، فهرست‌ها و آرایه‌های ناچیز نیاز دارید. در ضمیمه این دوره، می‌توانید یک دوره خرابی پایتون را پیدا کنید. این مقدمه پایتون سفارشی است و برای اهداف علم داده کافی است!

علاوه بر این، این دوره مفاهیم اساسی آماری (کد نویسی با scipy) را پوشش می دهد.

به عنوان خلاصه، اگر در اصل می خواهید از Python برای Data Science یا به عنوان جایگزینی برای Excel استفاده کنید، این دوره کاملاً مطابقت دارد!


چرا باید این دوره را بگذرانید؟

  • این مرتبط ترین و جامع ترین دوره در مورد پانداها است.

  • این به‌روزترین و اولین دوره‌ای است که Pandas نسخه 1.x را پوشش می‌دهد. کتابخانه پانداها در چند ماه گذشته پیشرفت های گسترده ای را تجربه کرده است. کار با کدهای قدیمی و تکیه بر آن می تواند دردناک باشد.

  • پانداها یک ابزار مجزا نیست. همراه با کتابخانه های دیگر: Matplotlib و Seaborn برای تجسم داده ها | Numpy، Scipy و Scikit-Learn برای یادگیری ماشین، محاسبات علمی و آماری. این دوره همه این کتابخانه ها را پوشش می دهد.

  • در پروژه های دنیای واقعی، کدنویسی و جنبه تجاری کارها به یک اندازه مهم هستند. این احتمالاً تنها دوره پانداها است که هر دو را آموزش می‌دهد: کدنویسی عمیق پانداها و تفکر تصویر بزرگ.

  • به‌عنوان یک دایره‌المعارف پانداها عمل می‌کند که همه روش‌ها، ویژگی‌ها و گردش‌های کاری مرتبط را برای پروژه‌های دنیای واقعی پوشش می‌دهد. اگر با هر روش یا گردش کاری مشکل دارید، به احتمال زیاد در این دوره راهنمایی دریافت خواهید کرد و راه حلی برای آن پیدا خواهید کرد.

  • گردش کامل داده های دنیای واقعی A-Z را نشان می دهد و توضیح می دهد: شروع با وارد کردن داده های آشفته، پاک کردن داده ها، ادغام و الحاق داده ها، گروه بندی و تجمیع داده ها، تجزیه و تحلیل داده های توضیحی تا آماده سازی و پردازش داده ها برای آمار، یادگیری ماشین، امور مالی و ارائه داده ها

  • کدگذاری پانداها بر روی داده های واقعی و مشکلات دنیای واقعی را توضیح می دهد. بدون اطلاعات اسباب بازی! این بهترین راه برای یادگیری و درک پانداها است.

  • این به شما فرصت های زیادی برای تمرین و کدنویسی به تنهایی می دهد. یاد گرفتن از طریق انجام دادن. در تمرین‌ها، می‌توانید سطح دشواری را با نکات اختیاری و راهنمایی/دستورالعمل انتخاب کنید.

  • پانداها یک ابزار بسیار قدرتمند است. اما همچنین دارای مشکلاتی است که می تواند منجر به خطاهای ناخواسته و کشف نشده در داده های شما شود. این دوره همچنین بر روی اشتباهات و خطاهای رایج تمرکز دارد و به شما می آموزد که چه کارهایی را نباید انجام دهید.

  • رضایت تضمین شده: در غیر این صورت، پول خود را با ضمانت بازگشت 30 روزه پس بگیرید.


من مشتاق دیدار شما در دوره هستم!


سرفصل ها و درس ها

شروع شدن Getting Started

  • بررسی اجمالی/سؤالات متداول دانشجو Overview / Student FAQ

  • نکات: چگونه از این دوره بیشترین بهره را ببرید Tips: How to get the most out of this course

  • آیا می دانستید که ...؟ Did you know that...?

  • سوالات متداول بیشتر/اطلاعات مهم More FAQ / Important Information

  • نصب آناکوندا Installation of Anaconda

  • باز کردن یک نوت بوک Jupyter Opening a Jupyter Notebook

  • نحوه استفاده از نوت بوک های Jupyter How to use Jupyter Notebooks

  • چگونه با پانداها نسخه 1.0 مقابله کنیم How to tackle Pandas Version 1.0

---- قسمت 1: پانداها از صفر تا قهرمان (بلوک های ساختمانی) ---- ---- PART 1: PANDAS FROM ZERO TO HERO (BUILDING BLOCKS) ----

  • مقدمه ای بر داده های جدولی/پانداها Intro to Tabular Data / Pandas

  • دانلود: قسمت 1 مطالب درسی Download: Part 1 Course Materials

مبانی پانداها (اصول DataFrame I) Pandas Basics (DataFrame Basics I)

  • اولین Pandas DataFrame خود را ایجاد کنید (از csv) Create your very first Pandas DataFrame (from csv)

  • بارگیری یک فایل CSV در پانداها Loading a CSV-file into Pandas

  • گزینه های نمایش پانداها و متدهای head() & tail() Pandas Display Options and the methods head() & tail()

  • اولین بازرسی داده ها First Data Inspection

  • آمار خلاصه Summary Statistics

  • توابع، ویژگی ها و روش های داخلی با پانداها Built-in Functions, Attributes and Methods with Pandas

  • کار را آسان کنید: تکمیل TAB و نکته ابزار Make it easy: TAB Completion and Tooltip

  • مراحل اول First Steps

  • مجموعه داده های خود را کاوش کنید: تمرین کدگذاری Jupyter 1 (مقدمه) Explore your own Dataset: Jupyter Coding Exercise 1 (Intro)

  • مجموعه داده های خود را کاوش کنید: تمرین کدگذاری Jupyter 1 (راه حل) Explore your own Dataset: Jupyter Coding Exercise 1 (Solution)

  • انتخاب ستون ها Selecting Columns

  • انتخاب یک ستون با علامت نقطه Selecting one Column with the "dot notation"

  • انتخاب ستون ها Selecting Columns

  • نمایه سازی مبتنی بر صفر و نمایه سازی منفی Zero-based Indexing and Negative Indexing

  • انتخاب ردیف‌ها با iloc (نمایه‌گذاری مبتنی بر موقعیت) Selecting Rows with iloc (position-based indexing)

  • برش سطرها و ستون ها با iloc (نمایه گذاری مبتنی بر موقعیت) Slicing Rows and Columns with iloc (position-based indexing)

  • برگه های تقلب نمایه سازی مبتنی بر موقعیت Position-based Indexing Cheat Sheets

  • نمایه سازی مبتنی بر موقعیت 1 Position-based Indexing 1

  • نمایه سازی مبتنی بر موقعیت 2 Position-based Indexing 2

  • انتخاب ردیف‌هایی با loc (نمایه‌گذاری مبتنی بر برچسب) Selecting Rows with loc (label-based indexing)

  • برش سطرها و ستون ها با loc (نمایه گذاری مبتنی بر برچسب) Slicing Rows and Columns with loc (label-based indexing)

  • برگه های تقلب نمایه سازی مبتنی بر برچسب Label-based Indexing Cheat Sheets

  • نمایه سازی مبتنی بر برچسب 1 Label-based Indexing 1

  • نمایه سازی مبتنی بر برچسب 2 Label-based Indexing 2

  • نمایه سازی و برش با reindex() Indexing and Slicing with reindex()

  • خلاصه، بهترین شیوه ها و چشم انداز Summary, Best Practices and Outlook

  • نمایه سازی و برش Indexing and Slicing

  • تمرین کدگذاری Jupyter 2 - مقدمه Jupyter Coding Exercise 2 - Intro

  • تمرین کدگذاری ژوپیتر 2 - راه حل Jupyter Coding Exercise 2 - Solution

  • نمایه سازی و برش پیشرفته (اختیاری) Advanced Indexing and Slicing (optional)

سری پانداها و اشیاء شاخص Pandas Series and Index Objects

  • مقدمه Intro

  • گام های اول با سری پانداها First Steps with Pandas Series

  • تجزیه و تحلیل سری های عددی با ()()unnique و value_counts() Analyzing Numerical Series with unique(), nunique() and value_counts()

  • حداکثر مقدار در یک ستون عددی Maximum Value in a numerical column

  • مقادیر منحصر به فرد در یک ستون متنی Unique Values in a Text Column

  • رایج ترین مقدار در یک ستون عددی Most common Value in a numerical column

  • تجزیه و تحلیل سری های غیر عددی با ()، nunique()، value_counts() Analyzing non-numerical Series with unique(), nunique(), value_counts()

  • رایج ترین مقدار در یک ستون متنی Most common value in a text column

  • ایجاد سری پانداها از ابتدا Creating Pandas Series from scratch

  • ایجاد سری پانداها (قسمت 1) Creating Pandas Series (Part 1)

  • ایجاد سری پانداها (قسمت 2) Creating Pandas Series (Part 2)

  • نمایه سازی و برش سری پانداها Indexing and Slicing Pandas Series

  • مرتب سازی "درجا" Sorting "inplace"

  • مرتب سازی سری ها و مقدمه ای بر پارامتر - inplace Sorting of Series and Introduction to the inplace - parameter

  • nlargest() و nsmallest() nlargest() and nsmallest()

  • n بزرگترین مقدار در سری پانداها The n largest values in a Pandas Series

  • idxmin() و idxmax() idxmin() and idxmax()

  • دستکاری سری پانداها Manipulating Pandas Series

  • سری پانداها Pandas Series

  • تمرین کدگذاری Jupyter 3 (مقدمه) Jupyter Coding Exercise 3 (Intro)

  • تمرین کدگذاری ژوپیتر 3 (راه حل) Jupyter Coding Exercise 3 (Solution)

  • اولین قدم ها با اشیاء شاخص پاندا First Steps with Pandas Index Objects

  • ایجاد اشیاء شاخص از ابتدا Creating Index Objects from Scratch

  • انتخاب برچسب های ستون یک DataFrame Selecting Column Labels of a DataFrame

  • تغییر فهرست ردیف با set_index() و reset_index() Changing Row Index with set_index() and reset_index()

  • تنظیم مجدد یک شاخص Resetting an Index

  • تغییر برچسب های ستون Changing Column Labels

  • تغییر نام برچسب‌های فهرست و ستون با rename() Renaming Index & Column Labels with rename()

  • تغییر نام برچسب های ستون Renaming Column Labels

  • اشیاء شاخص پانداها Pandas Index objects

  • تمرین کدگذاری Jupyter 4 (مقدمه) Jupyter Coding Exercise 4 (Intro)

  • تمرین کدگذاری ژوپیتر 4 (راه حل) Jupyter Coding Exercise 4 (Solution)

DataFrame Basics II DataFrame Basics II

  • مقدمه Intro

  • فیلتر کردن DataFrame با یک شرط Filtering DataFrames by one Condition

  • فیلتر کردن با یک شرط Filtering with one Condition

  • فیلتر کردن DataFrame بر اساس بسیاری از شرایط (AND) Filtering DataFrames by many Conditions (AND)

  • فیلتر کردن DataFrame بر اساس بسیاری از شرایط (OR) Filtering DataFrames by many Conditions (OR)

  • فیلتر کردن با بسیاری از شرایط Filtering with many Conditions

  • فیلترینگ پیشرفته با بین()، isin() و ~ Advanced Filtering with between(), isin() and ~

  • فیلترینگ پیشرفته Advanced Filtering

  • any() و all() any() and all()

  • جستجو با هر() Search with any()

  • حذف ستون ها Removing Columns

  • حذف ردیف ها Removing Rows

  • حذف ستون ها Removing Columns

  • اضافه کردن ستون های جدید به DataFrame Adding new Columns to a DataFrame

  • ایجاد ستون ها بر اساس ستون های دیگر Creating Columns based on other Columns

  • اضافه کردن ستون های جدید Adding new Columns

  • اضافه کردن ستون با insert() Adding Columns with insert()

  • ایجاد DataFrame از ابتدا با pd.DataFrame() Creating DataFrames from Scratch with pd.DataFrame()

  • ایجاد DataFrame های جدید Creating new DataFrames

  • افزودن ردیف های جدید (رویکرد عملی) Adding new Rows (hands-on approach)

  • DataFrame Basics II DataFrame Basics II

  • تمرین کدگذاری Jupyter 5 (مقدمه) Jupyter Coding Exercise 5 (Intro)

  • تمرین کدگذاری ژوپیتر 5 (راه حل) Jupyter Coding Exercise 5 (Solution)

دستکاری عناصر در یک DataFrame/Slice +++ مهم، مشکلات را بدانید!+++ Manipulating Elements in a DataFrame / Slice +++Important, know the Pitfalls!+++

  • مقدمه Intro

  • بهترین تمرین (چگونه باید آن را انجام دهید) Best Practice (How you should do it)

  • نمایه سازی زنجیره ای: چگونه نباید آن را انجام دهید (قسمت 1) Chained Indexing: How you should NOT do it (Part 1)

  • نمایه سازی زنجیره ای: چگونه نباید آن را انجام دهید (قسمت 2) Chained Indexing: How you should NOT do it (Part 2)

  • مشاهده در مقابل کپی View vs. Copy

  • قوانین ساده چه باید کرد وقتی... Simple Rules what to do when...

  • دستکاری DataFrames/Slices Manipulating DataFrames / Slices

  • تمرین کدنویسی 6 (مقدمه) Coding Exercise 6 (Intro)

  • تمرین کدنویسی 6 (راه حل) Coding Exercise 6 (Solution)

DataFrame Basics III DataFrame Basics III

  • مقدمه Intro

  • مرتب سازی DataFrame با sort_index() و sort_values() (به روز رسانی نسخه 1.0) Sorting DataFrames with sort_index() and sort_values() (Version 1.0 Update)

  • رتبه بندی DataFrame با rank() Ranking DataFrames with rank()

  • nunique() و nlargest()/nsmallest() با DataFrames nunique() and nlargest() / nsmallest() with DataFrames

  • خلاصه آمار و انباشت Summary Statistics and Accumulations

  • متد agg(). The agg() method

  • تمرین کدنویسی 7 (مقدمه) Coding Exercise 7 (Intro)

  • تمرین کدنویسی 7 (راه حل) Coding Exercise 7 (Solution)

  • توابع تعریف شده توسط کاربر با application()، map() و applicationmap() User-defined Functions with apply(), map() and applymap()

  • نمایه سازی سلسله مراتبی (قسمت 1) Hierarchical Indexing (Part 1)

  • نمایه سازی سلسله مراتبی (قسمت 2) Hierarchical Indexing (Part 2)

  • عملیات رشته (قسمت 1) String Operations (Part 1)

  • عملیات رشته (قسمت 2) String Operations (Part 2)

  • تمرین کدنویسی 8 (مقدمه) Coding Exercise 8 (Intro)

  • تمرین کدنویسی 8 (راه حل) Coding Exercise 8 (Solution)

تجسم با Matplotlib Visualization with Matplotlib

  • مقدمه Intro

  • متد plot(). The plot() method

  • سفارشی سازی پلات ها Customization of Plots

  • هیستوگرام (قسمت 1) Histograms (Part 1)

  • هیستوگرام (قسمت 2) Histograms (Part 2)

  • Barcharts و Piecharts Barcharts and Piecharts

  • نمودارهای پراکنده Scatterplots

  • تمرین کدنویسی 9 (مقدمه) Coding Exercise 9 (Intro)

  • تمرین کدنویسی 9 (راه حل) Coding Exercise 9 (Solution)

---- قسمت 2: جریان کار داده های کامل A-Z ---- ---- PART 2: FULL DATA WORKFLOW A-Z ----

  • به بخش 2 خوش آمدید: گردش کار کامل داده A-Z Welcome to PART 2: Full Data Workflow A-Z

  • دانلود: قسمت دوم مطالب درسی Download: Part 2 Course Materials

وارد کردن داده ها Importing Data

  • وارد کردن فایل‌های csv با pd.read_csv Importing csv-files with pd.read_csv

  • وارد کردن فایل‌های csv آشفته با pd.read_csv Importing messy csv-files with pd.read_csv

  • وارد کردن داده از اکسل با ()pd.read_excel Importing Data from Excel with pd.read_excel()

  • وارد کردن داده های آشفته از اکسل با ()pd.read_excel Importing messy Data from Excel with pd.read_excel()

  • وارد کردن داده ها از وب با ()pd.read_html Importing Data from the Web with pd.read_html()

  • تمرین کدنویسی 10 Coding Exercise 10

پاک کردن داده ها Cleaning Data

  • اولین بازرسی و مدیریت داده های متناقض First Inspection & Handling of inconsistent Data

  • عملیات رشته String Operations

  • تغییر نوع داده ستون ها با astype() Changing Datatype of Columns with astype()

  • مقادیر مقدماتی NA/مقادیر گمشده Intro NA values / missing values

  • تشخیص مقادیر از دست رفته Detection of missing Values

  • حذف مقادیر از دست رفته Removing missing values

  • جایگزینی مقادیر از دست رفته Replacing missing values

  • Intro Duplicates Intro Duplicates

  • تشخیص موارد تکراری Detection of Duplicates

  • مدیریت/حذف موارد تکراری Handling / Removing Duplicates

  • پارامتر ignore_index (جدید در Pandas 1.0) The ignore_index parameter (NEW in Pandas 1.0)

  • تشخیص نقاط پرت Detection of Outliers

  • مدیریت/حذف موارد پرت Handling / Removing Outliers

  • داده های طبقه بندی شده Categorical Data

  • Pandas نسخه 1.0: dtypes جدید و pd.NA Pandas Version 1.0: New dtypes and pd.NA

  • تمرین کدنویسی 11 (مقدمه) Coding Exercise 11 (Intro)

  • تمرین کدنویسی 11 (راه حل) Coding Exercise 11 (Solution)

ادغام، پیوستن، و الحاق داده ها Merging, Joining, and Concatenating Data

  • مقدمه Intro

  • افزودن ردیف با append() و pd.concat() (قسمت 1) Adding Rows with append() and pd.concat() (Part 1)

  • اضافه کردن سطرها با pd.concat() (قسمت 2) Adding Rows with pd.concat() (Part 2)

  • حساب با اشیاء پاندا/تراز داده ها Arithmetic with Pandas Objects / Data Alignment

  • EXCURSUS: مقایسه دو DataFrame/شناسایی تفاوت ها EXCURSUS: Comparing two DataFrames / Identify Differences

  • اتصالات بیرونی با merge() Outer Joins with merge()

  • اتصالات داخلی با merge() Inner Joins with merge()

  • اتصالات بیرونی (بدون تقاطع) با merge() Outer Joins (without Intersection) with merge()

  • اتصالات چپ (بدون تقاطع) با merge() Left Joins (without Intersection) with merge()

  • اتصال سمت راست (بدون تقاطع) با merge() Right Joins (without Intersection) with merge()

  • پیوستن به چپ با merge() Left Joins with merge()

  • اتصال سمت راست با merge() Right Joins with merge()

  • پیوستن به نام‌ها/نمایه‌های مختلف ستون Joining on different Column Names / Indexes

  • پیوستن به بیش از یک ستون Joining on more than one Column

  • () pd.merge و join() pd.merge() and join()

  • تمرین کدگذاری 12 Coding Exercise 12

عملیات GroupBy GroupBy Operations

  • مقدمه Intro

  • درک شی GroupBy Understanding the GroupBy Object

  • تقسیم با کلیدهای زیادی Splitting with many Keys

  • split-apply-combine توضیح داده شد split-apply-combine explained

  • split-apply-combine اعمال شد split-apply-combine applied

  • GroupBy 1 GroupBy 1

  • تجمیع پیشرفته با agg() Advanced aggregation with agg()

  • GroupBy Aggregation با Relabeling (جدید - Pandas نسخه 0.25) GroupBy Aggregation with Relabeling (NEW - Pandas Version 0.25)

  • تبدیل با transform() Transformation with transform()

  • جایگزینی مقادیر NA با مقادیر خاص گروه Replacing NA Values by group-specific Values

  • تعمیم split-apply-combine با application() Generalizing split-apply-combine with apply()

  • نمایه سازی سلسله مراتبی با Groupby Hierarchical Indexing with Groupby

  • stack() و unstack() stack() and unstack()

  • GroupBy 2 GroupBy 2

  • تمرین کدنویسی 13 (مقدمه) Coding Exercise 13 (Intro)

  • تمرین کدنویسی 13 (راه حل) Coding Exercise 13 (Solution)

تغییر شکل و چرخش DataFrame Reshaping and Pivoting DataFrames

  • مقدمه Intro

  • جابجایی سطرها و ستون ها Transposing Rows and Columns

  • چرخش DataFrame با pivot() Pivoting DataFrames with pivot()

  • محدودیت های pivot() Limits of pivot()

  • جدول محوری() pivot_table()

  • pd.crosstab() pd.crosstab()

  • ذوب DataFrame با melt() melting DataFrames with melt()

  • تمرین کدنویسی 14 Coding Exercise 14

آماده سازی داده ها و ایجاد ویژگی Data Preparation and Feature Creation

  • مقدمه Intro

  • عملیات حسابی (قسمت 1) Arithmetic Operations (Part 1)

  • عملیات حسابی (قسمت 2) Arithmetic Operations (Part 2)

  • تبدیل/نقشه برداری با map() Transformation/Mapping with map()

  • دگرگونی مشروط Conditional Transformation

  • گسسته سازی و Binning با ()pd.cut (قسمت 1) Discretization and Binning with pd.cut() (Part 1)

  • گسسته سازی و Binning با ()pd.cut (قسمت 2) Discretization and Binning with pd.cut() (Part 2)

  • گسسته سازی و Binning با ()pd.qcut Discretization and Binning with pd.qcut()

  • کف و درپوش Floors and Caps

  • مقیاس بندی/استانداردسازی Scaling / Standardization

  • ایجاد متغیرهای ساختگی Creating Dummy Variables

  • عملیات رشته String Operations

  • تمرین کدگذاری 15 Coding Exercise 15

تجسم پیشرفته با Seaborn Advanced Visualization with Seaborn

  • مقدمه Intro

  • اولین قدم ها در Seaborn First Steps in Seaborn

  • قطعه های طبقه بندی شده Categorical Plots

  • پلات های مشترک/پلات های رگرسیون Joint Plots / Regression Plots

  • Matrixplots/Heatmaps Matrixplots / Heatmaps

  • تمرین کدنویسی 16 Coding Exercise 16

---- قسمت 3: چالش های پروژه جامع ---- ---- PART 3: COMPREHENSIVE PROJECT CHALLENGES ----

  • معرفی و دانلودها Intro and Downloads

چالش دستکاری داده ها و تجمیع (جدول مدال های المپیک) Data Manipulation and Aggregation Challenge (Olympic Medal Tables)

  • جداول مدال المپیک (دستورالعمل و نکات) Olympic Medal Tables (Instruction & Hints)

  • جداول مدال های المپیک (راه حل قسمت 1) Olympic Medal Tables (Solution Part 1)

  • جداول مدال های المپیک (راه حل قسمت 2) Olympic Medal Tables (Solution Part 2)

  • جداول مدال های المپیک (راه حل قسمت 3) Olympic Medal Tables (Solution Part 3)

چالش تجزیه و تحلیل داده های توضیحی Explanatory Data Analysis Challenge

  • معرفی و بررسی اجمالی چالش Challenge Introduction and Overview

  • ادغام و الحاق (راه حل قسمت 1) Merging and Concatenating (Solution Part 1)

  • پاکسازی داده 1 (راه حل قسمت 2) Data Cleaning 1 (Solution Part 2)

  • پاکسازی داده 2 (راه حل قسمت 3) Data Cleaning 2 (Solution Part 3)

  • موفق ترین کشورها (راه حل قسمت 4) The most successful Countries (Solution Part 4)

  • تأثیر تولید ناخالص داخلی، جمعیت و سیاست (راه حل قسمت 5) Impact of GDP, Population and Politics (Solution Part 5)

  • تجزیه و تحلیل آماری و آزمون فرضیه (راه حل قسمت 6) Statistical Analysis and Hypothesis Testing (Solution Part 6)

  • تجمیع و رتبه بندی (راه حل قسمت 7) Aggregating and Ranking (Solution Part 7)

  • بازی‌های تابستانی در مقابل بازی‌های زمستانی - آیا مکان اهمیت دارد؟ (راه حل قسمت 8) Summer Games vs. Winter Games - does Location matter? (Solution Part 8)

  • مردان در مقابل زنان - آیا فرهنگ و مذهب اهمیت دارد؟ (راه حل قسمت 9) Men vs. Women - do Culture & Religion matter? (Solution Part 9)

  • ورزش و سنت های ملی (راه حل بخش 10) National Sports and Traditions (Solution Part 10)

---- قسمت 4: پانداها برای امور مالی، سرمایه گذاری و سری زمانی ---- ---- PART 4: PANDAS FOR FINANCE, INVESTING & TIME SERIES ----

  • به بخش 4: امور مالی و سرمایه گذاری با پانداها خوش آمدید Welcome to PART 4: Finance and Investments with Pandas

  • دانلود: قسمت چهارم مطالب درسی Download: Part 4 Course Materials

مبانی سری زمانی Time Series Basics

  • وارد کردن داده‌های سری زمانی از فایل‌های csv Importing Time Series Data from csv-files

  • تبدیل رشته ها به اشیاء datetime با ()pd.to_datetime Converting strings to datetime objects with pd.to_datetime()

  • تجزیه و تحلیل اولیه/تجسم سری های زمانی Initial Analysis / Visualization of Time Series

  • فهرست بندی و برش سری های زمانی Indexing and Slicing Time Series

  • ایجاد یک DatetimeIndex سفارشی با pd.date_range() Creating a customized DatetimeIndex with pd.date_range()

  • اطلاعات بیشتر در pd.date_range() More on pd.date_range()

  • نمونه برداری از سری زمانی با resample() (قسمت 1) Downsampling Time Series with resample() (Part 1)

  • نمونه برداری از سری زمانی با نمونه مجدد (قسمت 2) Downsampling Time Series with resample (Part 2)

  • شی PeriodIndex The PeriodIndex object

  • نمایه سازی پیشرفته با reindex() Advanced Indexing with reindex()

پانداها برای امور مالی و سرمایه گذاری Pandas for Finance and Investing

  • مقدمه Intro

  • آماده شدن (نصب بسته مورد نیاز) Getting Ready (Installing required package)

  • وارد کردن داده های قیمت سهام از Yahoo Finance (هنوز کار می کند!) Importing Stock Price Data from Yahoo Finance (it still works!)

  • بازرسی اولیه و تجسم Initial Inspection and Visualization

  • عادی سازی سری زمانی به مقدار پایه (100) Normalizing Time Series to a Base Value (100)

  • متد ()shift The shift() method

  • متدهای diff() و pct_change() The methods diff() and pct_change()

  • اندازه گیری عملکرد سهام با بازده MEAN و STD از بازده Measuring Stock Performance with MEAN Returns and STD of Returns

  • سری زمانی مالی - بازده و ریسک Financial Time Series - Return and Risk

  • سری زمانی مالی - کوواریانس و همبستگی Financial Time Series - Covariance and Correlation

  • ویژگی ها و روش های مفید DatetimeIndex Helpful DatetimeIndex Attributes and Methods

  • پر کردن مقادیر NA با bfill، ffill و interpolation Filling NA Values with bfill, ffill and interpolation

  • تمرین کدنویسی 17 Coding Exercise 17

---- قسمت 5: یادگیری ماشینی با پانداها و SCIKIT-LEARN ---- ---- PART 5: MACHINE LEARNING WITH PANDAS AND SCIKIT-LEARN ----

  • بررسی اجمالی و دانلودها Overview & Downloads

مقدمه ای بر رگرسیون و طبقه بندی Introduction to Regression and Classification

  • یادگیری ماشین - یک مرور کلی Machine Learning - an Overview

  • رگرسیون خطی با scikit-learn - یک مقدمه ساده Linear Regression with scikit-learn - a simple Introduction

  • پیش بینی با رگرسیون خطی Making Predictions with Linear Regression

  • بیش از حد برازش Overfitting

  • کم تناسب Underfitting

  • رگرسیون لجستیک با scikit-learn - یک مقدمه ساده (قسمت 1) Logistic Regression with scikit-learn - a simple Introduction (Part 1)

  • رگرسیون لجستیک با scikit-learn - یک مقدمه ساده (قسمت 2) Logistic Regression with scikit-learn - a simple Introduction (Part 2)

جایزه: پروژه یادگیری ماشین A-Z (رگرسیون) BONUS: Machine Learning Project A-Z (Regression)

  • معرفی پروژه Project Intro

  • وارد کردن مجموعه داده و اولین بازرسی Importing the Dataset and first Inspection

  • پاک کردن داده ها و ایجاد ویژگی های بیشتر Cleaning the Data and Creating more Features

  • تجزیه و تحلیل داده های توضیحی (قسمت 1) Explanatory Data Analysis (Part 1)

  • تجزیه و تحلیل داده های توضیحی (قسمت 2) Explanatory Data Analysis (Part 2)

  • مهندسی ویژگی (قسمت 1) Feature Engineering (Part 1)

  • مهندسی ویژگی (قسمت 2) Feature Engineering (Part 2)

  • تقسیم داده ها به مجموعه آموزشی و مجموعه تست Splitting the Data into Training Set and Test Set

  • آموزش مدل یادگیری ماشینی Training the Machine Learning Model

  • تست/ارزیابی مدل با مجموعه تست Testing/Evaluating the Model with the Test Set

  • اهمیت ویژگی Feature Importance

+++ چه چیزهایی در PANDAS VERSION 1.0 جدید است؟ - راهنمای عملی +++ +++ WHAT´S NEW IN PANDAS VERSION 1.0? - A HANDS-ON GUIDE +++

  • مقدمه و نمای کلی Intro and Overview

  • نحوه آپدیت پانداها به نسخه 1.0 How to update Pandas to Version 1.0

  • دانلود برای این بخش Downloads for this Section

  • خلاصه مهم: گزینه های نمایش پانداها (تغییر در نسخه 0.25) Important Recap: Pandas Display Options (Changed in Version 0.25)

  • روش Info() - خروجی جدید و توسعه یافته Info() method - new and extended output

  • dtypes جدید پسوند (dtypes "nullable"): چرا به آنها نیاز داریم؟ NEW Extension dtypes ("nullable" dtypes): Why do we need them?

  • ایجاد پسوند جدید dtypes با convert_dtypes() Creating the NEW extension dtypes with convert_dtypes()

  • مقدار جدید pd.NA برای مقادیر از دست رفته NEW pd.NA value for missing values

  • جدید "nullable" Int64Dtype The NEW "nullable" Int64Dtype

  • StringDtype جدید The NEW StringDtype

  • جدید "nullable" BooleanDtype The NEW "nullable" BooleanDtype

  • اضافه کردن پارامتر ignore_index Addition of the ignore_index parameter

  • حذف نسخه قبلی Removal of prior Version Deprecations

---- ضمیمه: مبانی پایتون، NUMPY و آمار ---- ---- APPENDIX: PYTHON BASICS, NUMPY & STATISTICS ----

  • به ضمیمه خوش آمدید Welcome to the Appendix

مبانی پایتون Python Basics

  • دانلودها Downloads

  • مقدمه Intro

  • مراحل اول First Steps

  • متغیرها Variables

  • انواع داده ها: اعداد صحیح و شناور Data Types: Integers and Floats

  • انواع داده ها: رشته ها Data Types: Strings

  • انواع داده ها: فهرست ها (قسمت 1) Data Types: Lists (Part 1)

  • انواع داده ها: فهرست ها (قسمت 2) Data Types: Lists (Part 2)

  • انواع داده ها: تاپلی Data Types: Tuples

  • انواع داده ها: مجموعه ها Data Types: Sets

  • اپراتورها و بولی ها Operators & Booleans

  • اظهارات مشروط (اگر، elif، else، while) Conditional Statements (if, elif, else, while)

  • برای حلقه ها For Loops

  • کلمات کلیدی شکستن، پاس، ادامه دادن Key words break, pass, continue

  • تولید اعداد تصادفی Generating Random Numbers

  • توابع تعریف شده توسط کاربر (قسمت 1) User Defined Functions (Part 1)

  • توابع تعریف شده توسط کاربر (قسمت 2) User Defined Functions (Part 2)

  • توابع تعریف شده توسط کاربر (قسمت 3) User Defined Functions (Part 3)

  • تجسم با Matplotlib Visualization with Matplotlib

  • مبانی پایتون Python Basics

  • آزمون مبانی پایتون: راه حل Python Basics Quiz: Solution

بسته Numpy The Numpy Package

  • دانلودها Downloads

  • مقدمه ای بر Numpy Arrays Introduction to Numpy Arrays

  • آرایه های Numpy: برداری Numpy Arrays: Vectorization

  • آرایه های Numpy: نمایه سازی و برش Numpy Arrays: Indexing and Slicing

  • آرایه‌های Numpy: شکل و ابعاد Numpy Arrays: Shape and Dimensions

  • آرایه های Numpy: نمایه سازی و برش آرایه های چند بعدی Numpy Arrays: Indexing and Slicing of multi-dimensional Arrays

  • آرایه های Numpy: نمایه سازی بولی Numpy Arrays: Boolean Indexing

  • تولید اعداد تصادفی Generating Random Numbers

  • مسائل مربوط به عملکرد Performance Issues

  • مطالعه موردی: کتابخانه استاندارد Numpy در مقابل پایتون Case Study: Numpy vs. Python Standard Library

  • آمار خلاصه Summary Statistics

  • تجسم و رگرسیون (خطی). Visualization and (Linear) Regression

  • ناپخته Numpy

  • امتحان Numpy: راه حل Numpy Quiz: Solution

مفاهیم آماری Statistical Concepts

  • آمار - مرور کلی، اصطلاحات و واژگان Statistics - Overview, Terms and Vocabulary

  • دانلود برای این بخش Downloads for this Section

  • جمعیت در مقابل نمونه Population vs. Sample

  • تجسم توزیع فرکانس با ()plt.hist Visualizing Frequency Distributions with plt.hist()

  • فرکانس های نسبی و تجمعی با ()plt.hist Relative and Cumulative Frequencies with plt.hist()

  • معیارهای گرایش مرکزی (نظریه) Measures of Central Tendency (Theory)

  • معیارهای کدگذاری گرایش مرکزی - میانگین و میانه Coding Measures of Central Tendency - Mean and Median

  • معیارهای کدگذاری گرایش مرکزی - میانگین هندسی Coding Measures of Central Tendency - Geometric Mean

  • تغییرپذیری حول گرایش مرکزی/پراکندگی (نظریه) Variability around the Central Tendency / Dispersion (Theory)

  • حداقل، حداکثر و محدوده با Python/Numpy Minimum, Maximum and Range with Python/Numpy

  • صدک با پایتون/Numpy Percentiles with Python/Numpy

  • واریانس و انحراف استاندارد با Python/Numpy Variance and Standard Deviation with Python/Numpy

  • انحراف و کورتوزیس (نظریه) Skew and Kurtosis (Theory)

  • نحوه محاسبه Skew و Kurtosis با scipy.stats How to calculate Skew and Kurtosis with scipy.stats

  • نحوه تولید اعداد تصادفی با Numpy How to generate Random Numbers with Numpy

  • تکرارپذیری با np.random.seed() Reproducibility with np.random.seed()

  • توزیع احتمالات - بررسی اجمالی Probability Distributions - Overview

  • توزیع های یکنواخت گسسته Discrete Uniform Distributions

  • توزیع های یکنواخت پیوسته Continuous Uniform Distributions

  • توزیع نرمال (نظریه) The Normal Distribution (Theory)

  • ایجاد یک متغیر تصادفی با توزیع معمولی Creating a normally distributed Random Variable

  • توزیع عادی - تابع چگالی احتمال (pdf) با scipy.stats Normal Distribution - Probability Density Function (pdf) with scipy.stats

  • توزیع عادی - تابع توزیع تجمعی (cdf) با scipy.stats Normal Distribution - Cumulative Distribution Function (cdf) with scipy.stats

  • توزیع نرمال استاندارد و مقادیر Z The Standard Normal Distribution and Z-Values

  • ویژگی های توزیع نرمال استاندارد (نظریه) Properties of the Standard Normal Distribution (Theory)

  • احتمالات و Z-Values ​​با scipy.stats Probabilities and Z-Values with scipy.stats

  • فواصل اطمینان با scipy.stats Confidence Intervals with scipy.stats

  • کوواریانس و ضریب همبستگی (نظریه) Covariance and Correlation Coefficient (Theory)

  • تمیز کردن و آماده سازی پایگاه داده ها - فیلم ها (قسمت 1) Cleaning and preparing the Data - Movies Database (Part 1)

  • تمیز کردن و آماده سازی پایگاه داده - فیلم ها (قسمت 2) Cleaning and preparing the Data - Movies Database (Part 2)

  • نحوه محاسبه کوواریانس و همبستگی در پایتون How to calculate Covariance and Correlation in Python

  • همبستگی و پراکندگی - تفسیر بصری Correlation and Scatterplots – visual Interpretation

  • رگرسیون خطی چیست؟ (تئوری) What is Linear Regression? (Theory)

  • یک مدل رگرسیون خطی ساده با numpy و scipy A simple Linear Regression Model with numpy & Scipy

  • نحوه تفسیر ضریب فاصله و شیب How to interpret Intercept and Slope Coefficient

  • مطالعه موردی (قسمت 1): مدل بازار (مدل تک عاملی) Case Study (Part 1): The Market Model (Single Factor Model)

  • مطالعه موردی (بخش 2): مدل بازار (مدل تک عاملی) Case Study (Part 2): The Market Model (Single Factor Model)

بعد چی؟ (چشم انداز و منابع اضافی) What´s next? (outlook and additional resources)

  • سخنرانی پاداش Bonus Lecture

نمایش نظرات

آموزش بوت کمپ کامل پانداها 2022: علم داده با پایتون
جزییات دوره
33.5 hours
325
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
22,520
4.6 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Alexander Hagmann Alexander Hagmann

دانشمند داده | حرفه ای امور مالی | کارآفرین