آموزش تجزیه و تحلیل داده ها با قطب ها

Data Analysis with Polars

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: تجزیه و تحلیل داده های خود را با Polars متحول کنید - کتابخانه قدرتمند قاب داده ای جدید بهره گیری از تجزیه و تحلیل موازی و بهینه با Polars کار با داده های بزرگتر از حافظه استفاده از عبارات Polars برای تجزیه و تحلیل که خواندن و نوشتن آسان است بارگیری داده ها از منابع داده بسیار متنوع ترکیب داده‌ها از مجموعه داده‌های مختلف با استفاده از عملیات اتصال سریع گروه‌بندی و تجمیع‌های موازی استخراج بینش از سری‌های زمانی آماده‌سازی داده‌ها برای خطوط لوله یادگیری ماشین تجسم داده‌ها با Matplotlib و Plotly پیش نیازها: رایانه با Windows/Linux/MacOS و نصب پایتون آشنایی اولیه با پانداها برای علم داده شما باید یک کاربر پاندا باشید، نه یک متخصص پاندا!

در این دوره به شما نشان می‌دهم که چگونه می‌توانید از مزایای Polars استفاده کنید - کتابخانه چارچوب داده منبع باز با رشد سریع که در حال تبدیل شدن به کتابخانه داده‌فریم برای دانشمندان داده در پایتون است. من یک مشارکت‌کننده Polars هستم که تمرکز آن بر قابل دسترس کردن Polars برای کاربران جدید است. من ماه ها وقت صرف کرده ام تا با تمام جزئیات پایگاه کد قطبی آشنا شوم.


"از کار عالی شما با این دوره متشکرم - من قبلاً به لطف آن کدهایی را بهینه کرده ام!" مایا بوچارووا


این دوره برای دانشمندان داده است که تا حدودی با یک کتابخانه دیتافریم مانند پانداها آشنایی دارند، اما می‌خواهند به قطب‌ها نقل مکان کنند، زیرا نوشتن آن آسان‌تر و اجرای سریع‌تر است. مواد اصلی، نوت بوک های Jupyter هستند که هر موضوع را به طور عمیق بررسی می کنند. هر دفترچه دارای مجموعه ای از تمرینات است که به شما کمک می کند تا درک خود را از مفاهیم اصلی توسعه دهید.


برای بسیاری از موضوعات کلیدی، این دوره تنها منبع مستندسازی است. من بر تولید نوت‌بوک‌های Jupyter تمرکز کرده‌ام تا به هر کسی که این دوره را می‌گذراند اجازه دهد تا از تمام قدرت Polars استفاده کند. در نتیجه محتوای ویدئویی محدود است. ویدیوهای بیشتری که فراتر از نوت‌بوک‌ها هستند، در ماه‌های آینده پس از ثبت عملکرد اصلی در نوت‌بوک‌ها اضافه خواهند شد.


این دوره، نحو Polars را معرفی می‌کند و راه‌های زیادی را به شما نشان می‌دهد که Polars به ​​شما اجازه می‌دهد پرس و جوهایی را بنویسید که خواندن و نوشتن آسان باشد. با این حال، این دوره همچنین عمیق‌تر می‌شود تا به شما در درک و بهره‌برداری از الگوریتم‌هایی که عملکرد فوق‌العاده Polars را هدایت می‌کنند، کمک کند.


در پایان دوره، روش‌های بهینه‌سازی شده‌ای خواهید داشت:

  • داده های خود را از CSV، Excel، Parquet، IPC یا اتصال پایگاه داده بارگیری و تبدیل کنید

  • تحلیل خود را به صورت موازی اجرا کنید

  • با مجموعه داده های بزرگتر از حافظه کار کنید

  • تجمیع داده‌های خود را انجام دهید

  • مجموعه داده های خود را ترکیب کنید

  • خروجی های خود را تجسم کنید و

  • داده های خود را برای خطوط لوله یادگیری ماشین آماده کنید


سرفصل ها و درس ها

مقدمه - راه اندازی و اجرا با Polars Introduction - up and running with Polars

  • معرفی دوره Course introduction

  • چرا از قطبی به جای پاندا استفاده کنیم؟ Why use Polars instead of Pandas?

  • چگونه می توانید از مطالب دوره بهترین استفاده را ببرید؟ How can you make best use of the course materials?

  • مواد درسی Course materials

  • نصب نرم افزار روی MacOS و Linux Installing the software on MacOS & Linux

  • نصب نرم افزار روی ویندوز Installing the software on Windows

  • نحوه استفاده از مطالب این دوره How to use the materials on this course

  • شروع سریع قطبی Polars quickstart

  • حالت تنبل 1: معرفی حالت تنبل Lazy mode 1: Introducing lazy mode

  • حالت تنبل 2: ارزیابی پرس و جوها Lazy mode 2: evaluating queries

  • مقدمه ای بر انواع داده ها Introduction to Data types

  • مقدمه ای بر سری و دیتا فریم Introduction to Series and DataFrame

  • تبدیل به و از Pandas & Numpy Converting to and from Pandas & Numpy

  • حالت تنبلی Lazy mode

فیلتر کردن ردیف ها Filtering rows

  • فیلتر کردن ردیف I: فیلتر کردن ردیف ها با براکت مربع Filtering rows I: Filtering rows with square brackets

  • فیلتر کردن ردیف‌های 2: با استفاده از «filter» و Expression API Filtering rows 2: Using `filter` and the Expression API

  • فیلتر کردن ردیف 3: استفاده از «فیلتر» در حالت تنبل Filtering rows 3: using `filter` in lazy mode

  • فیلتر کردن ردیف ها بر اساس مقادیر یک DataFrame دیگر Filtering rows based on values from another DataFrame

  • فیلتر کردن ردیف ها Filtering rows

انتخاب ستون ها و تبدیل قالب های داده Selecting columns and transforming dataframes

  • انتخاب ستون 1: با استفاده از براکت مربع Selecting columns 1: using square brackets

  • انتخاب ستون 2: استفاده از انتخاب و عبارات Selecting columns 2: using select and expressions

  • انتخاب ستون 3: انتخاب چند ستون Selecting columns 3: choosing multiple columns

  • انتخاب ستون 4: تبدیل و اضافه کردن ستون Selecting columns 4: transforming and adding columns

  • انتخاب ستون 5: تبدیل و اضافه کردن چندین ستون Selecting columns 5: Transforming and adding multiple columns

  • انتخاب ستون 6: افزودن ستون بر اساس یک شرط یا نگاشت Selecting columns 6: Adding a column based on a condition or mapping

  • الگوریتم های مرتب سازی و ردیابی سریع Sorting and fast-track algorithms

  • تبدیل یک DataFrame Transforming a DataFrame

  • تکرار از طریق DataFrame Iterating through a DataFrame

  • انتخاب ستون ها Selecting columns

  • اضافه کردن ستون های جدید Adding new columns

  • اضافه کردن یک ستون جدید Adding a new column

انواع داده ها و مقادیر از دست رفته Data types and missing values

  • ارزش از دست رفته Missing values

  • جایگزینی مقادیر از دست رفته Replacing missing values

  • جایگزینی مقادیر از دست رفته با عبارات Replacing missing values with expressions

  • ارزش از دست رفته Missing values

  • dtypes عددی و دقت Numerical dtypes and precision

  • رشته و دسته بندی dtypes String and categorical dtypes

  • دسته بندی ها و حافظه پنهان رشته Categoricals and the string cache

  • مقدمه ای بر dtypes تو در تو: List، Struct و Object Introduction to nested dtypes: List, Struct and Object

  • لیست dtype 1: ایجاد و تبدیل ستون های لیست List dtype 1: Creating and transforming List columns

  • لیست dtype 2: با استفاده از عبارات در ستون های List List dtype 2: using expressions on List columns

  • dtypes تو در تو Nested dtypes

آمار، شمارش و گروه بندی Statistics, counts and grouping

  • آمار Statistics

  • ارزش به حساب می آید Value counts

  • Groupby 1: شی GroupBy Groupby 1: The GroupBy object

  • Groupby 2: تجمعات و عبارات Groupby 2: Aggregations and expressions

  • Groupby 3: تجمیع چندگانه Groupby 3: Multiple aggregations

  • Groupby 4: Groupby تنبل Groupby 4: Lazy groupby

  • شمارش مقادیر Counting values

  • کار با GroupBy و گروه ها Working with GroupBy and groups

  • گروه بندی و تجمیع Grouping and aggregations

  • کوانتیل ها Quantiles

  • مقدمه ای بر عملیات گروهی با over() Introduction to group operations with over()

ترکیب دیتافریم ها Combining dataframes

  • الحاق DataFrames Concatenating DataFrames

  • اتصالات چپ، داخلی و سریع Left, inner and fast-track joins

  • در رشته ها و داده های دسته بندی می پیوندد Joins on string and categorical data

  • فیلتر کردن یک DataFrame توسط DataFrame دیگر Filtering a DataFrame by another DataFrame

  • استفاده از DataFrame دیگر در یک عبارت Using another DataFrame in an expression

  • گسترش، انباشته و الحاق Extending, stacking and concatenating

تحلیل سری های زمانی Time series analysis

  • مقدمه ای بر سری های زمانی dtypes Introduction to time series dtypes

  • محدوده های زمانی Time zones

  • مسابقه مناطق زمانی Time zones quiz

  • تجزیه رشته تاریخ Parsing datetime strings

  • تنظیم زمان تاریخ Adjusting datetimes

  • تجزیه و تحلیل و تنظیم تاریخ مسابقه Parsing and adjusting datetimes quiz

  • استخراج اجزای تاریخ Extracting datetime components

  • فیلتر کردن سری های زمانی Filtering time series

  • گروه زمانی موقت - مقدمه ای بر groupby_dynamic Temporal groupby - introduction to groupby_dynamic

  • کنترل پنجره «groupby_dynamic». Controlling the `groupby_dynamic` window

ورودی خروجی Input/Output

  • یک فایل CSV را بخوانید Read a single CSV file

  • فایل‌های CSV 2: چندین فایل CSV CSV files 2: multiple CSV files

  • یک فایل اکسل را بخوانید Read an Excel file

  • JSON و JSON خط جدید را بخوانید Read JSON and newline delimited JSON

  • فایل‌های CSV 3: خواندن فایل‌های CSV بزرگتر از حافظه به صورت دسته‌ای CSV files 3: reading larger-than-memory CSV files in batches

  • فایل های CSV 4: پخش مجموعه داده های بزرگتر از حافظه CSV files 4: streaming larger-than-memory datasets

  • فایل پارکت 1: فایل پارکت تک Parquet files 1: single Parquet files

  • خواندن از پایگاه داده Reading from a database

تجسم ها Visualisations

  • تجسم با Plotly Visualisations with Plotly

  • تجسم با Matplotlib Visualisations with Matplotlib

  • تجسم با Seaborn Visualisations with Seaborn

نمایش نظرات

آموزش تجزیه و تحلیل داده ها با قطب ها
جزییات دوره
1.5 hours
68
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
554
4.7 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Liam Brannigan Liam Brannigan

مدرس علوم داده و ارتباط دهنده