لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش تجزیه و تحلیل داده ها با قطب ها
Data Analysis with Polars
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
تجزیه و تحلیل داده های خود را با Polars متحول کنید - کتابخانه قدرتمند قاب داده ای جدید بهره گیری از تجزیه و تحلیل موازی و بهینه با Polars کار با داده های بزرگتر از حافظه استفاده از عبارات Polars برای تجزیه و تحلیل که خواندن و نوشتن آسان است بارگیری داده ها از منابع داده بسیار متنوع ترکیب دادهها از مجموعه دادههای مختلف با استفاده از عملیات اتصال سریع گروهبندی و تجمیعهای موازی استخراج بینش از سریهای زمانی آمادهسازی دادهها برای خطوط لوله یادگیری ماشین تجسم دادهها با Matplotlib و Plotly پیش نیازها: رایانه با Windows/Linux/MacOS و نصب پایتون آشنایی اولیه با پانداها برای علم داده شما باید یک کاربر پاندا باشید، نه یک متخصص پاندا!
در این دوره به شما نشان میدهم که چگونه میتوانید از مزایای Polars استفاده کنید - کتابخانه چارچوب داده منبع باز با رشد سریع که در حال تبدیل شدن به کتابخانه دادهفریم برای دانشمندان داده در پایتون است. من یک مشارکتکننده Polars هستم که تمرکز آن بر قابل دسترس کردن Polars برای کاربران جدید است. من ماه ها وقت صرف کرده ام تا با تمام جزئیات پایگاه کد قطبی آشنا شوم.
"از کار عالی شما با این دوره متشکرم - من قبلاً به لطف آن کدهایی را بهینه کرده ام!" مایا بوچارووا
این دوره برای دانشمندان داده است که تا حدودی با یک کتابخانه دیتافریم مانند پانداها آشنایی دارند، اما میخواهند به قطبها نقل مکان کنند، زیرا نوشتن آن آسانتر و اجرای سریعتر است. مواد اصلی، نوت بوک های Jupyter هستند که هر موضوع را به طور عمیق بررسی می کنند. هر دفترچه دارای مجموعه ای از تمرینات است که به شما کمک می کند تا درک خود را از مفاهیم اصلی توسعه دهید.
برای بسیاری از موضوعات کلیدی، این دوره تنها منبع مستندسازی است. من بر تولید نوتبوکهای Jupyter تمرکز کردهام تا به هر کسی که این دوره را میگذراند اجازه دهد تا از تمام قدرت Polars استفاده کند. در نتیجه محتوای ویدئویی محدود است. ویدیوهای بیشتری که فراتر از نوتبوکها هستند، در ماههای آینده پس از ثبت عملکرد اصلی در نوتبوکها اضافه خواهند شد.
این دوره، نحو Polars را معرفی میکند و راههای زیادی را به شما نشان میدهد که Polars به شما اجازه میدهد پرس و جوهایی را بنویسید که خواندن و نوشتن آسان باشد. با این حال، این دوره همچنین عمیقتر میشود تا به شما در درک و بهرهبرداری از الگوریتمهایی که عملکرد فوقالعاده Polars را هدایت میکنند، کمک کند.
در پایان دوره، روشهای بهینهسازی شدهای خواهید داشت:
داده های خود را از CSV، Excel، Parquet، IPC یا اتصال پایگاه داده بارگیری و تبدیل کنید
تحلیل خود را به صورت موازی اجرا کنید
با مجموعه داده های بزرگتر از حافظه کار کنید
تجمیع دادههای خود را انجام دهید
مجموعه داده های خود را ترکیب کنید
خروجی های خود را تجسم کنید و
داده های خود را برای خطوط لوله یادگیری ماشین آماده کنید
سرفصل ها و درس ها
مقدمه - راه اندازی و اجرا با Polars
Introduction - up and running with Polars
معرفی دوره
Course introduction
چرا از قطبی به جای پاندا استفاده کنیم؟
Why use Polars instead of Pandas?
چگونه می توانید از مطالب دوره بهترین استفاده را ببرید؟
How can you make best use of the course materials?
مواد درسی
Course materials
نصب نرم افزار روی MacOS و Linux
Installing the software on MacOS & Linux
نصب نرم افزار روی ویندوز
Installing the software on Windows
نحوه استفاده از مطالب این دوره
How to use the materials on this course
شروع سریع قطبی
Polars quickstart
حالت تنبل 1: معرفی حالت تنبل
Lazy mode 1: Introducing lazy mode
حالت تنبل 2: ارزیابی پرس و جوها
Lazy mode 2: evaluating queries
مقدمه ای بر انواع داده ها
Introduction to Data types
مقدمه ای بر سری و دیتا فریم
Introduction to Series and DataFrame
تبدیل به و از Pandas & Numpy
Converting to and from Pandas & Numpy
حالت تنبلی
Lazy mode
فیلتر کردن ردیف ها
Filtering rows
فیلتر کردن ردیف I: فیلتر کردن ردیف ها با براکت مربع
Filtering rows I: Filtering rows with square brackets
فیلتر کردن ردیفهای 2: با استفاده از «filter» و Expression API
Filtering rows 2: Using `filter` and the Expression API
فیلتر کردن ردیف 3: استفاده از «فیلتر» در حالت تنبل
Filtering rows 3: using `filter` in lazy mode
فیلتر کردن ردیف ها بر اساس مقادیر یک DataFrame دیگر
Filtering rows based on values from another DataFrame
فیلتر کردن ردیف ها
Filtering rows
انتخاب ستون ها و تبدیل قالب های داده
Selecting columns and transforming dataframes
انتخاب ستون 1: با استفاده از براکت مربع
Selecting columns 1: using square brackets
انتخاب ستون 2: استفاده از انتخاب و عبارات
Selecting columns 2: using select and expressions
انتخاب ستون 3: انتخاب چند ستون
Selecting columns 3: choosing multiple columns
انتخاب ستون 4: تبدیل و اضافه کردن ستون
Selecting columns 4: transforming and adding columns
انتخاب ستون 5: تبدیل و اضافه کردن چندین ستون
Selecting columns 5: Transforming and adding multiple columns
انتخاب ستون 6: افزودن ستون بر اساس یک شرط یا نگاشت
Selecting columns 6: Adding a column based on a condition or mapping
الگوریتم های مرتب سازی و ردیابی سریع
Sorting and fast-track algorithms
تبدیل یک DataFrame
Transforming a DataFrame
تکرار از طریق DataFrame
Iterating through a DataFrame
انتخاب ستون ها
Selecting columns
اضافه کردن ستون های جدید
Adding new columns
اضافه کردن یک ستون جدید
Adding a new column
انواع داده ها و مقادیر از دست رفته
Data types and missing values
ارزش از دست رفته
Missing values
جایگزینی مقادیر از دست رفته
Replacing missing values
جایگزینی مقادیر از دست رفته با عبارات
Replacing missing values with expressions
ارزش از دست رفته
Missing values
dtypes عددی و دقت
Numerical dtypes and precision
رشته و دسته بندی dtypes
String and categorical dtypes
دسته بندی ها و حافظه پنهان رشته
Categoricals and the string cache
مقدمه ای بر dtypes تو در تو: List، Struct و Object
Introduction to nested dtypes: List, Struct and Object
لیست dtype 1: ایجاد و تبدیل ستون های لیست
List dtype 1: Creating and transforming List columns
لیست dtype 2: با استفاده از عبارات در ستون های List
List dtype 2: using expressions on List columns
dtypes تو در تو
Nested dtypes
آمار، شمارش و گروه بندی
Statistics, counts and grouping
آمار
Statistics
ارزش به حساب می آید
Value counts
Groupby 1: شی GroupBy
Groupby 1: The GroupBy object
Groupby 2: تجمعات و عبارات
Groupby 2: Aggregations and expressions
نمایش نظرات