آموزش پاک‌سازی و تبدیل داده‌ها با Polars - آخرین آپدیت

دانلود Clean and Transform Data with Polars

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: داده‌های نامنظم و ناسازگار، تحلیل‌ها را غیرقابل اعتماد و کند می‌کنند. در این دوره آموزشی با عنوان «پاک‌سازی و تبدیل داده‌ها با Polars»، شما یاد می‌گیرید که چگونه مجموعه‌داده‌های واقعی را با استفاده از API مبتنی بر Expression در کتابخانه Polars برای تحلیل آماده کنید. در ابتدا، بررسی کیفیت داده‌ها (Profiling) از جمله شناسایی مقادیر تهی (null)، داده‌های تکراری و مقادیر نامعتبر را می‌آموزید و تعیین می‌کنید که چه مواردی باید پیش از تحلیل اصلاح شوند. سپس، با روش‌های استانداردسازی مجموعه‌داده‌ها آشنا خواهید شد. در نهایت، نحوه ایجاد مجموعه‌داده‌های تبدیل‌شده با استفاده از بررسی‌های سریع مانند شمارش ردیف‌ها و مقادیر تهی را یاد می‌گیرید و داده‌های نهایی و آماده تحلیل را در قالب‌های پایدار، به‌ویژه فرمت Parquet که توصیه شده است، خروجی می‌گیرید. در پایان این دوره، شما مهارت و اعتمادبه‌نفس لازم برای پاک‌سازی، تبدیل، اعتبارسنجی و اکسپورت داده‌ها با استفاده از Polars را برای جریان‌های کاری تحلیل داده در دنیای واقعی به دست خواهید آورد.

سرفصل ها و درس ها

درک و تحلیل داده‌های نامنظم Understanding and profiling messy data

  • چرا پاک‌سازی داده‌ها اهمیت دارد Why data cleaning matters

  • بارگذاری و بازرسی داده‌ها در Polars Loading and inspecting data in Polars

  • تحلیل مشکلات کیفیت داده‌ها Profiling data quality issues

پاک‌سازی و استانداردسازی داده‌ها Cleaning and standardizing data

  • استانداردسازی طرح (Schema) و انواع داده‌ها Standardizing schema and data types

  • مدیریت مقادیر تهی و نامعتبر Handling missing and invalid values

  • نرمال‌سازی رشته‌ها و دسته‌ها Normalizing strings and categories

تبدیل داده‌ها با استفاده از Expressions در Polars Transforming data with Polars expressions

  • ایجاد و اصلاح ستون‌ها Creating and modifying columns

  • منطق شرطی و دسته‌بندی (Bucketing) Conditional logic and bucketing

  • آماده‌سازی فیلدهای تاریخ و زمان Preparing date and time fields

تغییر شکل، اعتبارسنجی و خروجی گرفتن از داده‌ها Reshaping, validating, and exporting data

  • تغییر شکل داده‌ها برای تحلیل Reshaping data for analysis

  • اعتبارسنجی مجموعه‌داده نهایی Validating the final dataset

  • خروجی گرفتن از داده‌های آماده تحلیل Exporting analysis-ready data

نمایش نظرات

آموزش پاک‌سازی و تبدیل داده‌ها با Polars
جزییات دوره
41m
12
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
از 5
دارد
دارد
دارد
Smriti Mishra
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Smriti Mishra Smriti Mishra

اسمیتی میشرا (Smriti Mishra) مهندس داده، متخصص هوش مصنوعی و مدرس است که تجربه گسترده‌ای در ساخت سیستم‌های داده قابل اعتماد و مقیاس‌پذیر روی پلتفرم‌های ابری مدرن دارد. او به عنوان یکی از چهره‌های برتر لینکدین در حوزه فناوری و نوآوری (اروپا) و یکی از ۳۰ زن برجسته در حوزه داده شناخته شده است. اسمیتی در زمینه‌های مهندسی داده، کیفیت داده‌ها و معماری‌های Lakehouse تخصص دارد و مهارت عملی در Databricks، Microsoft Fabric، Azure، AWS و ابزارهای متن‌باز مانند Python، SQL و dbt داراست. فعالیت‌های او شامل طراحی خط لوله‌های داده (Data Pipelines) سرتاسری، پیاده‌سازی اعتبارسنجی و ردیابی داده‌ها (Lineage) و بهینه‌سازی عملکرد برای بارهای کاری حیاتی در صنایعی چون خرده‌فروشی، لجستیک، پایداری و مراقبت‌های بهداشتی است. او به عنوان مدرس در پلتفرم‌هایی مانند LinkedIn Learning و DataCamp، هزاران دانشجو را از طریق دوره‌های کاربردی و با امتیاز بالا در زمینه‌های قابلیت اطمینان داده، حاکمیت داده و جریان‌های مهندسی واقعی آموزش داده است. علاوه بر تدریس، او یک منتور فعال، سخنران عمومی و رهبر جامعه است که به عنوان مدیر AI4Diversity سوئد فعالیت می‌کند و در ابتکارات جهانی برای ترویج پذیرش مسئولانه و فراگیر هوش مصنوعی مشارکت دارد.