آموزش پاکسازی و تبدیل داده‌ها با Polars - آخرین آپدیت

دانلود Clean and Transform Data with Polars

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: داده‌های نامنظم و ناسازگار باعث می‌شوند تحلیل‌ها غیرقابل اعتماد و کند شوند. در این دوره آموزشی با عنوان «پاکسازی و تبدیل داده‌ها با Polars»، شما یاد می‌گیرید که چگونه مجموعه‌داده‌های واقعی را با استفاده از API مبتنی بر Expression در Polars برای تحلیل آماده کنید. ابتدا، شناسایی مشکلات کیفیت داده‌ها مانند مقادیر خالی (null)، داده‌های تکراری و مقادیر نامعتبر را بررسی کرده و تعیین می‌کنید که چه مواردی باید پیش از تحلیل اصلاح شوند. سپس، با روش‌های استانداردسازی مجموعه‌داده‌ها آشنا خواهید شد. در نهایت، نحوه ایجاد مجموعه‌داده‌های تبدیل‌شده با استفاده از بررسی‌های سریع مانند شمارش ردیف‌ها و مقادیر خالی را می‌آموزید و داده‌های نهایی و آماده تحلیل را در فرمت‌های پایدار، به‌ویژه فرمت Parquet که گزینه پیشنهادی است، خروجی می‌گیرید. در پایان این دوره، شما مهارت و اعتمادبه‌نفس لازم برای پاکسازی، تبدیل، اعتبارسنجی و خروجی گرفتن از داده‌ها با استفاده از Polars را برای جریان‌های کاری تحلیل داده‌های واقعی به دست خواهید آورد.

سرفصل ها و درس ها

درک و شناسایی داده‌های نامنظم Understanding and profiling messy data

  • چرا پاکسازی داده‌ها اهمیت دارد Why data cleaning matters

  • بارگذاری و بررسی داده‌ها در Polars Loading and inspecting data in Polars

  • شناسایی مشکلات کیفیت داده‌ها Profiling data quality issues

پاکسازی و استانداردسازی داده‌ها Cleaning and standardizing data

  • استانداردسازی طرح (Schema) و انواع داده‌ها Standardizing schema and data types

  • مدیریت مقادیر گم‌شده و نامعتبر Handling missing and invalid values

  • نرمال‌سازی رشته‌ها و دسته‌بندی‌ها Normalizing strings and categories

تبدیل داده‌ها با عبارت‌های Polars Transforming data with Polars expressions

  • ایجاد و تغییر ستون‌ها Creating and modifying columns

  • منطق شرطی و دسته‌بندی داده‌ها (Bucketing) Conditional logic and bucketing

  • آماده‌سازی فیلدهای تاریخ و زمان Preparing date and time fields

تغییر شکل، اعتبارسنجی و خروجی داده‌ها Reshaping, validating, and exporting data

  • تغییر شکل داده‌ها برای تحلیل Reshaping data for analysis

  • اعتبارسنجی مجموعه‌داده نهایی Validating the final dataset

  • خروجی گرفتن از داده‌های آماده تحلیل Exporting analysis-ready data

نمایش نظرات

آموزش پاکسازی و تبدیل داده‌ها با Polars
جزییات دوره
41m
12
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
از 5
دارد
دارد
دارد
Smriti Mishra
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Smriti Mishra Smriti Mishra

اسمیتی میشرا (Smriti Mishra) مهندس داده، متخصص هوش مصنوعی و مدرس است که تجربه گسترده‌ای در ساخت سیستم‌های داده قابل اعتماد و مقیاس‌پذیر روی پلتفرم‌های ابری مدرن دارد. او به عنوان یکی از چهره‌های برتر لینکدین در حوزه فناوری و نوآوری (اروپا) و یکی از ۳۰ زن برجسته در حوزه داده شناخته شده است. اسمیتی در زمینه‌های مهندسی داده، کیفیت داده‌ها و معماری‌های Lakehouse تخصص دارد و مهارت عملی در Databricks، Microsoft Fabric، Azure، AWS و ابزارهای متن‌باز مانند Python، SQL و dbt داراست. فعالیت‌های او شامل طراحی خط لوله‌های داده (Data Pipelines) سرتاسری، پیاده‌سازی اعتبارسنجی و ردیابی داده‌ها (Lineage) و بهینه‌سازی عملکرد برای بارهای کاری حیاتی در صنایعی چون خرده‌فروشی، لجستیک، پایداری و مراقبت‌های بهداشتی است. او به عنوان مدرس در پلتفرم‌هایی مانند LinkedIn Learning و DataCamp، هزاران دانشجو را از طریق دوره‌های کاربردی و با امتیاز بالا در زمینه‌های قابلیت اطمینان داده، حاکمیت داده و جریان‌های مهندسی واقعی آموزش داده است. علاوه بر تدریس، او یک منتور فعال، سخنران عمومی و رهبر جامعه است که به عنوان مدیر AI4Diversity سوئد فعالیت می‌کند و در ابتکارات جهانی برای ترویج پذیرش مسئولانه و فراگیر هوش مصنوعی مشارکت دارد.