دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش مهندسی داده و قابلیت اطمینان خط لوله (Pipeline) برای یادگیری ماشین - آخرین آپدیت

دانلود Data Engineering & Pipeline Reliability for Machine Learning

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: این دوره به شما می‌آموزد چگونه مجموعه‌داده‌های واقعی را از طریق تکنیک‌های عملی و تکرارپذیر پاک‌سازی داده، به دارایی‌های تحلیلی قابل اعتماد تبدیل کنید. شما یاد خواهید گرفت که ویژگی‌های دسته‌ای (Categorical) را ارزیابی کرده و استراتژی‌های بهینه رمزگذاری (Encoding) را انتخاب کنید، کیفیت داده‌ها را اندازه‌گیری و مستند کنید و رویکردهایی موثر برای مدیریت مقادیر مفقود (Missing Values) به کار ببرید. با استفاده از پایتون و کتابخانه pandas، ارزیابی کاردینالیتی، پیاده‌سازی Target Encoding، اعتبارسنجی کامل بودن داده‌ها با Great Expectations و ایجاد زنجیره تبدیل‌های شفاف را تمرین خواهید کرد. همچنین فیلدهای نامنظم مانند سن، داده‌های پرت حقوق و تاریخ‌ها را پاک‌سازی می‌کنید تا خروجی‌هایی سازگار و آماده برای مدل‌سازی داشته باشید. این دوره که برای تحلیلگران، مهندسان داده و متخصصان یادگیری ماشین طراحی شده است، شما را به مهارت‌های شغلی لازم برای آماده‌سازی مجموعه‌داده‌های باکیفیت مجهز می‌کند تا بینش‌های قابل اعتماد و مدل‌های پیش‌بینی دقیق ایجاد کنید.

سرفصل ها و درس ها

تبدیل داده‌ها: پاک‌سازی، رمزگذاری و اعتبارسنجی: انتخاب رمزگذاری مناسب: از کاردینالیتی تا برازش مدل Transform Data: Cleanse, Encode, Validate: Choose the Right Encoding: From Cardinality to Model Fit

خوش‌آمدگویی و بررسی اینکه رمزگذاری دقیقاً چه مشکلی را حل می‌کند Welcome and What Encoding Really Solves
ضروریات کاردینالیتی و راهنمای عملی Target Encoding Cardinality Essentials and a Practical Guide to Target Encoding

تبدیل داده‌ها: پاک‌سازی، رمزگذاری و اعتبارسنجی: معیارهای کیفیت داده و مستندسازی زنجیره تبدیل Transform Data: Cleanse, Encode, Validate: Data Quality Metrics and Lineage Documentation

معیارهای کیفیت داده و اعتبارسنجی سریع با Great Expectations Data Quality Metrics and Quick Validation with Great Expectations

تبدیل داده‌ها: پاک‌سازی، رمزگذاری و اعتبارسنجی: مدیریت داده‌های مفقود با اطمینان: جایگذاری، علامت‌گذاری و اعتبارسنجی Transform Data: Cleanse, Encode, Validate: Handle Missing Data with Confidence: Impute, Flag, and Validate

چرا داده‌های مفقود رخ می‌دهند و چرا اصلاح آن‌ها یک تصمیم استراتژیک است Why Missing Data Happens and Why Fixing It Is a Decision

مدیریت، تحلیل و ارزیابی خط لوله‌های ML: ساخت خط لوله‌های ETL و ELT برای Feature Storeها Orchestrate, Analyze, and Evaluate ML Pipelines: Building ETL and ELT Pipelines for Feature Stores

چرا ETL و ELT برای خط لوله‌های ML اهمیت دارند Why ETL and ELT Matter for ML Pipelines
مدیریت خط لوله‌های روزانه با Airflow Orchestrating Daily Pipelines with Airflow

مدیریت، تحلیل و ارزیابی خط لوله‌های ML: مدیریت تغییرات طرح‌واره (Schema) برای تاب‌آوری خط لوله Orchestrate, Analyze, and Evaluate ML Pipelines: Managing Schema Changes for Pipeline Resilience

چرا تغییرات Schema باعث خرابی خط لوله‌ها می‌شود Why Schema Changes Break Pipelines
بررسی عملی: به‌روزرسانی منطق تبدیل برای تغییرات Schema Applied Walkthrough: Updating Transform Logic for Schema Changes

مدیریت، تحلیل و ارزیابی خط لوله‌های ML: ارزیابی سلامت خط لوله در برابر توافق‌نامه‌های سطح خدمات (SLA) Orchestrate, Analyze, and Evaluate ML Pipelines: Evaluating Pipeline Health Against SLAs

از اجرای خط لوله تا توافق‌نامه‌های SLA From Pipeline Runs to SLAs

بهینه‌سازی توسعه ML: نسخه‌بندی، تکرارپذیری و ذخیره‌سازی: نسخه‌بندی جریان‌های کاری ML با اطمینان Optimize ML Dev: Version, Reproduce, and Save: Version ML Workflows with Confidence

ویدئوی خوش‌آمدگویی و معرفی دوره Welcome & Course Introduction Video
چگونه شاخه‌بندی در Git از توسعه ML پشتیبانی می‌کند How Git Branching Supports ML Development
ایجاد شاخه ویژگی (Feature Branch) و مدیریت مصنوعات Creating a Feature Branch and Managing Artifacts

بهینه‌سازی توسعه ML: نسخه‌بندی، تکرارپذیری و ذخیره‌سازی: ساخت محیط‌های تکرارپذیر برای ML Optimize ML Dev: Version, Reproduce, and Save: Build Reproducible ML Environments

درک محیط‌های مجازی برای توسعه یادگیری ماشین Understanding Virtual Environments for ML Development
راه‌اندازی پروژه Poetry و تثبیت وابستگی‌ها Initializing a Poetry Project and Locking Dependencies

بهینه‌سازی توسعه ML: نسخه‌بندی، تکرارپذیری و ذخیره‌سازی: بهینه‌سازی هزینه‌های محاسباتی در آزمایش‌های ML Optimize ML Dev: Version, Reproduce, and Save: Optimize Compute Costs in ML Experiments

درک هزینه‌های محاسباتی در توسعه ML Understanding Compute Cost in ML Development
شناسایی گلوگاه‌های منابع و انتقال پردازش‌ها به محاسبات ارزان‌تر Spotting Resource Bottlenecks and Moving Jobs to Cheaper Compute

پروژه: ساخت یک خط لوله داده ML آماده برای محیط عملیاتی Project: Build a Production-Ready ML Data Pipeline

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش مهندسی داده و قابلیت اطمینان خط لوله (Pipeline) برای یادگیری ماشین

جزییات دوره

زمان دوره: 9h 3m

تعداد ویدیو ها: 16

شرکت: Coursera (کورسرا)

تاریخ انتشار مرجع: (آخرین آپدیت)

بازدید مرجع : 46

امتیاز مرجع: - از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Chris Croft

لینک کوتاه این دوره

https://donyad.com/d/1262f7

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

آموزش مهندسی داده و قابلیت اطمینان خط لوله (Pipeline) برای یادگیری ماشین - آخرین آپدیت

دانلود Data Engineering & Pipeline Reliability for Machine Learning

تبدیل داده‌ها: پاک‌سازی، رمزگذاری و اعتبارسنجی: انتخاب رمزگذاری مناسب: از کاردینالیتی تا برازش مدل Transform Data: Cleanse, Encode, Validate: Choose the Right Encoding: From Cardinality to Model Fit

خوش‌آمدگویی و بررسی اینکه رمزگذاری دقیقاً چه مشکلی را حل می‌کند Welcome and What Encoding Really Solves

ضروریات کاردینالیتی و راهنمای عملی Target Encoding Cardinality Essentials and a Practical Guide to Target Encoding

تبدیل داده‌ها: پاک‌سازی، رمزگذاری و اعتبارسنجی: معیارهای کیفیت داده و مستندسازی زنجیره تبدیل Transform Data: Cleanse, Encode, Validate: Data Quality Metrics and Lineage Documentation

معیارهای کیفیت داده و اعتبارسنجی سریع با Great Expectations Data Quality Metrics and Quick Validation with Great Expectations

چرا داده‌های مفقود رخ می‌دهند و چرا اصلاح آن‌ها یک تصمیم استراتژیک است Why Missing Data Happens and Why Fixing It Is a Decision

مدیریت، تحلیل و ارزیابی خط لوله‌های ML: ساخت خط لوله‌های ETL و ELT برای Feature Storeها Orchestrate, Analyze, and Evaluate ML Pipelines: Building ETL and ELT Pipelines for Feature Stores

چرا ETL و ELT برای خط لوله‌های ML اهمیت دارند Why ETL and ELT Matter for ML Pipelines

مدیریت خط لوله‌های روزانه با Airflow Orchestrating Daily Pipelines with Airflow

مدیریت، تحلیل و ارزیابی خط لوله‌های ML: مدیریت تغییرات طرح‌واره (Schema) برای تاب‌آوری خط لوله Orchestrate, Analyze, and Evaluate ML Pipelines: Managing Schema Changes for Pipeline Resilience

چرا تغییرات Schema باعث خرابی خط لوله‌ها می‌شود Why Schema Changes Break Pipelines

بررسی عملی: به‌روزرسانی منطق تبدیل برای تغییرات Schema Applied Walkthrough: Updating Transform Logic for Schema Changes

مدیریت، تحلیل و ارزیابی خط لوله‌های ML: ارزیابی سلامت خط لوله در برابر توافق‌نامه‌های سطح خدمات (SLA) Orchestrate, Analyze, and Evaluate ML Pipelines: Evaluating Pipeline Health Against SLAs

از اجرای خط لوله تا توافق‌نامه‌های SLA From Pipeline Runs to SLAs

بهینه‌سازی توسعه ML: نسخه‌بندی، تکرارپذیری و ذخیره‌سازی: نسخه‌بندی جریان‌های کاری ML با اطمینان Optimize ML Dev: Version, Reproduce, and Save: Version ML Workflows with Confidence

ویدئوی خوش‌آمدگویی و معرفی دوره Welcome & Course Introduction Video

چگونه شاخه‌بندی در Git از توسعه ML پشتیبانی می‌کند How Git Branching Supports ML Development

ایجاد شاخه ویژگی (Feature Branch) و مدیریت مصنوعات Creating a Feature Branch and Managing Artifacts

بهینه‌سازی توسعه ML: نسخه‌بندی، تکرارپذیری و ذخیره‌سازی: ساخت محیط‌های تکرارپذیر برای ML Optimize ML Dev: Version, Reproduce, and Save: Build Reproducible ML Environments

درک محیط‌های مجازی برای توسعه یادگیری ماشین Understanding Virtual Environments for ML Development

راه‌اندازی پروژه Poetry و تثبیت وابستگی‌ها Initializing a Poetry Project and Locking Dependencies

بهینه‌سازی توسعه ML: نسخه‌بندی، تکرارپذیری و ذخیره‌سازی: بهینه‌سازی هزینه‌های محاسباتی در آزمایش‌های ML Optimize ML Dev: Version, Reproduce, and Save: Optimize Compute Costs in ML Experiments

درک هزینه‌های محاسباتی در توسعه ML Understanding Compute Cost in ML Development

شناسایی گلوگاه‌های منابع و انتقال پردازش‌ها به محاسبات ارزان‌تر Spotting Resource Bottlenecks and Moving Jobs to Cheaper Compute

پروژه: ساخت یک خط لوله داده ML آماده برای محیط عملیاتی Project: Build a Production-Ready ML Data Pipeline

نمایش نظرات

https://donyad.com/d/1262f7

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar