آموزش مهندسی داده و قابلیت اطمینان خط لوله (Pipeline) برای یادگیری ماشین - آخرین آپدیت

دانلود Data Engineering & Pipeline Reliability for Machine Learning

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: این دوره به شما می‌آموزد چگونه مجموعه‌داده‌های واقعی را از طریق تکنیک‌های عملی و تکرارپذیر پاک‌سازی داده، به دارایی‌های تحلیلی قابل اعتماد تبدیل کنید. شما یاد خواهید گرفت که ویژگی‌های دسته‌ای (Categorical) را ارزیابی کرده و استراتژی‌های بهینه رمزگذاری (Encoding) را انتخاب کنید، کیفیت داده‌ها را اندازه‌گیری و مستند کنید و رویکردهایی موثر برای مدیریت مقادیر مفقود (Missing Values) به کار ببرید. با استفاده از پایتون و کتابخانه pandas، ارزیابی کاردینالیتی، پیاده‌سازی Target Encoding، اعتبارسنجی کامل بودن داده‌ها با Great Expectations و ایجاد زنجیره تبدیل‌های شفاف را تمرین خواهید کرد. همچنین فیلدهای نامنظم مانند سن، داده‌های پرت حقوق و تاریخ‌ها را پاک‌سازی می‌کنید تا خروجی‌هایی سازگار و آماده برای مدل‌سازی داشته باشید. این دوره که برای تحلیلگران، مهندسان داده و متخصصان یادگیری ماشین طراحی شده است، شما را به مهارت‌های شغلی لازم برای آماده‌سازی مجموعه‌داده‌های باکیفیت مجهز می‌کند تا بینش‌های قابل اعتماد و مدل‌های پیش‌بینی دقیق ایجاد کنید.

سرفصل ها و درس ها

تبدیل داده‌ها: پاک‌سازی، رمزگذاری و اعتبارسنجی: انتخاب رمزگذاری مناسب: از کاردینالیتی تا برازش مدل Transform Data: Cleanse, Encode, Validate: Choose the Right Encoding: From Cardinality to Model Fit

  • خوش‌آمدگویی و بررسی اینکه رمزگذاری دقیقاً چه مشکلی را حل می‌کند Welcome and What Encoding Really Solves

  • ضروریات کاردینالیتی و راهنمای عملی Target Encoding Cardinality Essentials and a Practical Guide to Target Encoding

تبدیل داده‌ها: پاک‌سازی، رمزگذاری و اعتبارسنجی: معیارهای کیفیت داده و مستندسازی زنجیره تبدیل Transform Data: Cleanse, Encode, Validate: Data Quality Metrics and Lineage Documentation

  • معیارهای کیفیت داده و اعتبارسنجی سریع با Great Expectations Data Quality Metrics and Quick Validation with Great Expectations

تبدیل داده‌ها: پاک‌سازی، رمزگذاری و اعتبارسنجی: مدیریت داده‌های مفقود با اطمینان: جایگذاری، علامت‌گذاری و اعتبارسنجی Transform Data: Cleanse, Encode, Validate: Handle Missing Data with Confidence: Impute, Flag, and Validate

  • چرا داده‌های مفقود رخ می‌دهند و چرا اصلاح آن‌ها یک تصمیم استراتژیک است Why Missing Data Happens and Why Fixing It Is a Decision

مدیریت، تحلیل و ارزیابی خط لوله‌های ML: ساخت خط لوله‌های ETL و ELT برای Feature Storeها Orchestrate, Analyze, and Evaluate ML Pipelines: Building ETL and ELT Pipelines for Feature Stores

  • چرا ETL و ELT برای خط لوله‌های ML اهمیت دارند Why ETL and ELT Matter for ML Pipelines

  • مدیریت خط لوله‌های روزانه با Airflow Orchestrating Daily Pipelines with Airflow

مدیریت، تحلیل و ارزیابی خط لوله‌های ML: مدیریت تغییرات طرح‌واره (Schema) برای تاب‌آوری خط لوله Orchestrate, Analyze, and Evaluate ML Pipelines: Managing Schema Changes for Pipeline Resilience

  • چرا تغییرات Schema باعث خرابی خط لوله‌ها می‌شود Why Schema Changes Break Pipelines

  • بررسی عملی: به‌روزرسانی منطق تبدیل برای تغییرات Schema Applied Walkthrough: Updating Transform Logic for Schema Changes

مدیریت، تحلیل و ارزیابی خط لوله‌های ML: ارزیابی سلامت خط لوله در برابر توافق‌نامه‌های سطح خدمات (SLA) Orchestrate, Analyze, and Evaluate ML Pipelines: Evaluating Pipeline Health Against SLAs

  • از اجرای خط لوله تا توافق‌نامه‌های SLA From Pipeline Runs to SLAs

بهینه‌سازی توسعه ML: نسخه‌بندی، تکرارپذیری و ذخیره‌سازی: نسخه‌بندی جریان‌های کاری ML با اطمینان Optimize ML Dev: Version, Reproduce, and Save: Version ML Workflows with Confidence

  • ویدئوی خوش‌آمدگویی و معرفی دوره Welcome & Course Introduction Video

  • چگونه شاخه‌بندی در Git از توسعه ML پشتیبانی می‌کند How Git Branching Supports ML Development

  • ایجاد شاخه ویژگی (Feature Branch) و مدیریت مصنوعات Creating a Feature Branch and Managing Artifacts

بهینه‌سازی توسعه ML: نسخه‌بندی، تکرارپذیری و ذخیره‌سازی: ساخت محیط‌های تکرارپذیر برای ML Optimize ML Dev: Version, Reproduce, and Save: Build Reproducible ML Environments

  • درک محیط‌های مجازی برای توسعه یادگیری ماشین Understanding Virtual Environments for ML Development

  • راه‌اندازی پروژه Poetry و تثبیت وابستگی‌ها Initializing a Poetry Project and Locking Dependencies

بهینه‌سازی توسعه ML: نسخه‌بندی، تکرارپذیری و ذخیره‌سازی: بهینه‌سازی هزینه‌های محاسباتی در آزمایش‌های ML Optimize ML Dev: Version, Reproduce, and Save: Optimize Compute Costs in ML Experiments

  • درک هزینه‌های محاسباتی در توسعه ML Understanding Compute Cost in ML Development

  • شناسایی گلوگاه‌های منابع و انتقال پردازش‌ها به محاسبات ارزان‌تر Spotting Resource Bottlenecks and Moving Jobs to Cheaper Compute

پروژه: ساخت یک خط لوله داده ML آماده برای محیط عملیاتی Project: Build a Production-Ready ML Data Pipeline

نمایش نظرات

آموزش مهندسی داده و قابلیت اطمینان خط لوله (Pipeline) برای یادگیری ماشین
جزییات دوره
9h 3m
16
(آخرین آپدیت)
46
- از 5
دارد
دارد
دارد
Chris Croft
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Chris Croft Chris Croft

مربی مدیریت، سخنران، نویسنده