لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش مهندسی داده و قابلیت اطمینان خط لوله (Pipeline) برای یادگیری ماشین
- آخرین آپدیت
دانلود Data Engineering & Pipeline Reliability for Machine Learning
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
این دوره به شما میآموزد چگونه مجموعهدادههای واقعی را از طریق تکنیکهای عملی و تکرارپذیر پاکسازی داده، به داراییهای تحلیلی قابل اعتماد تبدیل کنید. شما یاد خواهید گرفت که ویژگیهای دستهای (Categorical) را ارزیابی کرده و استراتژیهای بهینه رمزگذاری (Encoding) را انتخاب کنید، کیفیت دادهها را اندازهگیری و مستند کنید و رویکردهایی موثر برای مدیریت مقادیر مفقود (Missing Values) به کار ببرید. با استفاده از پایتون و کتابخانه pandas، ارزیابی کاردینالیتی، پیادهسازی Target Encoding، اعتبارسنجی کامل بودن دادهها با Great Expectations و ایجاد زنجیره تبدیلهای شفاف را تمرین خواهید کرد. همچنین فیلدهای نامنظم مانند سن، دادههای پرت حقوق و تاریخها را پاکسازی میکنید تا خروجیهایی سازگار و آماده برای مدلسازی داشته باشید. این دوره که برای تحلیلگران، مهندسان داده و متخصصان یادگیری ماشین طراحی شده است، شما را به مهارتهای شغلی لازم برای آمادهسازی مجموعهدادههای باکیفیت مجهز میکند تا بینشهای قابل اعتماد و مدلهای پیشبینی دقیق ایجاد کنید.
سرفصل ها و درس ها
تبدیل دادهها: پاکسازی، رمزگذاری و اعتبارسنجی: انتخاب رمزگذاری مناسب: از کاردینالیتی تا برازش مدل
Transform Data: Cleanse, Encode, Validate: Choose the Right Encoding: From Cardinality to Model Fit
خوشآمدگویی و بررسی اینکه رمزگذاری دقیقاً چه مشکلی را حل میکند
Welcome and What Encoding Really Solves
ضروریات کاردینالیتی و راهنمای عملی Target Encoding
Cardinality Essentials and a Practical Guide to Target Encoding
تبدیل دادهها: پاکسازی، رمزگذاری و اعتبارسنجی: معیارهای کیفیت داده و مستندسازی زنجیره تبدیل
Transform Data: Cleanse, Encode, Validate: Data Quality Metrics and Lineage Documentation
معیارهای کیفیت داده و اعتبارسنجی سریع با Great Expectations
Data Quality Metrics and Quick Validation with Great Expectations
تبدیل دادهها: پاکسازی، رمزگذاری و اعتبارسنجی: مدیریت دادههای مفقود با اطمینان: جایگذاری، علامتگذاری و اعتبارسنجی
Transform Data: Cleanse, Encode, Validate: Handle Missing Data with Confidence: Impute, Flag, and Validate
چرا دادههای مفقود رخ میدهند و چرا اصلاح آنها یک تصمیم استراتژیک است
Why Missing Data Happens and Why Fixing It Is a Decision
مدیریت، تحلیل و ارزیابی خط لولههای ML: ساخت خط لولههای ETL و ELT برای Feature Storeها
Orchestrate, Analyze, and Evaluate ML Pipelines: Building ETL and ELT Pipelines for Feature Stores
چرا ETL و ELT برای خط لولههای ML اهمیت دارند
Why ETL and ELT Matter for ML Pipelines
مدیریت خط لولههای روزانه با Airflow
Orchestrating Daily Pipelines with Airflow
مدیریت، تحلیل و ارزیابی خط لولههای ML: مدیریت تغییرات طرحواره (Schema) برای تابآوری خط لوله
Orchestrate, Analyze, and Evaluate ML Pipelines: Managing Schema Changes for Pipeline Resilience
چرا تغییرات Schema باعث خرابی خط لولهها میشود
Why Schema Changes Break Pipelines
بررسی عملی: بهروزرسانی منطق تبدیل برای تغییرات Schema
Applied Walkthrough: Updating Transform Logic for Schema Changes
مدیریت، تحلیل و ارزیابی خط لولههای ML: ارزیابی سلامت خط لوله در برابر توافقنامههای سطح خدمات (SLA)
Orchestrate, Analyze, and Evaluate ML Pipelines: Evaluating Pipeline Health Against SLAs
از اجرای خط لوله تا توافقنامههای SLA
From Pipeline Runs to SLAs
بهینهسازی توسعه ML: نسخهبندی، تکرارپذیری و ذخیرهسازی: نسخهبندی جریانهای کاری ML با اطمینان
Optimize ML Dev: Version, Reproduce, and Save: Version ML Workflows with Confidence
ویدئوی خوشآمدگویی و معرفی دوره
Welcome & Course Introduction Video
چگونه شاخهبندی در Git از توسعه ML پشتیبانی میکند
How Git Branching Supports ML Development
ایجاد شاخه ویژگی (Feature Branch) و مدیریت مصنوعات
Creating a Feature Branch and Managing Artifacts
بهینهسازی توسعه ML: نسخهبندی، تکرارپذیری و ذخیرهسازی: ساخت محیطهای تکرارپذیر برای ML
Optimize ML Dev: Version, Reproduce, and Save: Build Reproducible ML Environments
درک محیطهای مجازی برای توسعه یادگیری ماشین
Understanding Virtual Environments for ML Development
راهاندازی پروژه Poetry و تثبیت وابستگیها
Initializing a Poetry Project and Locking Dependencies
بهینهسازی توسعه ML: نسخهبندی، تکرارپذیری و ذخیرهسازی: بهینهسازی هزینههای محاسباتی در آزمایشهای ML
Optimize ML Dev: Version, Reproduce, and Save: Optimize Compute Costs in ML Experiments
درک هزینههای محاسباتی در توسعه ML
Understanding Compute Cost in ML Development
شناسایی گلوگاههای منابع و انتقال پردازشها به محاسبات ارزانتر
Spotting Resource Bottlenecks and Moving Jobs to Cheaper Compute
پروژه: ساخت یک خط لوله داده ML آماده برای محیط عملیاتی
Project: Build a Production-Ready ML Data Pipeline
نمایش نظرات