آموزش ساخت و پیاده‌سازی خط لوله‌های ETL با پایتون - آخرین آپدیت

دانلود Build and Deploy ETL Pipelines with Python

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: مدیریت جریان‌های کاری داده می‌تواند زمان‌بر و پیچیده باشد، به‌ویژه زمانی که نیاز به یکپارچه‌سازی منابع داده متعدد و اتوماسیون وظایف دارید. در دوره «ساخت و پیاده‌سازی خط لوله‌های ETL با پایتون»، یاد می‌گیرید که چگونه جریان‌های کاری داده خودکار را به صورت بهینه ایجاد کنید. در ابتدا، نحوه استخراج داده‌ها از طریق اتصال به پایگاه‌های داده و فایل‌های خام با استفاده از پایتون را بررسی خواهید کرد و داده‌ها را از طریق روش‌های مختلف، از جمله کوئری‌های SQL و کانکتورهای دیتابیس بازیابی می‌کنید. سپس، نحوه استخراج داده‌ها از REST APIها و تجزیه پاسخ‌ها را خواهید آموخت تا بتوانید داده‌ها را از سرویس‌های وب به خط لوله خود منتقل کنید. در نهایت، روش‌های اتوماسیون و زمان‌بندی وظایف ETL را یاد می‌گیرید تا در زمان صرفه‌جویی کرده و مداخلات دستی را کاهش دهید. در پایان این دوره، شما مهارت‌ها و دانش لازم برای طراحی و اتوماسیون خط لوله‌های جامع ETL را خواهید داشت که به دیتابیس‌ها متصل شده، با REST APIها یکپارچه می‌شوند و طبق برنامه زمان‌بندی اجرا می‌گردند، همگی با استفاده از زبان پایتون.

سرفصل ها و درس ها

استخراج داده‌ها Extracting Data

  • معرفی دوره Course Introduction

  • پانداس و اس‌کی‌ول آلکیمی Pandas and SQL Alchemy

  • بارگذاری داده‌ها از فایل‌ها و APIها با پانداس Loading Data from Files and APIs with Pandas

  • اتصال به پایگاه‌های داده با SQLAlchemy Connecting to Databases with SQLAlchemy

تبدیل داده‌ها Transforming Data

  • موارد رایج استفاده از تبدیل‌ها در پانداس Common Pandas Transformation Use Cases

  • مدیریت مقادیر پوچ (Null) در پانداس Handling Null Values in Pandas

  • دمو: پاک‌سازی و آماده‌سازی داده‌ها با پانداس Demo: Cleaning and Preparing Data with Pandas

  • دمو: کار با کلان‌داده‌ها (Big Data) با Dask Demo: Big Data with Dask

بارگذاری داده‌ها Loading Data

  • درک بارگذاری داده‌ها با پانداس Understand Data Loading with Pandas

  • نوشتن داده‌ها در فضای ذخیره‌سازی ابری Writing Data to Your Cloud Storage

  • فرمت‌های فایل با کارایی بالا High-performance File Formats

زمان‌بندی خط لوله و بهترین روش‌ها Pipeline Scheduling and Best Practices

  • زمان‌بندی خط لوله‌های پایتون Scheduling Your Python Pipelines

  • ماژولار کردن کدها Modularize Your Code

  • زمان‌بندی خط لوله ETL پایتون Schedule Your Python ETL Pipeline

  • بهترین روش‌های ETL: متغیرهای محیطی، لاگ‌گیری و اعتبارسنجی ETL Pipe Best Practices: Environment Variables, Logging, and Validating

نمایش نظرات

آموزش ساخت و پیاده‌سازی خط لوله‌های ETL با پایتون
جزییات دوره
1h 8m
15
(آخرین آپدیت)
12
4 از 5
دارد
دارد
دارد
Ian Fogelman
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Ian Fogelman Ian Fogelman

ایان یکی از علاقه مندان به پایگاه داده با تخصص خاصی در پشته داده مایکروسافت است. فن آوری های دیگری که ایان دارای تجربه سطح کارشناسی است شامل ETL، توسعه Python، معماری ابری و اتوماسیون سیستم ها است. ایان دارای گواهینامه Microsoft Certified Solutions Expert (MCSE) برای مدیریت داده ها و تجزیه و تحلیل و همچنین گواهینامه های AWS Solution Architect است. ایان همچنین برای چندین وبلاگ فنی از جمله SuperFunSQL.com که در سال 2019 تأسیس کرد، می نویسد.