آموزش ETL در پایتون و SQL

ETL in Python and SQL

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: داده ها به طور تصاعدی در حال افزایش هستند، زیرا جهان به تولید حجم عظیمی ادامه می دهد. در این دوره، یک مهندس داده با بیش از 5 سال تجربه، جنیفر ایبه، به شما نشان می دهد که چگونه سیستم هایی بسازید که داده ها را از منابع مختلف جمع آوری می کند، آنها را تبدیل و داده ها را ذخیره می کند تا بتوانید به طور موثر بینش هایی را از آن استخراج کنید. ما به این خواهیم پرداخت که ETL ها چیست و چگونه آنها را ایجاد می کنید. ما یاد خواهیم گرفت که چگونه از پایتون برای استخراج و تبدیل داده ها استفاده کنیم، ما داده های خود را با استفاده از پانداها و SQL کاوش خواهیم کرد. و در نهایت، داده ها را در سیستم هدف خود بارگذاری کنید. همچنین می توانید زمان بندی مشاغل ETL را با استفاده از پایتون تمرین کنید. هر فصل با چالش‌های مفید و کاربردی همراه است تا به شما کمک کند آنچه را که یاد می‌گیرید تمرین کنید.

سرفصل ها و درس ها

معرفی Introduction

  • یک ETL در پایتون و SQL ایجاد کنید Create an ETL in Python and SQL

  • ابزارهای مورد استفاده در این دوره Tools used in this course

1. ETL چیست؟ 1. What Are ETLs?

  • ETL چیست و چگونه آنها را ایجاد می کنید؟ What are ETLs and how do you create them?

  • کاوش داده های خود با پانداها (Python) و SQL Exploring your data with pandas (Python) and SQL

  • درک داده های شما Understanding your data

  • راه حل: خواندن داده ها با استفاده از پایتون Solution: Reading data using Python

  • مروری بر فرآیند ETL ETL process overview

  • چالش: خواندن داده ها با استفاده از پایتون Challenge: Reading data using Python

2. استخراج و تبدیل داده ها با پایتون 2. Extracting and Transforming Data with Python

  • استخراج داده های شما Extracting your data

  • چالش: داده ها را با استفاده از SQLAlchemy و پانداها بارگیری کنید Challenge: Load the data using SQLAlchemy and pandas

  • بارگیری داده ها از منابع مختلف Loading data from different sources

  • راه حل: داده ها را با استفاده از SQLAlchemy و پانداها بارگیری کنید Solution: Load the data using SQLAlchemy and pandas

  • تمیز کردن، پیش پردازش داده ها و قالب بندی داده ها Cleaning, preprocessing data, and data formatting

  • استانداردسازی، رسیدگی به موارد تکراری و مقادیر از دست رفته Standardization, handling duplicates, and missing values

3. بارگذاری داده ها در سیستم های هدف 3. Loading Data into Target Systems

  • مقدمه ای بر انبارهای داده و دریاچه های داده Introduction to data warehouses and data lakes

  • چالش: داده ها را تغییر دهید و موارد تکراری و پوچ را حذف کنید Challenge: Transform the data and remove duplicates and nulls

  • راه حل: داده ها را تبدیل کنید و موارد تکراری و تهی را حذف کنید Solution: Transform the data and remove duplicates and nulls

  • بررسی کیفیت داده ها و اعتبارسنجی با SQL Data quality checks and validation with SQL

  • بارگذاری داده ها در پایگاه داده های رابطه ای Loading data into relational databases

4. خودکارسازی مشاغل ETL: زمان بندی مشاغل ETL با پایتون 4. Automating ETL Jobs: Scheduling ETL Jobs with Python

  • برنامه ریزی مشاغل ETL با Airflow: قسمت 1 Scheduling ETL jobs with Airflow: Part 1

  • پرس و جو داده های خود را با SQL Querying your data with SQL

  • برنامه ریزی مشاغل ETL با Airflow: قسمت 2 Scheduling ETL jobs with Airflow: Part 2

  • راه حل: داده ها را در یک پایگاه داده بارگیری کرده و خودکار کنید Solution: Load the data into a database and automate

  • چالش: داده ها را در پایگاه داده بارگیری کرده و خودکار کنید Challenge: Load the data into a database and automate

نتیجه Conclusion

  • دانش خود را در مورد ETLs گسترش دهید Expand your knowledge of ETLs

نمایش نظرات

آموزش ETL در پایتون و SQL
جزییات دوره
1h 20m
25
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
17
- از 5
دارد
دارد
دارد
Jennifer Ebe
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Jennifer Ebe Jennifer Ebe

Jennifer Ebe با جمع‌آوری، سازمان‌دهی، برون‌یابی و ذخیره‌سازی داده‌ها، تصمیم‌گیری مبتنی بر داده‌ها را امکان‌پذیر می‌سازد تا برای رسیدن به نتایج موفقیت‌آمیز تجاری در دسترس باشد.

جنیفر با تخصص گسترده خود در ایجاد خطوط لوله داده، مدل‌سازی داده، انبار داده و سیستم‌های نظارت، در ارائه داده‌ها در دسترس، در دسترس و قابل اعتماد برای کمک به فرآیندهای تصمیم‌گیری مبتنی بر داده در کسب‌وکار برتر است. او با پشتکار برای اطمینان از یکپارچگی و کیفیت داده ها کار می کند و نتایج تاثیرگذاری را ارائه می دهد.

درک جنیفر از آمار، ریاضیات و تجزیه و تحلیل به او کمک می کند تا بینش ها، معیارها و فرصت های ارزشمند را از مجموعه داده های پیچیده شناسایی کند. او به دنبال راه‌های نوآورانه‌ای برای بهبود فرآیندها با بهینه‌سازی گردش‌های کاری، یافتن راه‌حل‌های خلاقانه برای چالش‌های داده‌ها و محرک رشد در سازمان است. جنیفر یک ارتباط قوی است.