آموزش ETL در پایتون و SQL

ETL in Python and SQL

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
توضیحات دوره: داده ها به طور تصاعدی در حال افزایش هستند، زیرا جهان به تولید حجم عظیمی ادامه می دهد. در این دوره، یک مهندس داده با بیش از 5 سال تجربه، جنیفر ایبه، به شما نشان می دهد که چگونه سیستم هایی بسازید که داده ها را از منابع مختلف جمع آوری می کند، آنها را تبدیل و داده ها را ذخیره می کند تا بتوانید به طور موثر بینش هایی را از آن استخراج کنید. ما به این خواهیم پرداخت که ETL ها چیست و چگونه آنها را ایجاد می کنید. ما یاد خواهیم گرفت که چگونه از پایتون برای استخراج و تبدیل داده ها استفاده کنیم، ما داده های خود را با استفاده از پانداها و SQL کاوش خواهیم کرد. و در نهایت، داده ها را در سیستم هدف خود بارگذاری کنید. همچنین می توانید زمان بندی مشاغل ETL را با استفاده از پایتون تمرین کنید. هر فصل با چالش‌های مفید و کاربردی همراه است تا به شما کمک کند آنچه را که یاد می‌گیرید تمرین کنید.

سرفصل ها و درس ها

معرفی Introduction

  • یک ETL در پایتون و SQL ایجاد کنید Create an ETL in Python and SQL

  • ابزارهای مورد استفاده در این دوره Tools used in this course

1. ETL چیست؟ 1. What Are ETLs?

  • ETL چیست و چگونه آنها را ایجاد می کنید؟ What are ETLs and how do you create them?

  • کاوش داده های خود با پانداها (Python) و SQL Exploring your data with pandas (Python) and SQL

  • درک داده های شما Understanding your data

  • راه حل: خواندن داده ها با استفاده از پایتون Solution: Reading data using Python

  • مروری بر فرآیند ETL ETL process overview

  • چالش: خواندن داده ها با استفاده از پایتون Challenge: Reading data using Python

2. استخراج و تبدیل داده ها با پایتون 2. Extracting and Transforming Data with Python

  • استخراج داده های شما Extracting your data

  • چالش: داده ها را با استفاده از SQLAlchemy و پانداها بارگیری کنید Challenge: Load the data using SQLAlchemy and pandas

  • بارگیری داده ها از منابع مختلف Loading data from different sources

  • راه حل: داده ها را با استفاده از SQLAlchemy و پانداها بارگیری کنید Solution: Load the data using SQLAlchemy and pandas

  • تمیز کردن، پیش پردازش داده ها و قالب بندی داده ها Cleaning, preprocessing data, and data formatting

  • استانداردسازی، رسیدگی به موارد تکراری و مقادیر از دست رفته Standardization, handling duplicates, and missing values

3. بارگذاری داده ها در سیستم های هدف 3. Loading Data into Target Systems

  • مقدمه ای بر انبارهای داده و دریاچه های داده Introduction to data warehouses and data lakes

  • چالش: داده ها را تغییر دهید و موارد تکراری و پوچ را حذف کنید Challenge: Transform the data and remove duplicates and nulls

  • راه حل: داده ها را تبدیل کنید و موارد تکراری و تهی را حذف کنید Solution: Transform the data and remove duplicates and nulls

  • بررسی کیفیت داده ها و اعتبارسنجی با SQL Data quality checks and validation with SQL

  • بارگذاری داده ها در پایگاه داده های رابطه ای Loading data into relational databases

4. خودکارسازی مشاغل ETL: زمان بندی مشاغل ETL با پایتون 4. Automating ETL Jobs: Scheduling ETL Jobs with Python

  • برنامه ریزی مشاغل ETL با Airflow: قسمت 1 Scheduling ETL jobs with Airflow: Part 1

  • پرس و جو داده های خود را با SQL Querying your data with SQL

  • برنامه ریزی مشاغل ETL با Airflow: قسمت 2 Scheduling ETL jobs with Airflow: Part 2

  • راه حل: داده ها را در یک پایگاه داده بارگیری کرده و خودکار کنید Solution: Load the data into a database and automate

  • چالش: داده ها را در پایگاه داده بارگیری کرده و خودکار کنید Challenge: Load the data into a database and automate

نتیجه Conclusion

  • دانش خود را در مورد ETLs گسترش دهید Expand your knowledge of ETLs

نمایش نظرات

نظری ارسال نشده است.

آموزش ETL در پایتون و SQL
خرید اشتراک و دانلود خرید تکی و دانلود | 160,000 تومان (5 روز مهلت دانلود) زمان تقریبی آماده سازی لینک دانلود این دوره آموزشی حدود 5 تا 24 ساعت می باشد.
جزییات دوره
1h 20m
25
Linkedin (لینکدین) lynda-small
16 اسفند 1402 (آخرین آپدیت رو دریافت می‌کنید، حتی اگر این تاریخ بروز نباشد.)
17
- از 5
دارد
دارد
دارد
Jennifer Ebe

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Jennifer Ebe Jennifer Ebe

Jennifer Ebe با جمع‌آوری، سازمان‌دهی، برون‌یابی و ذخیره‌سازی داده‌ها، تصمیم‌گیری مبتنی بر داده‌ها را امکان‌پذیر می‌سازد تا برای رسیدن به نتایج موفقیت‌آمیز تجاری در دسترس باشد.

جنیفر با تخصص گسترده خود در ایجاد خطوط لوله داده، مدل‌سازی داده، انبار داده و سیستم‌های نظارت، در ارائه داده‌ها در دسترس، در دسترس و قابل اعتماد برای کمک به فرآیندهای تصمیم‌گیری مبتنی بر داده در کسب‌وکار برتر است. او با پشتکار برای اطمینان از یکپارچگی و کیفیت داده ها کار می کند و نتایج تاثیرگذاری را ارائه می دهد.

درک جنیفر از آمار، ریاضیات و تجزیه و تحلیل به او کمک می کند تا بینش ها، معیارها و فرصت های ارزشمند را از مجموعه داده های پیچیده شناسایی کند. او به دنبال راه‌های نوآورانه‌ای برای بهبود فرآیندها با بهینه‌سازی گردش‌های کاری، یافتن راه‌حل‌های خلاقانه برای چالش‌های داده‌ها و محرک رشد در سازمان است. جنیفر یک ارتباط قوی است.

Linkedin (لینکدین)

لینکدین: شبکه اجتماعی حرفه‌ای برای ارتباط و کارآفرینی

لینکدین به عنوان یکی از بزرگترین شبکه‌های اجتماعی حرفه‌ای، به میلیون‌ها افراد در سراسر جهان این امکان را می‌دهد تا ارتباط برقرار کنند، اطلاعات حرفه‌ای خود را به اشتراک بگذارند و فرصت‌های شغلی را کشف کنند. این شبکه اجتماعی به کاربران امکان می‌دهد تا رزومه حرفه‌ای خود را آپدیت کنند، با همکاران، دوستان و همکاران آینده ارتباط برقرار کنند، به انجمن‌ها و گروه‌های حرفه‌ای ملحق شوند و از مقالات و مطالب مرتبط با حوزه کاری خود بهره‌مند شوند.

لینکدین همچنین به کارفرمایان امکان می‌دهد تا به دنبال نیروهای با تجربه و مهارت مورد نیاز خود بگردند و ارتباط برقرار کنند. این شبکه حرفه‌ای به عنوان یک پلتفرم کلیدی برای بهبود دسترسی به فرصت‌های شغلی و گسترش شبکه حرفه‌ای خود، نقش مهمی را ایفا می‌کند. از این رو، لینکدین به عنوان یکی از مهمترین ابزارهای کارآفرینی و توسعه حرفه‌ای در دنیای امروز مورد توجه قرار دارد.