راهنمای کامل پایتون برای مهندسی داده: از مبتدی تا پیشرفته

Complete Guide to Python for Data Engineering: From Beginner to Advanced

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: قبل از پیشرفت به موضوعات پیشرفته تر مخصوص مهندسی داده، با اصول اولیه پایتون آشنا شوید و اجرا کنید. در این دوره عملی و تعاملی، به مربی دیپاک گویال بپیوندید تا انجام طیف گسترده ای از وظایف مهندسی داده در پایتون را تمرین کنید تا دانش فنی خود را تقویت کنید، برای مصاحبه آماده شوید یا نقش جدیدی را به دست آورید. این دوره شامل چالش های کد است که توسط CoderPad طراحی شده است. چالش‌های کد، تمرین‌های کدنویسی تعاملی با بازخورد بلادرنگ هستند، بنابراین می‌توانید برای پیشبرد مهارت‌های کدنویسی خود تمرین کدنویسی را انجام دهید. دیپک به شما کمک می کند تا مهارت های خود را به عنوان یک برنامه نویس پایتون با شش چالش برنامه نویسی خاص تقویت کنید. اصول زبان، مجموعه‌های پایتون، مدیریت فایل، پانداها، NumPy، OOP و ابزارهای پیشرفته مهندسی داده‌ای که از پایتون استفاده می‌کنند را کاوش کنید. این دوره با یک پروژه اصلی متمرکز بر تجزیه و تحلیل خرده فروشی به پایان می رسد.

سرفصل ها و درس ها

مقدمه Introduction

  • آنچه شما باید بدانید What you should know

  • به دوره خوش آمدید Welcome to the course

  • تور کودرپد CoderPad tour

1. مبانی پایتون 1. Python Basics

  • توابع Functions

  • دستکاری رشته String manipulation

  • رسیدگی به خطا Error handling

  • مقدمه ای بر پایتون و مهندسی داده Introduction to Python and data engineering

  • راه حل: شرایط Solution: Conditions

  • عملگرها و عبارات Operators and expressions

  • ساختارهای کنترلی Control structures

  • متغیرها و انواع داده ها Variables and data types

  • ماژول ها و بسته ها Modules and packages

  • راه اندازی محیط پایتون Setting up your Python environment

  • کاربرگ Google Colab را کاوش کنید Explore the Google Colab worksheet

2. مجموعه های پایتون 2. Python Collections

  • مجموعه های پایتون: دیکشنری ها Python collections: Dictionaries

  • راه حل: مجموعه ها Solution: Collections

  • مجموعه های پایتون: لیست ها Python collections: Lists

  • مجموعه های پایتون: تاپل ها Python collections: Tuples

  • نمای کلی مجموعه Collection overview

  • مجموعه های پایتون: مجموعه ها Python collections: Sets

3. مدیریت فایل پایتون 3. Python File Handling

  • نمای کلی فایل ورودی/خروجی File I/O overview

  • کار با فایل های JSON Working with JSON files

  • راه حل: مدیریت فایل Solution: File handling

  • کار با فایل های CSV Working with CSV files

4. Pandas DataFrame API 4. pandas DataFrame API

  • تجسم داده ها Data visualization

  • راه حل: پانداها Solution: pandas

  • پاکسازی و پیش پردازش داده ها Data cleaning and preprocessing

  • دستکاری و تجمیع داده ها Data manipulation and aggregation

  • خواندن فایل ها به صورت DataFrame Read files as DataFrames

  • یک DataFrame در یک فایل بنویسید Write a DataFrame to a file

  • آشنایی با پانداها Introduction to pandas

5. NumPy 5. NumPy

  • جبر خطی و آمار Linear algebra and statistics

  • ایجاد آرایه و ویژگی ها Array creation and attributes

  • یک آرایه NumPy در یک فایل بنویسید Write a NumPy array to a file

  • نمایه سازی و برش Indexing and slicing

  • مقدمه ای بر NumPy Introduction to NumPy

  • عملیات آرایه Array operations

  • راه حل: NumPy Solution: NumPy

6. OOP با پایتون 6. OOP with Python

  • راه حل: OOP Solution: OOP

  • پیاده سازی: کلاس ها و اشیاء در پایتون Implementation: Classes and objects in Python

  • درک کلاس ها و اشیا Understanding classes and objects

  • ویژگی های OOP را درک کنید: انتزاع، وراثت و موارد دیگر Understand OOP features: Abstraction, inheritance, and more

7. مهندسی داده های پیشرفته 7. Advanced Data Engineering

  • نکاتی برای نوشتن کد پایتون کارآمد Tips to write efficient Python code

  • در محل در مقابل مهندسی داده ابری On-premises vs. cloud data engineering

  • هادوپ چیست؟ What is Hadoop

  • ETL در دنیای مهندسی داده چیست؟ What is ETL in the data engineering world?

  • اهمیت ابزارهای تجسم در مهندسی داده Importance of visualization tools in data engineering

  • PySpark برای مهندسی داده را بدانید Understand PySpark for data engineering

8. Web Scraping با پایتون 8. Web Scraping with Python

  • والدین، فرزندان و فرزندان HTML HTML parents, children, and descendants

  • اصول اولیه سوپ زیبا BeautifulSoup basics

  • نصب BeautifulSoup Installing BeautifulSoup

  • خراش وب را درک کنید Understand web scraping

  • مبانی HTML HTML basics

  • HTML را از یک صفحه وب دریافت کنید Get HTML from a web page

  • صفحه وب را خراش دهید Scrape the web page

  • داده ها را به عنوان یک فایل TXT صادر کنید Export data as a TXT file

9. توابع داخلی پیشرفته 9. Advanced Built-in Functions

  • ژنراتورها در پایتون Generators in Python

  • تکرارپذیرها در پایتون Iterables in Python

  • کلاس های مولد پایتون و تکرار کننده ها Python generator classes and iterators

  • توابع any() و all() در پایتون any() and all() functions in Python

  • توابع filter() و map(). filter() and map() functions

10. ورود به پایتون 10. Logging in Python

  • ورود به سیستم چیست؟ What is logging?

  • ثبت سفارشی Custom logging

  • ثبت بهترین شیوه ها Logging best practices

11. پروژه Capstone 11. Capstone Project

  • پروژه Capstone: تجزیه و تحلیل خرده فروشی Capstone Project: Retail sales analysis

  • راه حل: پروژه Capstone Solution: Capstone project

نتیجه گیری Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

راهنمای کامل پایتون برای مهندسی داده: از مبتدی تا پیشرفته
جزییات دوره
5h 26m
67
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
1,391
- از 5
دارد
دارد
دارد
Deepak Goyal
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Deepak Goyal Deepak Goyal

Azure Cloud Solution Architect

Deepak Goyal یک معمار راه حل ابری Azure است.

Deepak بیش از سیزده سال تجربه فناوری اطلاعات و بیش از ده سال تجربه در زمینه های بزرگ دارد. دنیای داده دیپک به شرکت‌ها کمک می‌کند تا کسب‌وکار خود را با معماری مبتنی بر داده و پلت‌فرم‌های داده‌ای که از ابر مدیریت می‌شوند، توسعه دهند. دیپک عاشق نوشتن در مورد فناوری‌های Azure مانند Data Factory، DataBricks و Snowflake Data Ware است. می‌توانید در وبلاگ فنی با رتبه‌ی بالای او، جایی که او توصیه‌ها و بینش‌هایی را برای کمک به پیشرفت دیگران در این زمینه ارائه می‌دهد، و همچنین در YouTube و LinkedIn، جایی که او ویدیوهای آموزشی در Hadoop، pySpark، Azure و موارد دیگر تولید می‌کند، بیابید.