آموزش بوت‌کمپ جامع Databricks و PySpark: از صفر تا صد - آخرین آپدیت

دانلود Complete Databricks & PySpark Bootcamp: Zero to Hero

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: تسلط بر Databricks و PySpark برای مهندسی داده، SQL، Delta Lake و پروژه‌های واقعی ETL ساخت خط لوله‌های (Pipelines) مهندسی داده end-to-end در Databricks با استفاده از PySpark و SQL درک و پیاده‌سازی معماری مدالیون (لایه‌های برنزی، نقره‌ای و طلایی) برای داده‌های پاک و قابل اعتماد انجام پاک‌سازی، تبدیل و تجمیع داده‌ها با PySpark برای پروژه‌های واقعی ایجاد داشبوردها و شاخص‌های کلیدی عملکرد (KPIs) در Databricks SQL و بصری‌سازی تحلیل‌ها کسب تجربه عملی با مجموعه‌داده‌ها و پروژه‌های واقعی برای آمادگی در نقش‌های مهندسی داده ورود و تبدیل داده‌ها با استفاده از Auto Loader و Delta Live Tables (DLT) پیش‌نیازها: هیچ تجربه قبلی در Databricks لازم نیست — ما از مفاهیم پایه شروع می‌کنیم داشتن درک اولیه از SQL کمک‌کننده خواهد بود (SELECT, JOIN, GROUP BY) اشتیاق به یادگیری مهندسی داده

به بوت‌کمپ جامع Databricks و PySpark: از صفر تا صد خوش آمدید

آیا می‌خواهید به یک مهندس داده آماده برای بازار کار تبدیل شوید و بر یکی از پرتقاضاترین پلتفرم‌های صنعت تسلط یابید؟
این دوره شما را از سطح مبتدی به پیشرفته در Databricks، PySpark و Delta Lake از طریق ساخت پروژه‌های واقعی مهندسی داده به صورت گام‌به‌گام می‌رساند.

چه در Databricks تازه‌کار باشید و چه تجربه داشته باشید، این بوت‌کمپ به شما مهارت‌های عملی برای طراحی، ساخت و بهینه‌سازی خط لوله‌های ETL در فضای ابری را می‌دهد.

آنچه در این دوره خواهید آموخت:

  • تسلط بر Databricks و معماری مدالیون (لایه‌های Bronze، Silver و Gold)

  • ساخت خط لوله‌های ETL end-to-end با استفاده از PySpark و SQL

  • کار با Delta Lake برای تراکنش‌های ACID، تکامل شمای داده (Schema Evolution) و سفر در زمان (Time Travel)

  • ورود و پردازش داده‌ها با استفاده از Auto Loader و Delta Live Tables (DLT)

  • پاک‌سازی داده‌های نامنظم با تبدیلات PySpark و اعمال قوانین کیفیت داده

  • تجمیع، تبدیل و بارگذاری داده‌ها در جداول طلایی (Gold) برای تحلیل و داشبوردها

  • بصری‌سازی KPIهای تجاری در داشبوردهای Databricks SQL

  • کسب تجربه عملی با پروژه‌های واقعی (خرده‌فروشی، بانکی، IoT، منابع انسانی، تجارت الکترونیک، بیمه و غیره)

پروژه‌هایی که خواهید ساخت:

  • تحلیل فروش خرده‌فروشی $\rightarrow$ ساخت خط لوله ETL و KPIها (درآمد، AOV، نرخ مرجوعی)

  • و بسیاری دیگر از پروژه‌های صنعتی واقعی...

این دوره برای چه کسانی است؟

  • aspiring مهندسان داده که قصد شروع مسیر شغلی با Databricks و PySpark را دارند

  • توسعه‌دهندگان SQL / تحلیلگران که در حال انتقال به حوزه Big Data و مهندسی داده ابری هستند

  • توسعه‌دهندگان پایتون که می‌خواهند مهارت‌های خود را در خط لوله‌های ETL و Spark گسترش دهند

  • مهندسان ابری (AWS, Azure, GCP) که می‌خواهند Databricks را در جریان کاری خود ادغام کنند

  • دانشجویان و مبتدیان مهندسی داده که به دنبال پروژه‌های آماده برای رزومه هستند

چرا این دوره را انتخاب کنید؟

  • یادگیری از طریق انجام پروژه‌های واقعی — نه فقط تئوری

  • پوشش خط لوله‌های Batch و Streaming برای مهندسی داده مدرن

  • شامل بهترین روش‌ها (Best Practices) و بهینه‌سازی‌هایی که در شرکت‌های برتر استفاده می‌شود

  • استفاده از نسخه رایگان Databricks Community Edition — بدون نیاز به هزینه برای محیط ابری

  • آماده‌سازی شما برای مصاحبه‌های شغلی و گواهینامه‌های مهندسی داده


سرفصل ها و درس ها

مقدمه Introduction

  • مقدمه Introduction

  • معرفی دوره Course Introduction

  • منابع Resources

آشنایی با دیتابریکس DATABRICKS INTRODUCTION

  • دیتابریکس چیست WHAT IS DATABRICKS

  • مزایای دیتابریکس DATABRICKS ADVANTAGES

  • ساخت حساب رایگان دیتابریکس CREATE DATABRICKS FREE EDITION

  • نمای کلی دیتابریکس DATABRICKS OVERVIEW

  • لیک‌هوس دیتابریکس DATABRICKS LAKEHOUSE

کاتالوگ یونیتی UNITY CATALOG

  • کاتالوگ یونیتی در دیتابریکس چیست WHAT IS UNITY CATALOG IN DATABRICKS

  • ساخت کاتالوگ یونیتی در دیتابریکس CREATE UNITY CATALOG IN DATABRICKS

  • ساخت جداول مدیریت شده و خارجی CREATE TABLES - MANAGED & EXTERNAL TABLES

  • ولوم‌ها در دیتابریکس VOLUMES IN DATABRICKS

  • ساخت ولوم‌ها و آپلود فایل‌ها CREATE VOLUMES - UPLOAD FILES IN VOLUMES

مبانی اسپارک SPARK BASICS

  • آشنایی با اسپارک INTRODUCTION TO SPARK

  • معماری اسپارک SPARK ARCHITECTURE

  • RDD چیست WHAT IS RDD

  • مفاهیم DAG و ارزیابی تنبل (Lazy Evaluation) DAG & LAZY EVALUATION

آموزش جامع پای‌اسپارک COMPLETE PYSPARK

  • راه‌اندازی عملی پای‌اسپارک PYSPARK PRACTICAL SETUP

  • دیتا فریم در پای‌اسپارک DATAFRAME - PYSPARK

  • ساخت دیتا فریم با JSON و Parquet CREATE DATAFRAME USING JSON & PARQUET - PYSPARK

  • تبدیلات Select در پای‌اسپارک SELECT TRANSFORMATION - PYSPARK

  • کار با withColumn و withColumnRenamed withColumn & withColumnRenamed - PYSPARK

  • فیلتر کردن در پای‌اسپارک FILTER IN PYSPARK

  • مقایسه distinct و dropDuplicates distinct vs dropDuplicates - PYSPARK

  • مرتب‌سازی Sort و OrderBy SORT & ORDERBY - PYSPARK

  • گروه‌بندی Group By در پای‌اسپارک GROUP BY - PYSPARK

  • اتصال جداول Join در پای‌اسپارک JOIN - PYSPARK

  • اتحاد جداول Union در پای‌اسپارک UNION - PYSPARK

  • مدیریت مقادیر Null HANDLE NULL - PYSPARK

  • متد Collect در پای‌اسپارک COLLECT - PYSPARK

  • کار با StructType و StructField STRUCTTYPE & STRUCTFIELD - PYSPARK

  • تبدیلات Pivot و Unpivot PIVOT & UNPIVOT - PYSPARK

  • توابع کاربر تعریف شده (UDF) UDF - PYSPARK

  • نمای موقت (Temp View) TEMP VIEW - PYSPARK

  • توابع پنجره‌ای (Window Functions) WINDOWS FUNCTION - PYSPARK

  • مقایسه partitionBy و Repartition partitionBy ,& Repartition - PYSPARK

  • فرمت تاریخ در پای‌اسپارک DATE FORMAT - PYSPARK

  • توابع مختلف مربوط به تاریخ DIFFERENT DATE FUNCTIONS

  • متد Explode در پای‌اسپارک EXPLODE - PYSPARK

اشیای خارجی در Lakehouse دیتابریکس DATABRICKS LAKEHOUSE FOREIGN - OBJECTS

  • فایل‌های دیتابریکس DATABRICKS FILES

  • فدراسیون Lakehouse دیتابریکس DATABRICKS LAKEHOUSE FEDERATION

  • کاتالوگ‌های خارجی و جداول خارجی FOREIGN CATALOG AND FOREIGN TABLES

دیتابریکس SQL DATABRICKS SQL

  • دیتابریکس SQL چیست WHAT IS DATABRICKS SQL

  • نمای کلی دیتابریکس SQL DATABRICKS SQL OVERVIEW

  • پارامترهای دیتابریکس SQL DATABRICKS SQL PARAMETERS

  • قطعه کدهای (Snippets) دیتابریکس SQL DATABRICKS SQL SNIPPETS

  • مرور دیتابریکس SQL: Join, CTE, Row_Number DATABRICKS SQL REVISION- JOIN , CTE , ROW_NUMBER

  • زمان‌بندی کوئری‌ها SCHEDULING - QUERY

  • مانیتورینگ کوئری‌ها MONITORING - QUERY

  • کش کردن در دیتابریکس CACHE - DATABRICKS

  • هشدارها در دیتابریکس ALERTS- DATABRICKS

  • داشبوردها و بصری‌سازی در دیتابریکس DATABRICKS - DASHBOARD & Visualization

  • معرفی Genie دیتابریکس GENIE - DATABRICKS

جایگاه‌های ETL در Lakehouse دیتابریکس DATABRICKS - LAKEHOUSE JOBS - ETL

  • جایگاه‌های Lakehouse دیتابریکس DATABRICKS - LAKEHOUSE JOBS

  • پیاده‌سازی عملی Lakehouse Jobs DATABRICKS - LAKEHOUSE JOBS - PRACTICAL

  • پیاده‌سازی عملی شرط If Else در Job IF ELSE JOB PRACTICAL - DATABRICKS

  • پیاده‌سازی عملی شرط For Each در Job FOR EACH CONDITION BASED JOB PRACTICAL - DATABRICKS

  • تریگرهای زمان‌بندی شده SCHEDULED TRIGGER

  • محاسبات (Compute) در Jobهای دیتابریکس COMPUTE JOBS - DATABRICKS

  • اعلان‌های Jobها در دیتابریکس NOTIFICATION JOBS - DATABRICKS

  • مانیتورینگ Jobها در دیتابریکس MONITORING JOBS - DATABRICKS

اتولودر و استریمینگ ساختاریافته اسپارک Auto Loader - Spark Structure Streaming

  • استریمینگ اسپارک چیست What is Spark Streaming

  • چالش‌های استریمینگ و معرفی Auto Loader Spark Streaming Challenges & Auto Loader Intro

  • معماری Auto Loader AUTO LOADER - ARCHITECTURE

  • معرفی عملی Auto Loader AUTO LOADER - PRACTICAL INTRO

  • راه‌اندازی عملی Auto Loader AUTO LOADER - PRACTICAL SETUP

  • نوشتن اسکریپت عملی Auto Loader AUTO LOADER - PRACTICAL SCRIPT

  • بارگذاری افزایشی (Incremental Load) AUTO LOADER - INCREMENTAL LOAD

  • مدیریت شمای داده در Auto Loader AUTO LOADER - SCHEMA HANDLE

  • معرفی دستور Copy Into COPY INTO - INTRODUCTION

  • پیاده‌سازی عملی Copy Into COPY INTO - PRACTICAL

جداول زنده دلتا (DLT) DLT - DELTA LIVE TABLES

  • معرفی جداول زنده دلتا (DLT) WHAT IS DLT ( DELTA LIVE TABLES)

  • DLT چه مشکلی را حل می‌کند WHAT PROBLEM DLT IS SOLVING

  • مزایای DLT DLT - ADVANTAGES

  • موردهای کاربردی DLT DLT USE CASE

  • نمای کلی عملی DLT DLT - PRACTICAL OVERVIEW

  • مجموعه‌داده‌های DLT (جداول استریم، ویو، ویوهای متریالایز شده) DLT DATASET - ( STREAMING TABLE , VIEW , MATERIALIZED VIEW)

  • پیاده‌سازی عملی Streaming Table در DLT DLT PRACTICAL - STREAMING TABLE

  • پیاده‌سازی عملی Materialized View در DLT DLT PRACTICAL - MATERIALIZED VIEW

  • پیاده‌سازی عملی View در DLT DLT PRACTICAL - VIEW

  • پیاده‌سازی عملی DLT با پایتون DLT PRACTICAL - PYTHON

اسپارک SQL در دیتابریکس SPARK SQL - DATABRICKS

  • مبانی اسپارک SQL SPARK SQL BASIC

  • مبانی اسپارک SQL ۲ (Limit, Like, Distinct) SPARK SQL BASIC -2 ( LIMIT , LIKE ,DISTINCT)

  • اتصال و اتحاد در اسپارک SQL SPARK SQL - JOINING & UNION

  • توابع پیشرفته پنجره‌ای در اسپارک SQL SPARK SQL - ADVANCE - WINDOWS FUNCTION

  • توابع پیشرفته Lead و Lag در اسپارک SQL SPARK SQL ADVANCE - LEAD & LAG

سوالات و پاسخ‌های مصاحبه پای‌اسپارک PYSPARK INTERVIEW QUESTION AND ANSWER

  • مقایسه Cache در مقابل Persist CACHE VS PERSISTS

  • سوالات کدنویسی رکورد‌های تکراری در پای‌اسپارک DUPLICATE RECORD QUESTIONS - PYSPARK CODING

  • سوالات کدنویسی مشتری و سفارش در پای‌اسپارک CUSTOMER - ORDER QUESTIONS - PYSPARK CODING

  • سوالات کدنویسی کارمند و دپارتمان در پای‌اسپارک EMPLOYEE - DEPARTMENT QUESTIONS - PYSPARK CODING

  • کدنویسی بر اساس سناریو در پای‌اسپارک PYSPARK SCENARIO BASED CODING

  • سوال کدنویسی پارس کردن JSON JSON PARSE - CODING QUESTION

  • کدنویسی فروش تجمعی در پای‌اسپارک CUMMLATIVE SALES PYSPARK CODING

  • سوال کدنویسی مصاحبه: عدد گمشده MISSING NUMBER - INTERVIEW CODING

  • کدنویسی بر اساس سناریو ۲ در پای‌اسپارک SCENARION BASED - PYSPARK CODING -2

  • مصاحبه جامع پای‌اسپارک PYSPARK INTERVIEW

راه‌اندازی CI/CD دیتابریکس با گیت‌هاب Databricks CI/CD Setup with GitHub

  • تئوری راه‌اندازی CI/CD دیتابریکس با گیت‌هاب Databricks CI/CD Setup with GitHub - Theory

  • پیاده‌سازی عملی ادغام دیتابریکس و گیت‌هاب Databricks integration with GitHub - Practical

  • ساخت شاخه‌ها و مراحل انتقال به محیط Production Databricks Branches Creation and Steps to follow in Production

  • اجرای Job محیط Production متصل به گیت‌هاب Run production Job in Databricks pointing Github

پروژه تحلیل فروش خرده‌فروشی و معماری مدالیون PROJECT RETAIL SALES ANALYTICS PROJECT - MEDALLION ARCHITECTURE

  • معرفی پروژه و مورد کاربردی PROJECT INTRODUCTION & USE CASE

  • راه‌اندازی پروژه و لایه برنزی (Bronze) PROJECT SETUP & BRONZE LAYER

  • لایه نقره‌ای (Silver) با پای‌اسپارک SILVER LAYER - PYSPARK

  • ساخت لایه طلایی (Gold) و داشبورد GOLD LAYER CREATION AND DASHBOARD

آموزش جامع پایتون COMPLETE PYTHON

  • مقدمه لیست آموزشی پایتون Introduction to Python Playlist

  • پایتون چیست و ویژگی‌های آن What Is Python And Feature

  • انواع داده‌ها و متغیرها در پایتون Python Data Type And Variables

  • تابع ورودی input() Python Input() Function

  • عملگرها در پایتون Python Operators

  • دستورات شرطی if Else Python if Else Statements

  • حلقه For در پایتون Python For Loop

  • حلقه While در پایتون While Loop in Python

  • لیست‌ها در پایتون List in Python

  • متدهای لیست در پایتون List Method in Python

  • مسئله کدنویسی لیست ۱ (کمترین و بیشترین) List Coding Problem -1 (lowest & highest)

  • مسئله کدنویسی لیست ۲ (جابجایی دو المان) List Coding Problem -2 (swap two element in list)

  • مسئله کدنویسی لیست ۳ (معکوس کردن لیست) List Coding Problem -3 (reverse list)

  • مسئله کدنویسی لیست ۴ (مجموع و میانگین) List Coding Problem -4 (sum and average of given list)

  • مسئله کدنویسی لیست ۵ (اعداد زوج و فرد) List Coding Problem -5 ( even and odd from list)

  • مسئله کدنویسی لیست ۶ (حذف تکراری‌ها) List Coding Problem -6 ( remove duplicate from list)

  • لیست کامپرهنشن (List Comprehension) List Comprehension

  • تاپل‌ها (Tuples) در پایتون Tuples in Python

  • مجموعه‌ها (Sets) در پایتون Sets in Python

  • دیکشنری‌ها در پایتون Dictionary in Python

  • رشته‌ها (Strings) در پایتون String in Python

  • سوالات کدنویسی رشته‌ها String Coding Questions in Python

  • توابع در پایتون Functions in Python

  • کار با Args و Kwargs Args and Kwargs in Python

  • توابع لامبدا (Lambda) Lambda in Python

  • توابع Map, Filter و Reduce Map, Filter and Reduce in Python

  • برنامه‌نویسی شیءگرا (OOPS) در پایتون OOPS in Python

  • سازنده (Constructor) و متدها در پایتون Constructor and Method in Python

  • وراثت (Inheritance) در پایتون Inhertitence in Python

  • کپسوله‌سازی (Encapsulation) در پایتون Encapslation in Python

  • مقایسه Iterable و Iterator Iterable vs Iterator

  • ماژول‌ها در پایتون Module in Python

  • ماژول OS در پایتون OS Module in Python

  • کار با Date و Datetime Date And Datetime in Python

  • مدیریت خطا با Try Except Try -Except in Python

نمایش نظرات

آموزش بوت‌کمپ جامع Databricks و PySpark: از صفر تا صد
جزییات دوره
17 hours
139
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
5,179
4.4 از 5
دارد
دارد
دارد
manish tiwari
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

manish tiwari manish tiwari

مهندس داده