آموزش مهندسی داده برای مبتدیان با استفاده از Google Cloud و Python

Data Engineering for Beginner using Google Cloud & Python

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: مهندسی داده پایه: پایتون، پانداها، پلتفرم ابری گوگل (GCP) bigquery، جرقه در dataproc، gcs، انبار داده مهندسی پایه داده، مهندسی داده چیست، چرا لازم است، نحوه انجام آن از مدل پایگاه داده رابطه ای صفر، مدل سازی پایگاه داده برای عادی سازی طراحی و عملی با استفاده از postgresql & python/pandas مدل پایگاه داده NoSQL، طراحی غیرعادی و عملی با استفاده از elasticsearch & python/pandas مقدمه ای بر spark & ​​spark cluster با استفاده از پلتفرم ابری گوگل پیش نیازها: درک عبارات اولیه sql (انتخاب، درج، به روز رسانی ، حذف کافی است) درک پایه پایتون/پانداها این دوره از پلتفرم ابری گوگل استفاده می کند. اگر می‌خواهید عملی انجام دهید، باید جزئیات کارت اعتباری را برای پرداخت در Google cloud ارائه دهید. اگر این کار را نکنید، همچنان می توانید ویدیوی دوره را تماشا کنید

"داده ها روغن جدید هستند".


شاید قبلاً این نقل قول را شنیده باشید. داده ها در عصر دیجیتال به اندازه نفت در دوران صنعتی ارزشمند هستند. با این حال، درست مانند نفت، داده های خام به خودی خود قابل استفاده نیستند. در عوض، ارزش زمانی ایجاد می‌شود که به طور کامل و دقیق جمع‌آوری شود، به سایر داده‌های مرتبط متصل شود و این کار به موقع انجام شود.

مهندسین داده خطوط لوله ای را طراحی و می سازند که داده ها را به یک قالب قابل استفاده تبدیل و انتقال می دهد. نقشی متفاوت، مانند دانشمند داده یا مهندس یادگیری ماشین و سپس می‌تواند از داده‌ها برای بینش ارزشمند تجاری استفاده کند. درست مانند نفت خام که به بنزین تبدیل شده تا از طریق فرآیند پیچیده استفاده شود.

برای اینکه یک مهندس داده باشید نیاز به سواد داده و تمرین زیادی دارد. این دوره اولین قدم برای شماست که می خواهید در مورد مهندسی داده بدانید. در این دوره، تئوری ها و عملی برای آشنایی شما با مهندسی داده را خواهیم دید. از آنجایی که زمینه داده ها بسیار گسترده است، این دوره به شما دانش پایه و ابتدایی در مورد فرآیند و ابزار مهندسی داده را نشان می دهد.


این دوره برای ایجاد پایه ای برای رفتن به فیلد داده بسیار مناسب است. در این دوره با موارد زیر آشنا می شویم:

  • مقدمه ای بر مهندسی داده

  • پایگاه داده غیر رابطه ای

  • مدل داده های غیر رابطه ای

  • عادی سازی جدول

  • جدول ابعاد واقعی

  • غیر عادی سازی جدول برای انبار داده

  • Extract Transform Load) مرحله بندی داده با استفاده از پانداهای پایتون

  • Elasticsearch اساسی

  • انبار داده

  • اعدادی که هر مهندس باید بداند که چگونه با کلان داده مرتبط است

  • هدوپ

  • خوشه جرقه در google cloud dataproc

  • دریاچه داده


نکات مهم

فیلد داده بسیار بزرگ است! این دوره به طور مداوم به روز می شود، اما در حال حاضر، این دوره شامل مقدمه ای بر مفهوم و نمونه عملی برای مهندسی داده است.

در حال حاضر، این دوره برای مبتدیان مهندسی داده در نظر گرفته شده است.

اگر تجربه ای در زمینه برنامه نویسی دارید و در مورد مهندسی داده شگفت زده هستید، این دوره برای شما مناسب است.

اگر در زمینه مهندسی داده تجربه دارید، این دوره ممکن است برای شما خیلی ابتدایی باشد (اگرچه من بسیار خوشحالم اگر هنوز دوره را خریداری کنید)

اگر قبلا هرگز پایتون یا SQL ننوشتید، این دوره برای شما مناسب نیست. برای درک این دوره، باید دانش اولیه در مورد SQL و pyhton داشته باشید.


سرفصل ها و درس ها

معرفی Introduction

  • به این دوره خوش آمدید Welcome to This Course

  • ساختار و پوشش دوره Course Structure & Coverage

  • چگونه از این دوره حداکثر ارزش را بدست آوریم How To Get Maximum Value From This Course

مقدمه ای بر مهندسی داده Introduction to Data Engineering

  • مهندسی داده چیست؟ What is Data Engineering?

  • مثال مهندسی داده Data Engineering Example

  • مدل سازی داده چیست؟ What is Data Modelling?

پایگاه داده Database

  • پایگاه داده چیست؟ What is Database

  • پایگاه داده رابطه ای Relational Database

  • چه زمانی از پایگاه داده رابطه ای استفاده نکنیم؟ When Not To Use Relational Database?

  • پایگاه داده NoSQL NoSQL Database

  • نسخه ی نمایشی: Postgresql Demo : Postgresql

  • نسخه ی نمایشی: پایتون برای Postgresql Demo : Python for Postgresql

  • نسخه ی نمایشی: Elasticsearch Demo : Elasticsearch

  • نسخه ی نمایشی: Python برای Elasticsearch Demo : Python for Elasticsearch

مدل پایگاه داده رابطه ای Relational Database Model

  • اهمیت مدل داده های رابطه ای The Importance of Relational Data Model

  • OLTP در مقابل OLAP OLTP vs OLAP

  • عادی سازی پایگاه داده Database Normalization

  • اولین فرم عادی (1NF) First Normal Form (1NF)

  • فرم دوم عادی (2NF) Second Normal Form (2NF)

  • فرم سوم عادی (3NF) Third Normal Form (3NF)

  • نرمال سازی نسخه ی نمایشی پایتون Normalization Python Demo

  • نکات عادی سازی Normalization Tips

  • غیرعادی سازی پایگاه داده Database Denormalization

  • غیرعادی سازی نسخه ی نمایشی پایتون Denormalization Python Demo

  • جداول واقعیت و ابعاد Fact & Dimension Tables

  • طرحواره ستاره Star Schema

  • طرح نمایشی Star Schema Python Star Schema Python Demo

  • طرح واره دانه های برف Snowflake Schema

  • طرحواره کهکشان Galaxy Schema

  • استخراج بار تبدیل (ETL) و جداول مرحله‌بندی Extract Transform Load (ETL) & Staging Tables

  • ETL و جداول مرحله‌بندی - نمای کلی نسخه ی نمایشی ETL & Staging Tables - Demo Overview

  • ETL و جداول مرحله‌بندی - نسخه آزمایشی پایتون 1 ETL & Staging Tables - Python Demo 1

  • ETL و جداول مرحله‌بندی - نسخه آزمایشی پایتون 2 ETL & Staging Tables - Python Demo 2

  • برای درج یا به روز رسانی؟ To Insert or To Update?

  • ETL و جداول مرحله‌بندی - نسخه آزمایشی پایتون 3 ETL & Staging Tables - Python Demo 3

  • ETL و جداول مرحله‌بندی - نسخه آزمایشی پایتون 4 ETL & Staging Tables - Python Demo 4

  • ETL و جداول مرحله‌بندی - نکات ETL & Staging Tables - Tips

مدل پایگاه داده NoSQL NoSQL Database Model

  • مفهوم پایه NoSQL Basic NoSQL Concept

  • قضیه CAP CAP Theorem

  • غیرعادی سازی در Elasticsearch Denormalization on Elasticsearch

  • کاربرد اصلی Elasticsearch Elasticsearch Basic Usage

  • Elasticsearch Index & Document Elasticsearch Index & Document

  • Elasticsearch ETL - بررسی اجمالی Elasticsearch ETL - Overview

  • Elasticsearch Query DSL Elasticsearch Query DSL

  • Elasticsearch ETL - نسخه ی نمایشی پایتون Elasticsearch ETL - Python Demo

پایگاه داده تحلیلی Data Warehouse

  • چشم انداز کسب و کار Business Perspective

  • دیدگاه فنی Technical Perspective

  • جدول اطلاعات و ابعاد بیشتر More Fact & Dimension Table

  • مکعب OLAP OLAP Cube

  • On-Premise یا Cloud؟ On-Premise or Cloud?

  • تکنیک های مختلف Various Techniques

  • نمای کلی نسخه ی نمایشی Demo Overview

  • نسخه آزمایشی 1 - انبار داده PostgreSQL Demo 1 - PostgreSQL Data Warehouse

  • نسخه ی نمایشی 2 - انبار داده BigQuery Demo 2 - BigQuery Data Warehouse

  • نسخه ی نمایشی 3 - عملیات انبار داده Demo 3 - Data Warehouse Operations

اعدادی که هر مهندس باید بداند Numbes Every Engineer Should Know

  • اعدادی که هر مهندس باید بداند Numbers Every Engineer Should Know

  • اعداد کوچک Small Numbers

  • اعداد بزرگ Big Numbers

Hadoop & Spark Hadoop & Spark

  • اکوسیستم هادوپ Hadoop Ecosystem

  • معرفی اسپارک Introducing Spark

  • برنامه نویسی اسپارک Spark Programming

  • فرمت های داده Data Formats

  • سلام اسپارک Hello Spark

  • Spark Demo - Dataframe Spark Demo - Dataframe

  • Spark Demo - Spark SQL Spark Demo - Spark SQL

  • Spark & ​​BigQuery - تنظیم محیط Spark & BigQuery - Setting Environment

  • Spark & ​​BigQuery - فیلم‌های ETL Spark & BigQuery - ETL Movies

  • Spark & ​​BigQuery - درس آموخته شده Spark & BigQuery - Lesson Learned

Spark Cluster در Google Cloud (Dataproc) Spark Cluster on Google Cloud (Dataproc)

  • Spark Cluster - نمای کلی Spark Cluster - Overview

  • نسخه ی نمایشی: داده های بزرگ Demo : Big Data

  • Google Dataproc Google Dataproc

دریاچه داده Data Lake

  • بررسی اجمالی دریاچه داده Data Lake Overview

  • طرحواره در خواندن Schema On Read

  • دریاچه نه باتلاق Lake, not Swamp

  • کاتالوگ داده های گوگل Google Data Catalog

منابع و مراجع Resources & References

  • کد منبع و مجموعه داده ها را دانلود کنید Download Source Code & Datasets

  • کدهای جایزه و تخفیف Bonus & Discount Codes

نمایش نظرات

Udemy (یودمی)

یودمی یکی از بزرگ‌ترین پلتفرم‌های آموزشی آنلاین است که به میلیون‌ها کاربر در سراسر جهان امکان دسترسی به دوره‌های متنوع و کاربردی را فراهم می‌کند. این پلتفرم امکان آموزش در زمینه‌های مختلف از فناوری اطلاعات و برنامه‌نویسی گرفته تا زبان‌های خارجی، مدیریت، و هنر را به کاربران ارائه می‌دهد. با استفاده از یودمی، کاربران می‌توانند به صورت انعطاف‌پذیر و بهینه، مهارت‌های جدیدی را یاد بگیرند و خود را برای بازار کار آماده کنند.

یکی از ویژگی‌های برجسته یودمی، کیفیت بالای دوره‌ها و حضور استادان مجرب و با تجربه در هر حوزه است. این امر به کاربران اعتماد می‌دهد که در حال دریافت آموزش از منابع قابل اعتماد و معتبر هستند و می‌توانند به بهترین شکل ممکن از آموزش‌ها بهره ببرند. به طور خلاصه، یودمی به عنوان یکی از معتبرترین و موثرترین پلتفرم‌های آموزشی آنلاین، به افراد امکان می‌دهد تا به راحتی و با کیفیت، مهارت‌های مورد نیاز خود را ارتقا دهند و به دنبال رشد و پیشرفت شغلی خود باشند.

آموزش مهندسی داده برای مبتدیان با استفاده از Google Cloud و Python
جزییات دوره
8 hours
77
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
1,093
4.5 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Timotius Pamungkas Timotius Pamungkas

مهندس نرم افزار جاوا، معمار