لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش مهندسی داده برای مبتدیان با استفاده از Google Cloud و Python
Data Engineering for Beginner using Google Cloud & Python
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
مهندسی داده پایه: پایتون، پانداها، پلتفرم ابری گوگل (GCP) bigquery، جرقه در dataproc، gcs، انبار داده مهندسی پایه داده، مهندسی داده چیست، چرا لازم است، نحوه انجام آن از مدل پایگاه داده رابطه ای صفر، مدل سازی پایگاه داده برای عادی سازی طراحی و عملی با استفاده از postgresql & python/pandas مدل پایگاه داده NoSQL، طراحی غیرعادی و عملی با استفاده از elasticsearch & python/pandas مقدمه ای بر spark & spark cluster با استفاده از پلتفرم ابری گوگل پیش نیازها: درک عبارات اولیه sql (انتخاب، درج، به روز رسانی ، حذف کافی است) درک پایه پایتون/پانداها این دوره از پلتفرم ابری گوگل استفاده می کند. اگر میخواهید عملی انجام دهید، باید جزئیات کارت اعتباری را برای پرداخت در Google cloud ارائه دهید. اگر این کار را نکنید، همچنان می توانید ویدیوی دوره را تماشا کنید
"داده ها روغن جدید هستند".
شاید قبلاً این نقل قول را شنیده باشید. داده ها در عصر دیجیتال به اندازه نفت در دوران صنعتی ارزشمند هستند. با این حال، درست مانند نفت، داده های خام به خودی خود قابل استفاده نیستند. در عوض، ارزش زمانی ایجاد میشود که به طور کامل و دقیق جمعآوری شود، به سایر دادههای مرتبط متصل شود و این کار به موقع انجام شود.
مهندسین داده خطوط لوله ای را طراحی و می سازند که داده ها را به یک قالب قابل استفاده تبدیل و انتقال می دهد. نقشی متفاوت، مانند دانشمند داده یا مهندس یادگیری ماشین و سپس میتواند از دادهها برای بینش ارزشمند تجاری استفاده کند. درست مانند نفت خام که به بنزین تبدیل شده تا از طریق فرآیند پیچیده استفاده شود.
برای اینکه یک مهندس داده باشید نیاز به سواد داده و تمرین زیادی دارد. این دوره اولین قدم برای شماست که می خواهید در مورد مهندسی داده بدانید. در این دوره، تئوری ها و عملی برای آشنایی شما با مهندسی داده را خواهیم دید. از آنجایی که زمینه داده ها بسیار گسترده است، این دوره به شما دانش پایه و ابتدایی در مورد فرآیند و ابزار مهندسی داده را نشان می دهد.
این دوره برای ایجاد پایه ای برای رفتن به فیلد داده بسیار مناسب است. در این دوره با موارد زیر آشنا می شویم:
مقدمه ای بر مهندسی داده
پایگاه داده غیر رابطه ای
مدل داده های غیر رابطه ای
عادی سازی جدول
جدول ابعاد واقعی
غیر عادی سازی جدول برای انبار داده
Extract Transform Load) مرحله بندی داده با استفاده از پانداهای پایتون
Elasticsearch اساسی
انبار داده
اعدادی که هر مهندس باید بداند که چگونه با کلان داده مرتبط است
هدوپ
خوشه جرقه در google cloud dataproc
دریاچه داده
نکات مهم
فیلد داده بسیار بزرگ است! این دوره به طور مداوم به روز می شود، اما در حال حاضر، این دوره شامل مقدمه ای بر مفهوم و نمونه عملی برای مهندسی داده است.
در حال حاضر، این دوره برای مبتدیان مهندسی داده در نظر گرفته شده است.
اگر تجربه ای در زمینه برنامه نویسی دارید و در مورد مهندسی داده شگفت زده هستید، این دوره برای شما مناسب است.
اگر در زمینه مهندسی داده تجربه دارید، این دوره ممکن است برای شما خیلی ابتدایی باشد (اگرچه من بسیار خوشحالم اگر هنوز دوره را خریداری کنید)
اگر قبلا هرگز پایتون یا SQL ننوشتید، این دوره برای شما مناسب نیست. برای درک این دوره، باید دانش اولیه در مورد SQL و pyhton داشته باشید.
سرفصل ها و درس ها
معرفی
Introduction
به این دوره خوش آمدید
Welcome to This Course
ساختار و پوشش دوره
Course Structure & Coverage
چگونه از این دوره حداکثر ارزش را بدست آوریم
How To Get Maximum Value From This Course
مقدمه ای بر مهندسی داده
Introduction to Data Engineering
مهندسی داده چیست؟
What is Data Engineering?
مثال مهندسی داده
Data Engineering Example
مدل سازی داده چیست؟
What is Data Modelling?
پایگاه داده
Database
پایگاه داده چیست؟
What is Database
پایگاه داده رابطه ای
Relational Database
چه زمانی از پایگاه داده رابطه ای استفاده نکنیم؟
When Not To Use Relational Database?
پایگاه داده NoSQL
NoSQL Database
نسخه ی نمایشی: Postgresql
Demo : Postgresql
نسخه ی نمایشی: پایتون برای Postgresql
Demo : Python for Postgresql
نسخه ی نمایشی: Elasticsearch
Demo : Elasticsearch
نسخه ی نمایشی: Python برای Elasticsearch
Demo : Python for Elasticsearch
مدل پایگاه داده رابطه ای
Relational Database Model
اهمیت مدل داده های رابطه ای
The Importance of Relational Data Model
OLTP در مقابل OLAP
OLTP vs OLAP
عادی سازی پایگاه داده
Database Normalization
اولین فرم عادی (1NF)
First Normal Form (1NF)
فرم دوم عادی (2NF)
Second Normal Form (2NF)
فرم سوم عادی (3NF)
Third Normal Form (3NF)
نرمال سازی نسخه ی نمایشی پایتون
Normalization Python Demo
نکات عادی سازی
Normalization Tips
غیرعادی سازی پایگاه داده
Database Denormalization
غیرعادی سازی نسخه ی نمایشی پایتون
Denormalization Python Demo
جداول واقعیت و ابعاد
Fact & Dimension Tables
طرحواره ستاره
Star Schema
طرح نمایشی Star Schema Python
Star Schema Python Demo
طرح واره دانه های برف
Snowflake Schema
طرحواره کهکشان
Galaxy Schema
استخراج بار تبدیل (ETL) و جداول مرحلهبندی
Extract Transform Load (ETL) & Staging Tables
نمایش نظرات