آموزش مهندسی داده 101: راهنمای مبتدی - آخرین آپدیت

دانلود Data Engineering 101: The Beginner's Guide

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: اصول اساسی مهندسی داده های مدرن درک بصری از مهندسی داده ها را درک کنید که مهمترین مفاهیم در مهندسی داده ها را درک کنید که خط لوله داده های پایان تا انتها از چه چیزی تشکیل شده است و هر قسمت از خط لوله درک شما را با مثال پایان می دهد- معماری خط لوله داده نهایی برای محبوب ترین موارد استفاده پیش nیaزha: هیچ دانش قبلی در مورد مهندسی داده ها لازم نیست. شما هر آنچه را که باید بدانید یاد خواهید گرفت. تجربه برنامه نویسی لازم نیست.

اصول مهندسی داده های مدرن

آیا شما در مورد مهندسی داده کنجکاو هستید اما مطمئن نیستید از کجا شروع کنید؟

آیا شما یک مهندس نرم افزار ، دانشمند داده یا تحلیلگر داده هستید که می خواهد در مورد مهندسی داده های مدرن اطلاعات بیشتری کسب کنید؟

به دوره مقدماتی ما شیرجه بزنید که در آن ما پیچیدگی های این زمینه را تغییر می دهیم و یک پایه محکم در مهندسی داده های مدرن به شما می دهیم.

این دوره به طور خاص برای کسانی که تازه وارد این زمینه هستند ، تهیه شده است و مقدمه ای واضح و مختصر برای مفاهیم و ابزارهای ضروری مورد استفاده در مهندسی داده های مدرن امروزه ارائه می دهد.


آنچه را یاد خواهید گرفت:

  • مهندسی داده دقیقاً چیست؟ مفهوم اصلی خطوط لوله داده و نقش مهندسی داده ها را در یک تیم داده گسترده تر درک کنید.

  • خط لوله داده پایان به پایان: هر قسمت از خط لوله داده پایان به پایان را از تولید داده ، ذخیره ، مصرف ، تحول و خدمت کاوش کنید. بیاموزید که چگونه داده ها از ایجاد تا مصرف جریان می یابد.

  • مفاهیم مهندسی داده های بحرانی: مهمترین مفاهیم در مهندسی داده ها ، مانند انبار داده در مقابل داده های دریاچه ، فروشگاه های داده مبتنی بر ستون ، ELT در مقابل ETL و موارد دیگر را بیاموزید.

  • مقدمه ای برای ابزارهای مهندسی داده های مدرن: ببینید چگونه ابزارهای داده مدرن مانند Dagster ، Trino ، DBT و Apache Iceberg برای ساخت خطوط لوله داده پایان به پایان استفاده می شوند.

  • نمونه های معماری پشته داده های مدرن: نمونه ای از ابزارها و فناوری هایی را که مهندسان داده ها برای معماری خطوط لوله داده مدرن پایان به معمار برای چهار مورد متداول استفاده می کنند ، معرفی کنید: 1) تجزیه و تحلیل تجارت ، 2) پخش ، 3 ) ML ، و 4) یادگیری عمیق.


چه کسی باید این دوره را طی کند:

  • مبتدیان کنجکاو در مورد ایجاد حرفه در مهندسی داده ها.

  • متخصصان داده مانند دانشمندان داده یا تحلیلگران داده که به دنبال درک اصول مهندسی داده های مدرن هستند.

  • هرکسی که می خواهد در مورد آنچه مهندسی داده ها در مشاغل داده محور بازی می کند ، بیاموزد.


چرا این دوره را طی می کنید؟

  • این دوره به عنوان مقدمه ای ملایم در زمینه مهندسی داده ها طراحی شده است. این مهندسی داده ها را به بخش های واضح در یک خط لوله داده تجزیه می کند ، بنابراین می توانید ببینید که مهندسی داده ها در مورد چیست.

  • شما با درک روشنی از مهندسی داده ها و یک پایه محکم برای کشف بیشتر مباحث پیشرفته تر یا ایجاد پشته داده های مدرن ، ترک خواهید کرد.


این دوره چیست:

  • قبل از اینکه این دوره را طی کنید ، باید بدانید که این دوره چیست. این دوره یک آموزش نیست. بنابراین اگر انتظار دارید در مورد نحوه راه اندازی و استفاده از ابزارهایی مانند Spark یا Airflow یا نوشتن بیانیه SQL یاد بگیرید ، این دوره برای شما نیست.

  • هیچ راه اندازی Docker وجود ندارد ، هیچ نصب ابزار وجود ندارد ، و هیچ برنامه نویسی وجود ندارد.

  • اگر به دنبال آن نوع آموزش هستید ، به دوره های پیشرفته تر مهندسی داده های ما نگاهی بیندازید که در آن شما را از طریق نحوه ساخت خط لوله های داده نهایی به انتها با استفاده از ابزارهای منبع باز برش می گذرانیم.


در این سفر هیجان انگیز برای کشف اصول مهندسی داده به ما بپیوندید. این که آیا شما در حال برنامه ریزی یک تغییر شغلی هستید یا فقط به دنبال گسترش افق های فناوری خود هستید ، این دوره دانش و ابزارهایی را که برای موفقیت لازم دارید در اختیار شما قرار می دهد.

آماده تغییر نحوه مشاهده داده ها هستید؟ به دوره بپیوندید و بیایید شروع کنیم!


سرفصل ها و درس ها

آشنایی با مهندسی داده Introduction to data engineering

  • مقدمه Introduction

  • اسلایدهای دوره را بارگیری کنید Download the Course Slides

  • منابع بیشتر ، کمک و جامعه More Resources, Help and Community

  • مهندسی داده چیست و چرا مهم است؟ What is data engineering and why is it important?

  • باستانی کلی خط لوله داده پایان به پایان Overall archiecture of end-to-end data pipeline

  • بخش 1 - مسابقه 1 Section 1 - Quiz 1

  • برخی از زمینه های تاریخی Some historical context

  • بلوغ داده ها Data maturity

  • محل مهندس داده در یک تیم داده است Data engineer’s place within a data team

  • بخش 1 - مسابقه 2 Section 1 - Quiz 2

خط لوله داده پایان به پایان End-to-end data pipeline in-depth

  • تولید (سیستم های منبع): مقدمه Generation (source systems): Intro

  • تولید (سیستم های منبع): انواع بانکهای اطلاعاتی Generation (source systems): Types of databases

  • تولید (سیستم های منبع): سیستم های شخص ثالث و جریان رویداد Generation (source systems): Third-party systems and event streams

  • بخش 2 - مسابقه 1 Section 2 - Quiz 1

  • ذخیره سازی: مقدمه Storage: Intro

  • ذخیره سازی: سریال سازی (قالب های فایل ذخیره سازی) ، فشرده سازی و ذخیره سازی Storage: Serialization (storage file formats), compression, and caching

  • ذخیره سازی: ذخیره سازی توزیع شده Storage: Distributed storage

  • ذخیره سازی: انواع سیستم های ذخیره سازی Storage: Types of storage systems

  • ذخیره سازی: ذخیره سازی مبتنی بر ردیف در مقابل ستونی (یا OLTP در مقابل OLAP) Storage: Row-based vs columnar storage (or OLTP vs OLAP)

  • ذخیره سازی: انبار داده ، دریاچه داده و داده دریاچه خانه Storage: Data warehouse, data lake, and data lakehouse

  • بخش 2 - مسابقه 2 Section 2 - Quiz 2

  • مصرف: دسته/میکرو دسته/جریانی جریان و ETL در مقابل ELT Ingestion: Batch/micro-batch/streaming ingestion and ETL vs ELT

  • مصرف: مصرف جریان Ingestion: Streaming ingestion

  • مصرف: مقیاس پذیری و طرحواره بالادست تغییر می کند Ingestion: Scalability and upstream schema changes

  • مصرف: روشهای مختلف برای مصرف داده ها Ingestion: Different ways to ingest data

  • تحول: نمایش داده شد Transformation: Queries

  • تحول: مدل سازی داده ها Transformation: Data modeling

  • تحول: نمایش داده شد و تحولات Transformation: Queries and transformations

  • تحول: رویدادها در مقابل ایالت ها و گروه در مقابل جریان Transformation: Events vs states and batch vs streaming

  • خدمت Serving

  • بخش 2 - مسابقه 3 Section 2 - Quiz 3

زیر بغل Undercurrents

  • DataOps DataOps

  • ارکستراسیون Orchestration

  • امنیت ، حریم خصوصی ، کیفیت داده ها Security, privacy, data quality

  • گردش کار توسعه Development workflow

  • بخش 3 - مسابقه 1 Section 3 - Quiz 1

نمونه های معماری خط لوله داده Data pipeline architecture examples

  • معماری داده خوب چیست؟ What is a good data architecture?

  • هنگام طراحی معماری داده خود چه عواملی را باید در نظر بگیرید؟ What factors should you consider when designing your data architecture?

  • آموزش های بیشتر ، پشتیبانی و جامعه More tutorials, Support, and Community

  • Bi Stack (انبار داده): ذخیره سازی BI stack (data warehouse): Storage

  • Bi Stack (انبار داده): DuckDB BI stack (data warehouse): DuckDB

  • Bi Stack (انبار داده): ارکستر BI stack (data warehouse): Orchestrator

  • Bi Stack (انبار داده): مصرف BI stack (data warehouse): Ingestion

  • BI Stack (انبار داده): تحول و تجسم BI stack (data warehouse): Transformation and visualization

  • Bi Stack (Data Lakehouse): ذخیره سازی - کوه یخ آپاچی BI stack (data lakehouse): Storage - Apache Iceberg

  • Bi Stack (Data Lakehouse): موتور محاسبه - ترینو BI stack (data lakehouse): Compute engine - Trino

  • بخش 4 - مسابقه 1 Section 4 - Quiz 1

  • پشته جریان: مصرف رویداد Streaming stack: Event ingestion

  • پشته جریان: پردازش رویداد Streaming stack: Event processing

  • ML Stack: اصول اولیه ML و AI ML stack: The basics of ML and AI

  • ML Stack: فروشگاه ویژگی ML stack: Feature store

  • پشته ML: آموزش مدل ML stack: Model training

  • ML Stack: مدل خدمت (A.K.A. استنتاج مدل) ML stack: Model serving (a.k.a. model inference)

  • پشته یادگیری عمیق: مقدمه Deep learning stack: Intro

  • پشته یادگیری عمیق: برچسب زدن ، آموزش و استنباط Deep learning stack: Labeling, training, and inference

  • سایر ملاحظات مربوط به ساخت خط لوله داده Other considerations to building a data pipeline

  • بخش 4 - مسابقه 2 Section 4 - Quiz 2

چه چیزی بعدی؟ What's next?

  • آینده مهندسی داده ها؟ نظر ما Future of data engineering? Our opinion

  • چه بعدی است What's next

  • مراحل بعدی - منابع رایگان بیشتر (آموزش های دستی) و جامعه Next steps - more free resources (hands-on tutorials) and community

نمایش نظرات

آموزش مهندسی داده 101: راهنمای مبتدی
جزییات دوره
4 hours
52
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
2,097
4.7 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Seungchan Lee Seungchan Lee

مربی سرب ، DeepIntuitions/مهندس سرب ، SideTrek

Nami Kim Nami Kim

بنیانگذار DeepIntuitions

DeepIntuitions AI DeepIntuitions AI

هوش مصنوعی و مربی تجارت