آموزش Azure Spark Databricks

Azure Spark Databricks Essential Training

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
توضیحات دوره: Apache Spark و Microsoft Azure دو مورد از پر تقاضا ترین سیستم عامل ها و مجموعه فناوری های مورد استفاده توسط تیم های علوم داده امروزی هستند. این دو سیستم عامل در Azure Databricks join یک پلت فرم تجزیه و تحلیل مبتنی بر Apache Spark برای ایجاد سهولت و همکاری بیشتر کار تجزیه و تحلیل داده ها ایجاد شده است. در این دوره ، لین لانگیت به دنبال الگوها ، ابزارها و بهترین روش هایی است که می تواند به توسعه دهندگان و متخصصان DevOps در استفاده از Azure Databricks برای ایجاد کارآمد راه حل های داده های بزرگ در Apache Spark کمک کند. لین نحوه تنظیم خوشه ها و استفاده از نوت بوک ها ، مشاغل و سرویس های Azure Databricks برای پیاده سازی حجم کاری بزرگ را پوشش می دهد. وی همچنین خطوط لوله داده را با Azure Databricks - از جمله نحوه استفاده از خطوط لوله ML - و همچنین الگوهای معماری برای یادگیری ماشین کاوش می کند.
موضوعات شامل:
  • سناریوهای تجاری Apache Spark
  • تنظیم خوشه
  • استفاده از نوت بوک های Python ، R و Scala
  • مقیاس بندی گردش کار Azure Databricks
  • خطوط لوله داده با Azure Databricks
  • معماری یادگیری ماشین
  • استفاده از Azure Databricks برای ذخیره سازی داده ها

سرفصل ها و درس ها

مقدمه Introduction

  • خطوط لوله داده را بهینه کنید Optimize data pipelines

  • آنچه باید بدانید What you should know

  • درباره استفاده از خدمات ابری About using cloud services

1. داده های بزرگ در مورد داده های لاجورد 1. Big Data on Azure Databricks

  • با خوشه های Data Spark Apache Spark ملاقات کنید Meet Databricks Apache Spark clusters

  • سناریوهای تجاری Spark Business scenarios for Spark

  • اجزای کلیدی Spark را درک کنید Understand Spark key components

  • مفاهیم Azure Databricks Azure Databricks concepts

  • شروع سریع: از یک دفترچه استفاده کنید Quick start: Use a notebook

2. بارهای کاری هسته محور آزور 2. Core Azure Databricks Workloads

  • بررسی مجموعه های خوشه ای Databricks Azure Review Databricks Azure cluster setup

  • از یک نوت بوک پایتون با داشبورد استفاده کنید Use a Python notebook with dashboards

  • از یک نوت بوک R استفاده کنید Use an R notebook

  • برای تجسم از نوت بوک Scala استفاده کنید Use a Scala notebook for visualization

  • از نوت بوک با scikit-Learn استفاده کنید Use a notebook with scikit-learn

  • از یک نوت بوک Spark Streaming استفاده کنید Use a Spark Streaming notebook

  • از یک کتابخانه خارجی Scala استفاده کنید: variant-spark Use an external Scala library: variant-spark

3. مقیاس گذاری بارهای کاری آزمایشی لاجورد 3. Scaling Azure Databricks Workloads

  • مراحل بار مهندسی داده را درک کنید Understand data engineering workload steps

  • پیکربندی های خوشه را درک کنید Understand cluster configurations

  • از اجرای سرباز جرقه سربار بفهمید Understand Spark job execution overhead

  • هواپیماهای کنترل بهینه سازی را کاوش کنید Explore optimization control planes

  • یک خوشه و شغل را بهینه کنید Optimize a cluster and job

  • یک کار با اندازه تولید را اجرا کنید Run a production-size job

4- خطوط لوله داده با داده های لاجورد 4. Data Pipelines with Azure Databricks

  • از مشاغل Databricks و کنترل مبتنی بر نقش استفاده کنید Use Databricks jobs and role-based control

  • از Databricks Runtime ML استفاده کنید Use Databricks Runtime ML

  • API خط لوله ML را درک کنید Understand ML Pipelines API

  • از API خط لوله ML استفاده کنید Use ML Pipelines API

  • از آموزش ML توزیع شده استفاده کنید Use distributed ML training

  • دلتا Databricks را درک کنید Understand Databricks Delta

  • از Delta Databricks استفاده کنید Use Databricks Delta

  • از فضای ذخیره سازی لاجورد استفاده کنید Use Azure Blob storage

  • MLflow را درک کنید Understand MLflow

5- معماری های یادگیری ماشین 5. Machine Learning Architectures

  • ملاحظات خط لوله Azure Databricks Azure Databricks pipeline considerations

  • داده های لاجورد برای ذخیره سازی داده ها Azure Databricks for data warehousing

  • داده های لاجورد و یادگیری ماشین Azure Databricks and machine learning

  • داده های لاجورد برای تجزیه و تحلیل چرن Azure Databricks for churn analysis

  • دیتابریک لاجورد برای تشخیص نفوذ Azure Databricks for intrusion detection

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

نظری ارسال نشده است.

آموزش Azure Spark Databricks
خرید اشتراک و دانلود خرید تکی و دانلود | 160,000 تومان (5 روز مهلت دانلود) زمان تقریبی آماده سازی لینک دانلود این دوره آموزشی حدود 5 تا 24 ساعت می باشد.
جزییات دوره
2h 52m
36
Linkedin (لینکدین) lynda-small
11 بهمن 1397 (آخرین آپدیت رو دریافت می‌کنید، حتی اگر این تاریخ بروز نباشد.)
18,257
- از 5
ندارد
دارد
دارد
Lynn Langit

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Lynn Langit Lynn Langit

Cloud Architect

Lynn Langit یک معمار ابری است که با خدمات وب آمازون و Google Cloud Platform کار می کند.

لین متخصص در پروژه های کلان داده است. او با AWS Athena، Aurora، Redshift، Kinesis و IoT کار کرده است. او همچنین کارهای تولیدی را با Databricks برای Apache Spark و Google Cloud Dataproc، Bigtable، BigQuery و Cloud Spanner انجام داده است.

لین همچنین بنیانگذار  است. آموزش برنامه نویسی به کودکان. او درباره داده ها و فناوری های ابری در آمریکای شمالی و جنوبی، اروپا، آفریقا، آسیا و استرالیا صحبت کرده است.

Linkedin (لینکدین)

لینکدین: شبکه اجتماعی حرفه‌ای برای ارتباط و کارآفرینی

لینکدین به عنوان یکی از بزرگترین شبکه‌های اجتماعی حرفه‌ای، به میلیون‌ها افراد در سراسر جهان این امکان را می‌دهد تا ارتباط برقرار کنند، اطلاعات حرفه‌ای خود را به اشتراک بگذارند و فرصت‌های شغلی را کشف کنند. این شبکه اجتماعی به کاربران امکان می‌دهد تا رزومه حرفه‌ای خود را آپدیت کنند، با همکاران، دوستان و همکاران آینده ارتباط برقرار کنند، به انجمن‌ها و گروه‌های حرفه‌ای ملحق شوند و از مقالات و مطالب مرتبط با حوزه کاری خود بهره‌مند شوند.

لینکدین همچنین به کارفرمایان امکان می‌دهد تا به دنبال نیروهای با تجربه و مهارت مورد نیاز خود بگردند و ارتباط برقرار کنند. این شبکه حرفه‌ای به عنوان یک پلتفرم کلیدی برای بهبود دسترسی به فرصت‌های شغلی و گسترش شبکه حرفه‌ای خود، نقش مهمی را ایفا می‌کند. از این رو، لینکدین به عنوان یکی از مهمترین ابزارهای کارآفرینی و توسعه حرفه‌ای در دنیای امروز مورد توجه قرار دارد.