به عنوان بخشی از این دوره، تمام مهارت های کلیدی برای ساخت خطوط لوله مهندسی داده با استفاده از Spark SQL و Spark Data Frame API با استفاده از Scala به عنوان یک زبان برنامه نویسی را خواهید آموخت. این دوره قبلاً یک دوره CCA 175 Spark و Hadoop Developer برای آماده سازی آزمون گواهینامه بود. از تاریخ 10/31/2021، امتحان غروب است و ما آن را با استفاده از Scala به Spark SQL و Spark 3 تغییر نام دادهایم زیرا موضوعات مرتبط با صنعت را فراتر از محدوده صدور گواهینامه پوشش میدهد.
درباره مهندسی داده
مهندسی داده چیزی جز پردازش داده ها بسته به نیازهای پایین دست ما نیست. ما باید خطوط لوله مختلفی مانند خط لوله دسته ای، خط لوله جریان و غیره را به عنوان بخشی از مهندسی داده بسازیم. تمام نقش های مربوط به پردازش داده ها تحت مهندسی داده ادغام شده است. به طور معمول، آنها به عنوان توسعه ETL، توسعه انبار داده، و غیره شناخته می شوند. Apache Spark به عنوان یک فناوری پیشرو برای مراقبت از مهندسی داده در مقیاس تکامل یافته است.
من این دوره را برای هرکسی که میخواهد با استفاده از Spark (Scala) به نقش مهندس داده تبدیل شود آماده کردهام. من خودم یک معمار راه حل مهندسی داده با تجربه ثابت شده در طراحی راه حل ها با استفاده از Apache Spark هستم.
اجازه دهید جزئیات آنچه را که در این دوره یاد می گیرید بررسی کنیم. به خاطر داشته باشید که این دوره با بسیاری از کارهای عملی ایجاد شده است که به شما تمرین کافی را با استفاده از ابزارهای مناسب می دهد. همچنین، تعداد زیادی کار و تمرین برای ارزیابی خودتان وجود دارد.
راه اندازی خوشه داده بزرگ تک گره
بسیاری از شما دوست دارید از فناوریهای مرسوم مانند Mainframes، Oracle PL/SQL و غیره به Big Data منتقل شوید و ممکن است به Big Data Cluster دسترسی نداشته باشید. برای شما بسیار مهم است که محیط را به شیوه ای درست تنظیم کنید. اگر خوشه را در دسترس ندارید نگران نباشید، ما شما را از طریق پشتیبانی از طریق Udemy Q A راهنمایی خواهیم کرد.
نمونه AWS Cloud9 مبتنی بر اوبونتو را با پیکربندی مناسب تنظیم کنید
اطمینان حاصل کنید که Docker راه اندازی شده است
آزمایشگاه Jupyter و سایر اجزای کلیدی را راه اندازی کنید
Hadoop، Hive، YARN و Spark را راه اندازی و اعتبارسنجی کنید
آیا در مورد تنظیم محیط کمی احساس ناراحتی می کنید؟ نگران نباش!!! ما دسترسی تکمیلی به آزمایشگاه را تا 2 ماه فراهم خواهیم کرد. در اینجا جزئیات است.
آموزش با استفاده از یک محیط تعاملی. برای شروع 2 هفته به آزمایشگاه دسترسی خواهید داشت. اگر محیط را دوست دارید و با ارائه امتیاز و بازخورد 5* آن را تأیید کنید، دسترسی به آزمایشگاه تا 6 هفته (2 ماه) دیگر تمدید خواهد شد. برای دسترسی به آزمایشگاه تکمیلی، می توانید یک ایمیل به support@itversity.com ارسال کنید. همچنین، اگر کارفرمای شما یک محیط چند گره ای را فراهم کند، ما به شما کمک می کنیم تا مطالب را برای تمرین به عنوان بخشی از جلسه زنده تنظیم کنید. علاوه بر پشتیبانی Q A، ما همچنین پشتیبانی لازم را از طریق جلسات زنده ارائه می دهیم.
خلاصه ای سریع از Scala
این دوره به دانش مناسبی از Scala نیاز دارد. برای اطمینان از اینکه Spark را از منظر مهندسی داده درک می کنید، ماژولی را برای گرم کردن سریع با Scala اضافه کردیم. اگر با اسکالا آشنایی ندارید، پیشنهاد می کنیم دوره های مربوطه را در مورد اسکالا به عنوان زبان برنامه نویسی بگذرانید.
مهندسی داده با استفاده از Spark SQL
اجازه دهید به Spark SQL عمیق بپردازیم تا بفهمیم چگونه می توان از آن برای ساخت خطوط لوله مهندسی داده استفاده کرد. Spark with SQL این توانایی را برای ما فراهم می کند تا از قابلیت های محاسباتی توزیع شده Spark همراه با دستور زبان SQL سازگار با توسعه دهندگان استفاده کنیم.
شروع به کار با Spark SQL
تبدیلهای اساسی با استفاده از Spark SQL
مدیریت جداول Spark Metastore - Basic DDL و DML
مدیریت جداول Spark Metastore - DML و پارتیشن بندی
نمای کلی از توابع Spark SQL
عملکردهای پنجره با استفاده از Spark SQL
مهندسی داده با استفاده از Spark Data Frame API
APIهای Spark Data Frame روشی جایگزین برای ساخت برنامههای مهندسی داده در مقیاسی هستند که از قابلیتهای محاسباتی توزیع شده Spark استفاده میکنند. مهندسان داده از پیشینه توسعه برنامه ممکن است APIهای Data Frame را به Spark SQL برای ساخت برنامه های مهندسی داده ترجیح دهند.
نمای کلی پردازش داده با استفاده از Spark Data Frame APIهای Scala به عنوان زبان برنامه نویسی
پردازش داده های ستونی با استفاده از Spark Data Frame API با استفاده از Scala به عنوان زبان برنامه نویسی
تبدیلهای اساسی با استفاده از Spark Data Frame API با استفاده از Scala به عنوان زبان برنامهنویسی - فیلتر کردن، تجمیعها و مرتبسازی
پیوستن به مجموعه دادهها با استفاده از Spark Data Frame API با استفاده از Scala به عنوان زبان برنامهنویسی
همه نسخههای نمایشی در کلاستر Big Data پیشرفته ما ارائه میشوند. با دریافت رسید Udemy میتوانید از دسترسی رایگان یک ماهه به آزمایشگاه با تماس با support@itversity.com استفاده کنید.
مشاور فناوری و Evangelist 13 سال تجربه در اجرای پروژه های پیچیده با استفاده از مجموعه گسترده ای از فناوری ها از جمله Big Data و Cloud. Iversity، llc - یک شرکت مستقر در ایالات متحده برای ارائه آموزش با کیفیت برای متخصصان فناوری اطلاعات و کارکنان و همچنین راه حل های مشاوره ای برای مشتریان سازمانی ، پیدا کردم. من هزاران نفر از متخصصان فناوری اطلاعات را در زمینه فن آوری های زیادی از جمله Big Data و Cloud آموزش داده ام. ایجاد حرفه ای فناوری اطلاعات برای افراد و ارائه خدمات با کیفیت به مشتریان از اهمیت بالاتری در سازمان ما برخوردار است. به عنوان یک استراتژی ورود ، ارائه آموزش با کیفیت در زمینه های ABCD خواهد بود * توسعه برنامه * داده های بزرگ و هوش تجاری * ابر * پایگاه داده ، پایگاه داده
Asasri Manthena
نمایش نظرات