🔔 با توجه به بهبود نسبی اینترنت، آمادهسازی دورهها آغاز شده است. به دلیل تداوم برخی اختلالات، بارگذاری دورهها ممکن است با کمی تأخیر انجام شود. مدت اشتراکهای تهیهشده محفوظ است.
لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش نکات کلیدی PySpark برای دانشمندان داده (کلان داده + پایتون)
- آخرین آپدیت
دانلود PySpark Essentials for Data Scientists (Big Data + Python)
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
آموزش کار با دادههای بزرگ (Big Data) برای یادگیری ماشینی (Machine Learning) با استفاده از پایتون (Python) در PySpark توسط یک متخصص صنعت!
استفاده از پایتون با دادههای بزرگ بر روی یک چارچوب توزیعشده (Apache Spark)
کار با مجموعهدادههای واقعی در پروژههای مشاوره واقعی
نحوه استریم (Streaming) دادههای زنده از توییتر (Twitter) با استفاده از Spark Structured Streaming
یادگیری چگونگی ایجاد یک اپلیکیشن "Pandora Like" که آهنگها را با استفاده از یادگیری ماشینی به ژانرها طبقهبندی میکند
علامتگذاری پستهای شغلی مشکوک با استفاده از پردازش زبان طبیعی (Natural Language Processing)
استفاده از یادگیری ماشینی برای پیشبینی استحکام بهینه سیمان و عواملی که بر آن تأثیر میگذارند
طبقهبندی دستورالعملهای آشپزی کریسمس با استفاده از مدلسازی موضوع (LDA)
Segmentation مشتری با استفاده از مدلسازی مخلوط گاوسی (خوشهبندی)
استفاده از تحلیل خوشه (Cluster Analysis) برای توسعه استراتژی طراحیشده برای افزایش نرخ فارغالتحصیلی کالج برای جمعیتهای کمبرخوردار
نحوه استفاده از الگوریتم خوشهبندی k-means برای تعریف یک استراتژی بازاریابی
ادغام یک رابط کاربری (UI) برای نظارت بر فرآیند آموزش و توسعه مدل خود با MLflow
تئوری و کاربرد الگوریتمهای پیشرفته علم داده
دستکاری، پیوستن و تجمیع Dataframes در Spark با پایتون
یادگیری نحوه اعمال تکنیکهای یادگیری ماشینی Spark بر روی Dataframes توزیعشده
اعتبارسنجی متقابل (Cross Validation) و تنظیم ابرپارامترها (Hyperparameter Tuning)
تکنیکهای طبقهبندی و رگرسیون (Classification & Regression)
پاکسازی دادهها (Data Wrangling) برای پردازش زبان طبیعی
نحوه نوشتن کوئریهای SQL در Spark
پیشنیازها:
آشنایی با پایتون مفید است، اما الزامی نیست
داشتن مقداری پیشزمینه در علم داده مفید است، اما الزامی نیست
اشتیاق به یادگیری
این دوره برای دانشمندان داده (یا دانشمندان داده مشتاق) است که میخواهند آموزش عملی در PySpark (پایتون برای Apache Spark) با استفاده از مجموعهدادههای دنیای واقعی و دانش کدنویسی کاربردی دریافت کنند که هر روز به عنوان یک دانشمند داده از آن استفاده خواهید کرد! با ثبتنام در این دوره، به بیش از 100 سخنرانی، صدها مسئله نمونه و آزمون و بیش از 100,000 خط کد دسترسی خواهید داشت!
من اصول ضروری را برای آنچه شما باید بدانید تا در پایان این دوره در PySpark متخصص شوید، ارائه خواهم داد. این دوره را بر اساس تجربه گسترده خود در مشاوره به عنوان یک دانشمند داده برای مشتریانی مانند IRS، وزارت کار ایالات متحده و امور کهنه سربازان ایالات متحده طراحی کردهام.
من سخنرانیها و تمرینهای کدنویسی را برای کاربردهای دنیای واقعی ساختار دادهام، بنابراین میتوانید درک کنید که چگونه PySpark واقعاً در محل کار استفاده میشود. ما همچنین به توابع سفارسی خود که خودم نوشتم، خواهیم پرداخت تا شما را سریعاً در API MLlib راهاندازی کنیم و شروع به ساختن مدلهای یادگیری ماشینی را آسان کنیم! ما همچنین به MLflow خواهیم پرداخت که به ما کمک میکند فرآیند آموزش و ارزیابی مدل خود را در یک رابط کاربری سفارشی مدیریت و پیگیری کنیم که شما را در بازار کار رقابتیتر میکند!
هر بخش یک سخنرانی مروری بر مفاهیم و همچنین فعالیتهای همراه با کدنویسی، مجموعههای مشکل ساختاریافته برای شما خواهد داشت تا به شما کمک کند آنچه را آموختهاید به اجرا درآورید، و همچنین راهحلهای هر مسئله را در صورت گیر کردن ارائه میدهد. علاوه بر این، پروژههای مشاوره دنیای واقعی در هر بخش با مجموعهدادههای معتبر ارائه شدهاند تا به شما کمک کنند نحوه اعمال هر یک از مفاهیمی را که پوشش دادهایم، در نظر بگیرید.
در نهایت، من تعدادی دفترچه یادداشت و جزوههای مروری فشرده از تمام محتوای دوره نوشتهام تا مرجع بعدی شما را بسیار آسان کنم. این کار زمانی که اولین شغل خود را در برنامهنویسی در PySpark به دست آوردید، بسیار مفید خواهد بود!
بیصبرانه منتظر دیدن شما در سخنرانیها هستم! و واقعاً امیدوارم که از این دوره لذت ببرید! شما را در اولین سخنرانی خواهم دید!
سرفصل ها و درس ها
Course Introduction-مقدمه دوره
Course Introduction
Introduction to PySpark-معرفی PySpark
Introduction to PySpark
Transitioning from Python to PySpark Concept Review-مرور مفاهیم گذار از پایتون به PySpark
Transitioning from Python to PySpark Concept Review
Transitioning from Python to PySpark Code Along Activity-فعالیت همراه با کد گذار از پایتون به PySpark
Transitioning from Python to PySpark Code Along Activity
A little something to keep you going....-یک نکته برای ادامه...
A little something to keep you going....
Read, Write and Validate Dataframes Code Along Activity-فعالیت همراه با کد خواندن، نوشتن و اعتبارسنجی Dataframe
Read, Write and Validate Dataframes Code Along Activity
Read, Write and Validate Data HW-تمرین خواندن، نوشتن و اعتبارسنجی داده
Read, Write and Validate Data HW
Read, Write and Validate Data HW Solutions Code Review-مرور کد حل تمرین خواندن، نوشتن و اعتبارسنجی داده
Read, Write and Validate Data HW Solutions Code Review
A little something to keep you going....-یک نکته برای ادامه...
A little something to keep you going....
Search and Filter Dataframes Code Along Activity-فعالیت همراه با کد جستجو و فیلتر Dataframe
Search and Filter Dataframes Code Along Activity
Search and Filter Dataframes HW-تمرین جستجو و فیلتر Dataframe
Search and Filter Dataframes HW
Search and Filter Dataframes HW Solution Code Review-مرور کد حل تمرین جستجو و فیلتر Dataframe
Search and Filter Dataframes HW Solution Code Review
A little something to keep you going....-یک نکته برای ادامه...
A little something to keep you going....
SQL Options in Spark/PySpark Code Along Activity-فعالیت همراه با کد گزینههای SQL در Spark/PySpark
SQL Options in Spark/PySpark Code Along Activity
SQL Options in Spark/PySpark HW-تمرین گزینههای SQL در Spark/PySpark
SQL Options in Spark/PySpark HW
SQL Options in Spark/PySpark HW Solutions-حل تمرین گزینههای SQL در Spark/PySpark
SQL Options in Spark/PySpark HW Solutions
A little something to keep you going....-یک نکته برای ادامه...
A little something to keep you going....
A little something to keep you going....-یک نکته برای ادامه...
A little something to keep you going....
Aggregating Data in Dataframes Code Along Activity-فعالیت همراه با کد تجمیع داده در Dataframe
Aggregating Data in Dataframes Code Along Activity
Aggregating Data in Dataframes HW-تمرین تجمیع داده در Dataframe
Aggregating Data in Dataframes HW
Aggregating Data in Dataframes HW Solution-حل تمرین تجمیع داده در Dataframe
Aggregating Data in Dataframes HW Solution
A little something to keep you going....-یک نکته برای ادامه...
A little something to keep you going....
Joining and Appending Dataframes Code Along Activity-فعالیت همراه با کد پیوستن و الحاق Dataframe
Joining and Appending Dataframes Code Along Activity
Joining and Appending Dataframes HW-تمرین پیوستن و الحاق Dataframe
Joining and Appending Dataframes HW
Joining and Appending Dataframes HW Solution Code Review-مرور کد حل تمرین پیوستن و الحاق Dataframe
Joining and Appending Dataframes HW Solution Code Review
A little something to keep you going....-یک نکته برای ادامه...
A little something to keep you going....
Handling Missing Data in Dataframes Code Along Activity-فعالیت همراه با کد رسیدگی به داده های گمشده در Dataframe
Handling Missing Data in Dataframes Code Along Activity
Handling Missing Data in Dataframes HW-تمرین رسیدگی به داده های گمشده در Dataframe
Handling Missing Data in Dataframes HW
Handling Missing Data in Dataframes HW Solution-حل تمرین رسیدگی به داده های گمشده در Dataframe
Handling Missing Data in Dataframes HW Solution
A little something to keep you going....-یک نکته برای ادامه...
A little something to keep you going....
Introduction to Spark MLlib-مقدمه ای بر Spark MLlib
Introduction to Spark MLlib
Introduction to Machine Learning Concept Review-مرور مفاهیم مقدمه ای بر یادگیری ماشین
Introduction to Machine Learning Concept Review
Introduction to Machine Learning Quiz-آزمون مقدمه ای بر یادگیری ماشین
Introduction to Machine Learning Quiz
Introduction to MLlib Concept Review-مرور مفاهیم MLlib
Introduction to MLlib Concept Review
Model Selection and Tuning in MLlib Concept Review-مرور مفاهیم انتخاب و تنظیم مدل در MLlib
Model Selection and Tuning in MLlib Concept Review
Model Selection and Tuning in MLlib Quiz-آزمون انتخاب و تنظیم مدل در MLlib
Model Selection and Tuning in MLlib Quiz
Two Links to Bookmark-دو لینک برای نشانهگذاری
Two Links to Bookmark
A little something to keep you going....-یک نکته برای ادامه...
A little something to keep you going....
Classification in MLlib-طبقه بندی در MLlib
Classification in MLlib
Introduction to Classification in MLlib Concept Review-مرور مفاهیم مقدمه ای بر طبقه بندی در MLlib
Introduction to Classification in MLlib Concept Review
Classification in MLlib Quiz-آزمون طبقه بندی در MLlib
Classification in MLlib Quiz
A little something to keep you going....-یک نکته برای ادامه...
A little something to keep you going....
Classification in MLlib Code Along Part 1: Data Formatting and Transformations-فعالیت همراه با کد طبقه بندی در MLlib قسمت 1: قالب بندی و تبدیل داده
Classification in MLlib Code Along Part 1: Data Formatting and Transformations
Classification in MLlib Code Review Part 2.0: Train and Evaluate Models [Intro]-مرور کد طبقه بندی در MLlib قسمت 2.0: آموزش و ارزیابی مدلها [معرفی]
Classification in MLlib Code Review Part 2.0: Train and Evaluate Models [Intro]
Classification in MLlib Code Review Part 2.1: Train & Test Models [Logistic]-مرور کد طبقه بندی در MLlib قسمت 2.1: آموزش و تست مدلها [لجستیک]
Classification in MLlib Code Review Part 2.1: Train & Test Models [Logistic]
Classification in MLlib Code Review Part 2.2: Train & Test Models [1 vs Rest]-مرور کد طبقه بندی در MLlib قسمت 2.2: آموزش و تست مدلها [1 در برابر بقیه]
Classification in MLlib Code Review Part 2.2: Train & Test Models [1 vs Rest]
A little something to keep you going....-یک نکته برای ادامه...
A little something to keep you going....
Classification in MLlib Code Review Part 2.3: Train & Test Models[Multilayer PC]-مرور کد طبقه بندی در MLlib قسمت 2.3: آموزش و تست مدلها [شبکه عصبی چندلایه]
Classification in MLlib Code Review Part 2.3: Train & Test Models[Multilayer PC]
Classification in MLlib Code Review Part 2.4: Train & Test Models [Naive Bayes]-مرور کد طبقه بندی در MLlib قسمت 2.4: آموزش و تست مدلها [بیزی ساده]
Classification in MLlib Code Review Part 2.4: Train & Test Models [Naive Bayes]
Classification in MLlib Code Review Part 2.5: Train & Test Models [Linear SVM]-مرور کد طبقه بندی در MLlib قسمت 2.5: آموزش و تست مدلها [SVM خطی]
Classification in MLlib Code Review Part 2.5: Train & Test Models [Linear SVM]
Classification in MLlib Code Review Part 2.6: Train & Test Models[Decision Tree]-مرور کد طبقه بندی در MLlib قسمت 2.6: آموزش و تست مدلها [درخت تصمیم]
Classification in MLlib Code Review Part 2.6: Train & Test Models[Decision Tree]
Classification in MLlib Code Review Part 2.7: Train & Test Models[Random Forest]-مرور کد طبقه بندی در MLlib قسمت 2.7: آموزش و تست مدلها [جنگل تصادفی]
Classification in MLlib Code Review Part 2.7: Train & Test Models[Random Forest]
Classification in MLlib Code Review Part 2.8: Train & Test Models [GBT]-مرور کد طبقه بندی در MLlib قسمت 2.8: آموزش و تست مدلها [درخت تقویت شده گرادیانی]
Classification in MLlib Code Review Part 2.8: Train & Test Models [GBT]
A little something to keep you going....-یک نکته برای ادامه...
A little something to keep you going....
BONUS: Add loop functions to your training and evaluation script-پاداش: اضافه کردن توابع حلقه به اسکریپت آموزش و ارزیابی
BONUS: Add loop functions to your training and evaluation script
BONUS: Leverage MLflow to better track and manage your results-پاداش: استفاده از MLflow برای پیگیری و مدیریت بهتر نتایج
BONUS: Leverage MLflow to better track and manage your results
Natural Language Processing in MLlib-پردازش زبان طبیعی در MLlib
Natural Language Processing in MLlib
Introduction to Natural Language Processing-معرفی پردازش زبان طبیعی
Introduction to Natural Language Processing
Introduction to Natural Language Processing Quiz-آزمون مقدمه ای بر پردازش زبان طبیعی
Introduction to Natural Language Processing Quiz
Natural Language Processing Concept Review [Part 1: Feature Transformers]-مرور مفاهیم پردازش زبان طبیعی [قسمت 1: تبدیلکنندههای ویژگی]
Natural Language Processing Concept Review [Part 1: Feature Transformers]
Natural Language Processing Concept Review [Part 2: Feature Extractors]-مرور مفاهیم پردازش زبان طبیعی [قسمت 2: استخراجکنندههای ویژگی]
Natural Language Processing Concept Review [Part 2: Feature Extractors]
Natural Language Processing Feature Extractors Quiz-آزمون استخراجکنندههای ویژگی پردازش زبان طبیعی
Natural Language Processing Feature Extractors Quiz
A little something to keep you going....-یک نکته برای ادامه...
A little something to keep you going....
Natural Language Processing Code Along Activity Part 1: Data Prep-فعالیت همراه با کد پردازش زبان طبیعی قسمت 1: آماده سازی داده
Natural Language Processing Code Along Activity Part 1: Data Prep
Natural Language Processing Code Along Activity Part 2: Vectorize, Train & Eval-فعالیت همراه با کد پردازش زبان طبیعی قسمت 2: برداریسازی، آموزش و ارزیابی
Natural Language Processing Code Along Activity Part 2: Vectorize, Train & Eval
Natural Language Processing Project-پروژه پردازش زبان طبیعی
Natural Language Processing Project
Natural Language Processing Project Solution-حل پروژه پردازش زبان طبیعی
Natural Language Processing Project Solution
A little something to keep you going....-یک نکته برای ادامه...
A little something to keep you going....
Regression in MLlib-رگرسیون در MLlib
Regression in MLlib
Regression in MLlib Concept Review-مرور مفاهیم رگرسیون در MLlib
Regression in MLlib Concept Review
Regression in PySpark's MLlib-رگرسیون در MLlib پایتون
Regression in PySpark's MLlib
Regression in MLlib Code Review Introduction-مقدمه مرور کد رگرسیون در MLlib
Regression in MLlib Code Review Introduction
Regression in MLlib Code Review Part 1: Data Prep-مرور کد رگرسیون در MLlib قسمت 1: آماده سازی داده
Regression in MLlib Code Review Part 1: Data Prep
Regression in MLlib Code Review Part 2.0: Linear Regression-مرور کد رگرسیون در MLlib قسمت 2.0: رگرسیون خطی
Regression in MLlib Code Review Part 2.0: Linear Regression
A little something to keep you going....-یک نکته برای ادامه...
A little something to keep you going....
Regression in MLlib Code Review Part 2.1: Decision Tree Regression-مرور کد رگرسیون در MLlib قسمت 2.1: رگرسیون درخت تصمیم
Regression in MLlib Code Review Part 2.1: Decision Tree Regression
Regression in MLlib Code Review Part 2.2: Random Forest Regression-مرور کد رگرسیون در MLlib قسمت 2.2: رگرسیون جنگل تصادفی
Regression in MLlib Code Review Part 2.2: Random Forest Regression
Regression in MLlib Code Review Part 2.3: Gradient Boosted Tree Regression-مرور کد رگرسیون در MLlib قسمت 2.3: رگرسیون درخت تقویت شده گرادیانی
Regression in MLlib Code Review Part 2.3: Gradient Boosted Tree Regression
A little something to keep you going....-یک نکته برای ادامه...
A little something to keep you going....
BONUS: Add loop functions to your regression training and evaluation script-پاداش: اضافه کردن توابع حلقه به اسکریپت آموزش و ارزیابی رگرسیون
BONUS: Add loop functions to your regression training and evaluation script
And finally... have FUN with this project and LOVE what you do!-و در نهایت... از این پروژه لذت ببرید و آنچه را که انجام می دهید دوست داشته باشید!
And finally... have FUN with this project and LOVE what you do!
Regression Project Solution Code Along Activity-فعالیت همراه با کد حل پروژه رگرسیون
Regression Project Solution Code Along Activity
Clustering in PySpark-خوشه بندی در PySpark
Clustering in PySpark
Intro to Clustering in MLlib Concept Review-مرور مفاهیم مقدمه ای بر خوشه بندی در MLlib
Intro to Clustering in MLlib Concept Review
K-Means & Bisecting K-Means in MLlib Code Along Activity-فعالیت همراه با کد K-Means و Bisecting K-Means در MLlib
K-Means & Bisecting K-Means in MLlib Code Along Activity
Latent Dirichlet Allocation in MLlib Code Along Activity-فعالیت همراه با کد تخصیص دیریکله نهفته در MLlib
Latent Dirichlet Allocation in MLlib Code Along Activity
A little something to keep you going....-یک نکته برای ادامه...
A little something to keep you going....
Gaussian Mixture Modeling in MLlib Code Along Activity-فعالیت همراه با کد مدلسازی مخلوط گاوسی در MLlib
Gaussian Mixture Modeling in MLlib Code Along Activity
Twitter Project Structured Stream Setup and Implementation-تنظیم و پیاده سازی جریان ساخت یافته پروژه توییتر
Twitter Project Structured Stream Setup and Implementation
Additional Spark Structured Streaming Resources-منابع اضافی جریان ساخت یافته Spark
Additional Spark Structured Streaming Resources
Course Wrap-up-جمع بندی دوره
Course Wrap-up
Closing Remarks-سخنان پایانی
Closing Remarks
Tips for success moving forward-نکاتی برای موفقیت در آینده
Tips for success moving forward
And finally... remember to set your goals HIGH!-و در نهایت... به یاد داشته باشید اهداف خود را بلند تعیین کنید!
And finally... remember to set your goals HIGH!
نمایش نظرات