آموزش PySpark برای علوم داده - پیشرفته
1h 12m
9
Udemy
10 تیر 1400
14,176
از 5
دارد (اگر در سایت مرجع باشد، قرارداده می شود.)
معمولا دارد
معمولا دارد (در صورت درخواست)
Ganesh D

https://donyad.com/d/cf63

آموزش PySpark برای علوم داده - پیشرفته

PySpark for Data Science - Advanced

سرفصل ها و درس ها | نظرات

توضیحات دوره: درباره نحوه استفاده از PySpark برای انجام تجزیه و تحلیل داده ها ، تجزیه و تحلیل RFM و استخراج متن بیاموزید

آنچه خواهید آموخت

  • مهارت های مربوط به توسعه ، کلان داده ها و اکوسیستم Hadoop و دانش مفاهیم Hadoop و تجزیه و تحلیل مهارت های ملموسی است که می توانید از این آموزشهای PySpark بیاموزید.
  • همچنین یاد خواهید گرفت که چگونه برنامه نویسی موازی و محاسبه حافظه انجام می شود
  • فراگیری فرکانس تقسیم بندی پولی (RFM) را بیاموزید. تجزیه و تحلیل RFM به طور معمول برای شناسایی گروه های برجسته مشتری استفاده می شود ، همچنین باید به خوشه بندی K-means نیز توجه کنیم. مورد بعدی در این آموزشهای PySpark ، یادگیری متن کاوی و استفاده از شبیه سازی Monte Carlo از ابتدا است.

این ماژول در بخش آموزش PySpark به شما کمک می کند تا با برخی مفاهیم پیشرفته PySpark آشنا شوید. در بخش اول این آموزشهای پیشرفته ، ما یک Recension Frequency Mongmenting Monetary (RFM) را انجام خواهیم داد. تجزیه و تحلیل RFM به طور معمول برای شناسایی گروه های برجسته مشتری استفاده می شود ، همچنین باید به خوشه بندی K-means نیز توجه کنیم. مورد بعدی در این آموزشهای PySpark یادگیری متن کاوی و استفاده از شبیه سازی Monte Carlo از ابتدا است.

Pyspark یک راه حل بزرگ داده است که برای پخش همزمان با استفاده از زبان برنامه نویسی Python قابل استفاده است و روشی بهتر و کارآمد برای انجام انواع محاسبات و محاسبات را فراهم می کند. همچنین احتمالاً بهترین راه حل در بازار است زیرا قابلیت همکاری دارد یعنی Pyspark به راحتی می تواند همراه با سایر فناوری ها و سایر اجزای کل خط لوله مدیریت شود. تکنیک های داده بزرگ قبلی و Hadoop شامل تکنیک های پردازش زمان دسته ای بودند.

Pyspark یک برنامه منبع باز است که در آن تمام پایگاه کد در Python نوشته شده است که برای انجام بیشتر تمام عملیات یادگیری ماشین و فشرده استفاده می شود. به طور گسترده ای مورد استفاده قرار گرفته و در صنعت رواج یافته است و بنابراین می توان Pyspark را جایگزین سایر م componentsلفه های مبتنی بر جرقه مانند م workingلفه هایی که با Java یا Scala کار می کنند ، کرد. یک ویژگی منحصر به فرد که همراه با Pyspark وجود دارد ، استفاده از مجموعه داده ها و نه فریم داده ها است زیرا مورد دوم توسط Pyspark ارائه نمی شود. پزشکان به ابزارهای بیشتری احتیاج دارند که اغلب هنگام اطمینان از جریان داده های بی درنگ ، قابل اطمینان تر و سریعتر هستند. ابزارهای قبلی مانند کاهش نقشه از نقشه و مفاهیم کاهش یافته استفاده از نگاشت ها ، سپس زدن یا مرتب سازی و سپس تقلیل آنها به یک موجود واحد استفاده می کردند. این MapReduce راهی برای محاسبه و محاسبه موازی ارائه کرده است. Pyspark از تکنیک های حافظه استفاده می کند که از فضای ذخیره سازی داخل دیسک سخت استفاده نمی کنند. این یک هدف کلی و یک واحد محاسباتی سریعتر را فراهم می کند.

مزایای شغلی این آموزشهای PySpark بسیار زیاد است. Apache spark یکی از جدیدترین فناوری ها و احتمالاً بهترین راه حل در بازار امروز است که به برنامه نویسی و پردازش زمان واقعی می رسد. هنوز تعداد بسیار کمی از افراد هستند که دانش کاملاً خوبی در مورد جرقه Apache و ملزومات آن دارند ، در نتیجه افزایش تقاضا برای منابع بسیار زیاد است در حالی که عرضه بسیار محدود است. اگر قصد دارید در این فناوری شغل خود را شروع کنید ، تصمیمی عاقلانه تر از این نمی تواند باشد. تنها چیزی که باید هنگام انتقال در این فناوری به خاطر بسپارید این است که بیشتر نقش توسعه دارد و بنابراین اگر روش کدگذاری و طرز فکر خوبی دارید ، این آموزشهای PySpark برای شما مناسب است. ما همچنین گواهینامه های بسیاری برای جرقه آپاچی داریم که رزومه شما را افزایش می دهد.

این دوره برای چه کسانی است:

  • مخاطبان این آموزشهای PySpark شامل مواردی مانند توسعه دهندگان ، تحلیلگران ، برنامه نویسان نرم افزار ، مشاوران ، مهندسان داده ، دانشمندان داده ، تحلیلگران داده ها ، مهندسان نرم افزار ، برنامه نویسان Big data ، توسعه دهندگان Hadoop هستند. مخاطبان دیگر شامل افرادی مانند دانشجویان و کارآفرینانی هستند که به دنبال خلق چیزی از خود در فضای کلان داده هستند.


سرفصل ها و درس ها

معرفی Introduction

  • مقدمه ای بر Pyspark Advance Introduction to Pyspark Advance

تحلیل RFM RFM Analysis

  • تحلیل RFM RFM Analysis

  • تحلیل RFM ادامه دارد RFM Analysis Continue

  • خوشه بندی K-Means K-Means Clustering

  • خوشه بندی K-Means ادامه دارد K-Means Clustering Continue

استخراج متن Text Mining

  • تصویر به متن Image to Text

  • PDF به متن PDF to Text

شبیه سازی مونت کارلو Monte Carlo Simulation

  • شبیه سازی مونت کارلو قسمت 1 Monte Carlo Simulation Part 1

  • شبیه سازی مونت کارلو قسمت 2 Monte Carlo Simulation Part 2

نمایش نظرات

نظری ارسال نشده است.

Ganesh D

کارآفرین و مربی من یک کارآفرین و مربی هستم. من از طریق دوره های خود و فیلم های آنلاین به هزاران دانش آموز در چندین موضوع در زمینه های مختلف آموزش داده ام. من 11 سال سابقه مربیگری دارم. من دوست دارم دانش خود را با دانش آموزان در میان بگذارم. در طول سال ها من ایده های تجاری مختلفی از اصول اولیه تا الگوی پیچیده تر را اجرا کرده ام و دانش بزرگی کسب کرده ام که دوست دارم آنها را به اشتراک بگذارم. من چندین ماه را برای آماده سازی دوره هایم صرف می کنم. قدرت من به عنوان یک معلم از توانایی من در تجزیه و تحلیل موضوعات پیچیده به مفاهیم ساده تر ناشی می شود. و توجه من به جزئیات به من کمک می کند تا این مفاهیم را به گونه ای توضیح دهم که برای دانشجویان بسیار قابل دسترسی باشد. من به طور مداوم در حال تحقیق ، مطالعه و آموزش هستم تا مهارت های خود را ارتقا دهم. امیدوارم از دوره های من لذت ببرید