آموزش Scala برای علوم داده

Scala Essential Training for Data Science

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: نحوه استفاده از Scala - زبان محبوب ترکیبی از طراحی شی گرا و برنامه نویسی کاربردی - را در کار علم داده خود کشف کنید. در این دوره ، با ویژگیهای Scala که برای دانشمندان داده بسیار مفید است ، از جمله توابع سفارشی ، پردازش موازی و برنامه نویسی Spark با Scala آشنا شوید. دن سالیوان با معرفی برنامه نویسان غیر اسکالا دوره را شروع می کند. در مرحله بعدی ، وی نحوه استفاده از SQL را از Scala توضیح داد - مفهومی مخصوصاً مفید برای دانشمندان داده ، زیرا آنها اغلب مجبور به استخراج داده ها از پایگاه داده های رابطه ای هستند. وی سپس سازه های پردازش موازی را در Scala پوشش داده و تکنیک هایی را به اشتراک می گذارد که برای مجموعه داده هایی با اندازه متوسط مفید هستند که می توانند در یک سرور با چند هسته تجزیه و تحلیل شوند.

دان همچنین بر استفاده از Scala با Spark ، یک سیستم عامل پردازش توزیع شده تمرکز دارد. وی ابتدا چگونگی کار با مجموعه داده های توزیع شده انعطاف پذیر (RDD) - ساختار بنیادی داده Spark - را تشریح می کند و سپس نحوه استفاده از Scala با Spark DataFrames ، کلاس جدیدی از ساختار داده را که مخصوص پردازش تحلیلی طراحی شده است ، توضیح می دهد. او دوره را با ارائه خلاصه ای از مزایای استفاده از Scala برای علم داده به پایان می برد.
موضوعات شامل:
  • مزایای Scala برای علم داده
  • انواع داده های مقیاس
  • آرایه ها ، بردارها و دامنه های مقیاس
  • پردازش موازی در مقیاس
  • نگاشت توابع روی مجموعه های موازی
  • چه وقت و چه زمانی از مجموعه های موازی استفاده نکنید
  • استفاده از SQL در مقیاس
  • RDD های Scala و Spark
  • اسکالا و Spark DataFrames
  • ایجاد DataFrames

سرفصل ها و درس ها

مقدمه Introduction

  • خوش آمدی Welcome

  • آنچه باید بدانید What you should know

  • با استفاده از پرونده های تمرینی Using the exercise files

1. آشنایی با Scala 1. Introduction to Scala

  • مزایای استفاده از Scala برای علم داده The advantages of Scala for data science

  • نصب Scala Installing Scala

  • انواع داده های Scala Scala data types

  • مجموعه های Scala Scala collections

  • Scala آرایه ها ، بردارها و دامنه های Scala را تنظیم می کند Scala sets Scala arrays, vectors, and ranges

  • نقشه های اسکالا Scala maps

  • عبارات Scala Scala expressions

  • توابع Scala Scala functions

  • اشیاء Scala Scala objects

2. پردازش موازی در Scala 2. Parallel Processing in Scala

  • مزایای مجموعه های موازی Advantages of parallel collections

  • ایجاد مجموعه های موازی Creating parallel collections

  • توابع نقشه برداری از مجموعه های موازی Mapping functions over parallel collections

  • فیلتر کردن مجموعه های موازی Filtering parallel collections

  • چه موقع و چه زمانی نباید از مجموعه های موازی استفاده کرد When and when not to use parallel collections

3. استفاده از SQL در Scala 3. Using SQL in Scala

  • نصب PostgreSQL Installing PostgreSQL

  • بارگیری داده ها در PostgreSQL Loading data into PostgreSQL

  • اتصال به PostgreSQL Connecting to PostgreSQL

  • پرس و جو با رشته های SQL Querying with SQL strings

  • پرس و جو با بیانیه های آماده شده Querying with prepared statements

  • خلاصه SQL در Scala Summary of SQL in Scala

4. RDD های Scala و Spark 4. Scala and Spark RDDs

  • آشنایی با جرقه Introduction to Spark

  • نصب جرقه Installing Spark

  • شروع کار با RDD های Spark Getting Started with Spark RDDs

  • توابع نقشه برداری از طریق RDD Mapping Functions over RDDs

  • آمار بیش از RDD Statistics over RDDs

  • خلاصه RDD های Scala و Spark Summary of Scala and Spark RDDs

5- Scala و Spark DataFrames 5. Scala and Spark DataFrames

  • ایجاد DataFrames Creating DataFrames

  • گروه بندی و فیلتر کردن در DataFrames Grouping and filtering on DataFrames

  • پیوستن به DataFrames Joining DataFrames

  • کار با پرونده های JSON Working with JSON files

  • خلاصه Scala و Spark DataFrames Summary of Scala and Spark DataFrames

نتیجه Conclusion

  • بررسی Scala برای علم داده Review of Scala for data science

نمایش نظرات

Linkedin (لینکدین)

لینکدین: شبکه اجتماعی حرفه‌ای برای ارتباط و کارآفرینی

لینکدین به عنوان یکی از بزرگترین شبکه‌های اجتماعی حرفه‌ای، به میلیون‌ها افراد در سراسر جهان این امکان را می‌دهد تا ارتباط برقرار کنند، اطلاعات حرفه‌ای خود را به اشتراک بگذارند و فرصت‌های شغلی را کشف کنند. این شبکه اجتماعی به کاربران امکان می‌دهد تا رزومه حرفه‌ای خود را آپدیت کنند، با همکاران، دوستان و همکاران آینده ارتباط برقرار کنند، به انجمن‌ها و گروه‌های حرفه‌ای ملحق شوند و از مقالات و مطالب مرتبط با حوزه کاری خود بهره‌مند شوند.

لینکدین همچنین به کارفرمایان امکان می‌دهد تا به دنبال نیروهای با تجربه و مهارت مورد نیاز خود بگردند و ارتباط برقرار کنند. این شبکه حرفه‌ای به عنوان یک پلتفرم کلیدی برای بهبود دسترسی به فرصت‌های شغلی و گسترش شبکه حرفه‌ای خود، نقش مهمی را ایفا می‌کند. از این رو، لینکدین به عنوان یکی از مهمترین ابزارهای کارآفرینی و توسعه حرفه‌ای در دنیای امروز مورد توجه قرار دارد.

آموزش Scala برای علوم داده
جزییات دوره
1h 51m
35
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
64,232
- از 5
ندارد
دارد
دارد
Dan Sullivan
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Dan Sullivan Dan Sullivan

معمار سازمانی ، کارشناس بزرگ داده دان سالیوان ، دکترای علوم ، یک معمار سازمانی و متخصص داده های بزرگ است.

دان متخصص در معماری داده ، تجزیه و تحلیل ، داده کاوی ، آمار ، مدل سازی داده ها ، داده های بزرگ و رایانش ابری است. علاوه بر این ، او دارای دکترای ژنتیک ، بیوانفورماتیک و زیست محاسباتی است. Dan به طور منظم با Spark ، Oracle ، NoSQL ، MongoDB ، Redis ، R و Python کار می کند. وی تجربه نوشتن گسترده ای در موضوعاتی از جمله رایانش ابری ، داده های بزرگ ، Hadoop و امنیت دارد.