آموزش Scala برای علوم داده

Scala Essential Training for Data Science

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: نحوه استفاده از Scala - زبان محبوب ترکیبی از طراحی شی گرا و برنامه نویسی کاربردی - را در کار علم داده خود کشف کنید. در این دوره ، با ویژگیهای Scala که برای دانشمندان داده بسیار مفید است ، از جمله توابع سفارشی ، پردازش موازی و برنامه نویسی Spark با Scala آشنا شوید. دن سالیوان با معرفی برنامه نویسان غیر اسکالا دوره را شروع می کند. در مرحله بعدی ، وی نحوه استفاده از SQL را از Scala توضیح داد - مفهومی مخصوصاً مفید برای دانشمندان داده ، زیرا آنها اغلب مجبور به استخراج داده ها از پایگاه داده های رابطه ای هستند. وی سپس سازه های پردازش موازی را در Scala پوشش داده و تکنیک هایی را به اشتراک می گذارد که برای مجموعه داده هایی با اندازه متوسط مفید هستند که می توانند در یک سرور با چند هسته تجزیه و تحلیل شوند.

دان همچنین بر استفاده از Scala با Spark ، یک سیستم عامل پردازش توزیع شده تمرکز دارد. وی ابتدا چگونگی کار با مجموعه داده های توزیع شده انعطاف پذیر (RDD) - ساختار بنیادی داده Spark - را تشریح می کند و سپس نحوه استفاده از Scala با Spark DataFrames ، کلاس جدیدی از ساختار داده را که مخصوص پردازش تحلیلی طراحی شده است ، توضیح می دهد. او دوره را با ارائه خلاصه ای از مزایای استفاده از Scala برای علم داده به پایان می برد.
موضوعات شامل:
  • مزایای Scala برای علم داده
  • انواع داده های مقیاس
  • آرایه ها ، بردارها و دامنه های مقیاس
  • پردازش موازی در مقیاس
  • نگاشت توابع روی مجموعه های موازی
  • چه وقت و چه زمانی از مجموعه های موازی استفاده نکنید
  • استفاده از SQL در مقیاس
  • RDD های Scala و Spark
  • اسکالا و Spark DataFrames
  • ایجاد DataFrames

سرفصل ها و درس ها

مقدمه Introduction

  • خوش آمدی Welcome

  • آنچه باید بدانید What you should know

  • با استفاده از پرونده های تمرینی Using the exercise files

1. آشنایی با Scala 1. Introduction to Scala

  • مزایای استفاده از Scala برای علم داده The advantages of Scala for data science

  • نصب Scala Installing Scala

  • انواع داده های Scala Scala data types

  • مجموعه های Scala Scala collections

  • Scala آرایه ها ، بردارها و دامنه های Scala را تنظیم می کند Scala sets Scala arrays, vectors, and ranges

  • نقشه های اسکالا Scala maps

  • عبارات Scala Scala expressions

  • توابع Scala Scala functions

  • اشیاء Scala Scala objects

2. پردازش موازی در Scala 2. Parallel Processing in Scala

  • مزایای مجموعه های موازی Advantages of parallel collections

  • ایجاد مجموعه های موازی Creating parallel collections

  • توابع نقشه برداری از مجموعه های موازی Mapping functions over parallel collections

  • فیلتر کردن مجموعه های موازی Filtering parallel collections

  • چه موقع و چه زمانی نباید از مجموعه های موازی استفاده کرد When and when not to use parallel collections

3. استفاده از SQL در Scala 3. Using SQL in Scala

  • نصب PostgreSQL Installing PostgreSQL

  • بارگیری داده ها در PostgreSQL Loading data into PostgreSQL

  • اتصال به PostgreSQL Connecting to PostgreSQL

  • پرس و جو با رشته های SQL Querying with SQL strings

  • پرس و جو با بیانیه های آماده شده Querying with prepared statements

  • خلاصه SQL در Scala Summary of SQL in Scala

4. RDD های Scala و Spark 4. Scala and Spark RDDs

  • آشنایی با جرقه Introduction to Spark

  • نصب جرقه Installing Spark

  • شروع کار با RDD های Spark Getting Started with Spark RDDs

  • توابع نقشه برداری از طریق RDD Mapping Functions over RDDs

  • آمار بیش از RDD Statistics over RDDs

  • خلاصه RDD های Scala و Spark Summary of Scala and Spark RDDs

5- Scala و Spark DataFrames 5. Scala and Spark DataFrames

  • ایجاد DataFrames Creating DataFrames

  • گروه بندی و فیلتر کردن در DataFrames Grouping and filtering on DataFrames

  • پیوستن به DataFrames Joining DataFrames

  • کار با پرونده های JSON Working with JSON files

  • خلاصه Scala و Spark DataFrames Summary of Scala and Spark DataFrames

نتیجه Conclusion

  • بررسی Scala برای علم داده Review of Scala for data science

نمایش نظرات

آموزش Scala برای علوم داده
جزییات دوره
1h 51m
35
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
64,232
- از 5
ندارد
دارد
دارد
Dan Sullivan
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Dan Sullivan Dan Sullivan

معمار سازمانی ، کارشناس بزرگ داده دان سالیوان ، دکترای علوم ، یک معمار سازمانی و متخصص داده های بزرگ است.

دان متخصص در معماری داده ، تجزیه و تحلیل ، داده کاوی ، آمار ، مدل سازی داده ها ، داده های بزرگ و رایانش ابری است. علاوه بر این ، او دارای دکترای ژنتیک ، بیوانفورماتیک و زیست محاسباتی است. Dan به طور منظم با Spark ، Oracle ، NoSQL ، MongoDB ، Redis ، R و Python کار می کند. وی تجربه نوشتن گسترده ای در موضوعاتی از جمله رایانش ابری ، داده های بزرگ ، Hadoop و امنیت دارد.