آموزش برنامه نویسی R در علم داده: داده های با حجم زیاد

R Programming in Data Science: High Volume Data

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: داده ها تمام فضای موجود را پر می کند و اکنون که فضای ذخیره سازی ارزان است ، مقدار داده ها منفجر شده است. با این حال ، تمام این اطلاعات بدون تجزیه و تحلیل و زمینه بی فایده است. زبان برنامه نویسی R برای سهولت در تجزیه و تحلیل و تجسم حجم عظیم داده ها طراحی شده است. به عنوان مثال ، R توانایی ضرب یک بلوک از متغیرها در دیگری را فراهم می کند - فرضیه ای که مزایای ذاتی را نسبت به زبانهای دیگر فراهم می کند. این دوره نشان می دهد که چرا R برای حجم بالای داده ایده آل است ، روشهای کارآمدتری برای استفاده از زبان معرفی می کند و نحوه جلوگیری از مشکلات و استفاده از فرصتهای داده های بزرگ را توضیح می دهد. بیاموزید که چگونه تعیین کنید که آیا حافظه و قدرت پردازش کافی دارید ، تجسم داده های بزرگ را ایجاد می کنید ، کد R خود را بهینه می کنید و برای سرعت بخشیدن به محاسبات خود از تکنیک های پیشرفته مانند پردازش موازی استفاده می کنید. به علاوه ، چگونگی ادغام R با راه حل های کلان داده مانند پایگاه های داده SQL و Apache Spark را کشف کنید.
موضوعات شامل:
  • دسترسی به حافظه و قدرت پردازش
  • تجسم داده های با حجم زیاد
  • پروفایل و بهینه سازی کد R
  • گردآوری توابع R
  • پردازش موازی با R
  • استفاده از R با سایر راه حل های داده های بزرگ

سرفصل ها و درس ها

مقدمه Introduction

  • داده های با حجم بالا با R اشتباه می شوند Wrangling high-volume data with R

  • مجموعه داده های نمونه Sample data set

1. مشکلات و فرصت ها با داده های پر حجم 1. Problems and Opportunities with High-Volume Data

  • چشم انداز داده های با حجم بالا Perspectives on high-volume data

  • داده های بزرگ و حافظه موجود Big data and available memory

  • کد: پیدا کردن حافظه موجود Code: Finding available memory

  • چرخه داده های بزرگ و پردازنده Big data and CPU cycles

  • کد: کامپیوتر شما چقدر سریع است؟ Code: How fast is your computer?

2. تجسم داده های با حجم بالا 2. Visualizing High-Volume Data

  • داده ها و تصاویر با حجم بالا High-volume data and visualizations

  • کد: نمودارهایی برای داده های با حجم بالا Code: Graphs for high-volume data

  • کد: فرش () و تند () Code: rug() and jitter()

  • کد: اعمال آمار در توطئه ها Code: Applying statistics to plots

  • کد: نمودارهای نمونه برای داده های با حجم بالا Code: Subsampled graphs for high-volume data

  • کد: پیش نمایش داده ها در چندین نمودار Code: Trellising data across multiple charts

3. کار با زبان برنامه نویسی R 3. Working within the R Programming Language

  • ابزار برنامه نویسی R برای داده های با حجم بالا R programming tools for high-volume data

  • نمونه برداری Downsampling

  • کد R پروفایل را برای یافتن ناکارآمدی Profile R code to find inefficiencies

  • کد: مشخصات کد R برای یافتن ناکارآمدی Code: Profile R code to find inefficiencies

  • از مشکل اصلاح کپی با R خودداری کنید Avoid the copy-on-modify problem with R

  • کد: از اصلاح کپی با data.table خودداری کنید Code: Avoid copy-on-modify with data.table

  • بهینه سازی در مقابل خوانایی Optimization versus readability

4- تکنیک های پیشرفته با حجم بالا 4. Advanced High-Volume Techniques

  • توابع R را کامپایل کنید Compile R functions

  • پردازش موازی با R Parallel processing with R

  • کد: توابع R موازی Code: Parallel R functions

  • بسته های bigmemory ، LaF و ff bigmemory, LaF, and ff packages

5- از R با راه حل های بزرگ Big Data استفاده کنید 5. Use R with External Big Data Solutions

  • داده های با حجم بالا را در یک پایگاه داده ذخیره کنید Store high-volume data in a database

  • کد: R با بانکهای اطلاعاتی Code: R with databases

  • ابر رایانه ای با R Cloud computing with R

  • Sparklyr با R Sparklyr with R

  • کد: R با Sparklyr Code: R with Sparklyr

نتیجه Conclusion

  • خلاصه داده های با حجم بالا با R Summary of high-volume data with R

نمایش نظرات

آموزش برنامه نویسی R در علم داده: داده های با حجم زیاد
جزییات دوره
1h 25m
30
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
17,482
- از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Mark Niemann-Ross Mark Niemann-Ross

فن شناس در زمینه سخت افزار ، نرم افزار و داستان های علمی باتجربه است Mark Niemann-Ross یک تکنسین با تجربه در زمینه سخت افزار ، نرم افزار و داستان های علمی است.

مارک تقریباً 30 سال است که به توسعه دهندگان در پیمایش API ها کمک می کند و مسئولیت برنامه های شخص ثالث را در Quark و Adobe داشته است. وی علاوه بر فناوری عملی ، در زمینه آموزش فن آوری نیز مشارکت داشته است ، از دیپلم آموزش صنعتی شروع کرده و اخیراً به عنوان مدیر محتوا برای آموزش LinkedIn کار کرده است.

داستان علمی تخیلی مارک اخیراً در علمی تخیلی و واقعیت آنالوگ . او در حال حاضر مشغول کار بر روی یک رمز و راز قتل است که توسط یخچال حل شده است.