آموزش Tidyverse R

Learning the R Tidyverse

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: R یک زبان برنامه نویسی فوق العاده قدرتمند و پرکاربرد برای تجزیه و تحلیل آماری و علم داده است. "مرتب و منظم" برخی از متنوع ترین بسته های R را جمع آوری می کند: ggplot2 ، dplyr ، tidyr ، readr ، purrr و tibble. بسته ها برای تمیز کردن ، پردازش ، مدل سازی و تجسم داده ها هماهنگ عمل می کنند.

این دوره در مقایسه با پایه سنتی R. مفاهیم اصلی متنوع و متنوعی را معرفی می کند. این کار بر روی کاربر تازه کار و افرادی که با اپراتور لوله (٪)) آشنا نیستند تمرکز دارد. پس از پوشش این اصول R ، مربی مارتین هادلی به وارد کردن و فیلتر کردن داده ها از فایل های Excel ، CSV و SPSS و خلاصه سازی و جدول بندی داده ها در مقیاس کوچک می پردازد. سپس بیاموزید که چگونه داده ها را بیش از حد گسترده یا طولانی تشخیص دهید و در صورت لزوم آنها را تبدیل کنید و ارزیابی غیر استاندارد انجام دهید. در پایان دوره ، شما باید بتوانید ریز متنوع را در جریان کار R خود ادغام کنید و از انواع ابزارهای جدید برای وارد کردن ، فیلتر کردن ، تجسم و مدل سازی داده های آماری و تحقیق استفاده کنید.
موضوعات شامل:
  • شناخت عملگر لوله (٪٪)
  • وارد کردن پرونده های .xlsx و .csv
  • فیلتر کردن و جمع بندی مجموعه داده ها
  • استفاده از tidyr برای تبدیل مجموعه داده های گسترده و طولانی
  • ارزیابی و برنامه نویسی غیراستاندارد با ریز و درشت

سرفصل ها و درس ها

مقدمه Introduction

  • خوش آمدی Welcome

  • آنچه باید بدانید What you should know

  • فایل های تمرینی Exercise files

1. شروع به کار با tidyverse 1. Getting Started with the tidyverse

  • مرتب چیست؟ What is the tidyverse?

  • چرا از Tidyverse استفاده می کنیم؟ Why use the tidyverse?

  • نقاط قوت Strengths of the tidyverse

  • R و RStudio را برای Tidyverse تنظیم کنید Set up R and RStudio for the tidyverse

  • مرتب نگه دارید Maintain the tidyverse

  • از مشکلات مربوط به plyr و dplyr جلوگیری کنید Prevent issues with plyr and dplyr

2. مرتب بودن با پروژه های RStudio 2. Being Tidy with RStudio Projects

  • چرا باید از پروژه هایی در RStudio استفاده کنید؟ Why should you use projects in RStudio?

  • صرفه جویی در خودکار خودکار RData را برای تکرارپذیری غیرفعال کنید Disable auto-saving of RData for reproducibility

  • ایجاد یک پروژه جدید Create a new project

3. معرفی عامل>٪>٪ 3. Introducing the %>% Operator

  • اپراتور٪>٪ چیست؟ What is the %>% operator?

  • مشخص کنید که در کجا از٪٪ استفاده کنید Identify where to use %>%

  • اهمیت٪>٪ Signficance of %>%

  • گزینه های جایگزین برای٪>٪ Alternate options to %>%

4- وارد کردن ، اصلاح و فیلتر کردن داده ها 4. Importing, Modifying, and Filtering Data

  • پوشه های داده خام و تمیز را جدا کنید Separate raw and clean data folders

  • پرونده های Xlsx را با readxl در R وارد کنید Import .xlsx files with readxl in R

  • پرونده های CSV را با خواننده به R وارد کنید Import .csv files with readr into R

  • آیا این یک فریم داده است یا یک tibble؟ Is it a data frame or a tibble?

  • داده ها را انتخاب و فیلتر کنید Select and filter data

  • رشته ها را با جهش به تاریخ تبدیل کنید Convert strings to dates with mutate

  • جدا کردن ستون ها در چند ستون Separating columns into multiple columns

  • مقادیر NA را فیلتر کنید Filter out NA values

  • فایلهای CSV را با خواننده صادر کنید Export .csv files with readr

  • بعداً اشیاء .rdata را صادر کنید Export .rdata objects for later

5. جمع بندی و جدول بندی داده ها به صورت مرتب 5. Summarizing and Tabulating Data in the tidyverse

  • داده های نمونه و اعتبارسنجی متقابل با dplyr Sample data and cross-validation with dplyr

  • دسته بندی داده ها با گروه_بی Categorizing data with group_by

  • تعداد اعضای زیر گروه را در گروههایی با n () قرار دهید Count members of subgroups within groups with n()

  • مبالغ تجمعی و بیشتر: cumsum، cumall، and cumuman Cumulative sums and more: cumsum, cumall, and cumany

  • خلاصه های گروهی ایجاد کنید Create group summaries

  • به یاد داشته باشید که قبل از حرکت ، گروه را گروه بندی نکنید Remember to ungroup before moving on

6. داده های گسترده و طولانی 6. Wide and Long Data

  • شناسایی داده ها گسترده یا طولانی است Identify if data is wide or long

  • مزایای داده های طولانی (یا مرتب) The benefits of long (or tidy) data

  • داده ها را از گسترده به طولانی تبدیل کنید Convert data from wide to long

  • داده ها را از طولانی به گسترده تبدیل کنید Convert data from long to wide

7. ارزیابی () ، Select_ () ، !!! ، و ارزیابی غیر استاندارد را انتخاب کنید 7. select(), select_(), !!!, and Non-Standard Evaluation

  • ارزیابی و برنامه نویسی غیر استاندارد با tidyverse Non-standard evaluation and programming with the tidyverse

  • مقایسه گروه_بی و گروه_بی_ Compare group_by and group_by_

  • ارزیابی مرتب ، وضع موجود و !! Tidy evaluation, quo, and !!

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

آموزش Tidyverse R
جزییات دوره
3h 44m
40
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
102,225
- از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Charlie Joey Hadley Charlie Joey Hadley

مبشر فناوری و داده های باز

شارلوت جوی هدلی مبشر فناوری و داده های باز است.

چارلی از سال 2015، زمانی که شروع به کار کرد، در R and Shiny تدریس و مشاوره می کند. به عنوان RSE در دانشگاه آکسفورد و شبکه داده های تعاملی دانشگاه را تأسیس کرد که از محققان در دسترسی بیشتر به داده های باز از طریق تعامل پشتیبانی می کند. پیشینه چارلی در فیزیک است و او قبلا برای تحقیقات Wolfram مشاوره می کرد، اما اکنون او بیشتر مهارت های حل مسئله کدنویسی را آموزش می دهد و مدت زیادی است که معادله دیفرانسیل را لمس نکرده است.