آموزش درگیری داده ها در R

Data Wrangling in R

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: Tidy data فرمت داده ای است که راهی استاندارد برای سازماندهی مقادیر داده در یک مجموعه داده فراهم می کند. با استفاده از اصول منظم داده ها ، آمار شناسان ، تحلیلگران و دانشمندان داده می توانند زمان کمتری را برای تمیز کردن داده ها و زمان بیشتری را برای حل جنبه های جذاب تر تجزیه و تحلیل داده ها صرف کنند. در این دوره ، با اصول داده های مرتب آشنا شوید ، و نحوه ایجاد و دستکاری tibbles داده را کشف کنید - آنها را از داده های منبع به قالب های مرتب تبدیل کنید. مربی ، مایک چاپل ، از زبان برنامه نویسی R و بسته های متنوع برای آموزش مفهوم درگیری داده ها - وظایف تمیز کردن داده ها و تبدیل داده ها که بخش قابل توجهی از وقت تحلیل گران را مصرف می کند ، استفاده می کند. وی با سه مورد موردی عملی همراه است که به تقویت اصول درگیری داده ها و تاکتیک های ارائه شده در این دوره کمک می کند.
موضوعات شامل:
  • اطلاعات مرتب چیست؟
  • استفاده از مرتب و منظم
  • کار با ماساژ
  • جایگزینی و فیلتر کردن حواشی
  • وارد کردن داده ها به R
  • طولانی کردن مجموعه های داده گسترده با جمع آوری ()
  • ایجاد مجموعه داده های طولانی با گسترش ()
  • تبدیل انواع داده در R
  • شناسایی دورریزها
  • دستکاری رشته ها در R با stringr

سرفصل ها و درس ها

مقدمه Introduction

  • خوش آمدی Welcome

  • چه چیزی میخواهید بدانید What you need to know

  • با استفاده از پرونده های تمرینی Using the exercise files

1. داده مرتب 1. Tidy Data

  • داده های مرتب چیست؟ What is tidy data?

  • متغیرها ، مشاهدات و مقادیر Variables, observations, and values

  • مشکلات داده رایج Common data problems

  • با استفاده از Tidyverse Using the tidyverse

2. کار با Tibbles 2. Working with Tibbles

  • ساخت و چاپ تیبل Building and printing tibbles

  • زیر مجموعه کردن نوارها Subsetting tibbles

  • فیلتر کردن نوارها Filtering tibbles

3. وارد کردن داده به R 3. Importing Data into R

  • پرونده های CSV چیست؟ What are CSV files?

  • وارد کردن پرونده های CSV به R Importing CSV files into R

  • پرونده های TSV چیست؟ What are TSV files?

  • وارد کردن پرونده های TSV به R Importing TSV files into R

  • وارد کردن پرونده های محدود در R Importing delimited files into R

  • وارد کردن پرونده های با عرض ثابت به R Importing fixed-width files into R

  • وارد کردن پرونده های اکسل به R Importing Excel files into R

  • خواندن داده ها از پایگاه داده ها و وب Reading data from databases and the web

4- انتقال داده 4. Data Transformation

  • گسترده در مقابل مجموعه داده های طولانی Wide vs. long datasets

  • طولانی ساختن مجموعه داده های گسترده با جمع آوری () Making wide datasets long with gather()

  • گسترده بودن مجموعه داده های طولانی با گسترش () Making long datasets wide with spread()

  • تبدیل انواع داده در R Converting data types in R

  • کار با تاریخ و زمان در R Working with dates and times in R

5. تمیز کردن داده ها 5. Data Cleaning

  • شناسایی محل های دوردست Detecting outliers

  • مقادیر گمشده و ارزشهای ویژه در R Missing and special values in R

  • شکستن ستون های جداگانه () Breaking apart columns with separate()

  • ترکیب ستون ها با متحد () Combining columns with unite()

  • دستکاری رشته ها در R با stringr Manipulating strings in R with stringr

6. مطالعه موردی ویرایش داده ها: مصرف زغال سنگ 6. Data Wrangling Case Study: Coal Consumption

  • درک مجموعه داده های ذغال سنگ Understanding the coal dataset

  • خواندن در مجموعه داده های ذغال سنگ Reading in the coal dataset

  • تبدیل مجموعه داده ذغال سنگ از طولانی به پهنای آن Converting the coal dataset from long to wide

  • تقسیم بندی مجموعه داده های ذغال سنگ Segmenting the coal dataset

  • تجسم مجموعه داده ذغال سنگ Visualizing the coal dataset

7. مطالعه موردی در مورد اختلافات داده: کیفیت آب 7. Data Wrangling Case Study: Water Quality

  • درک مجموعه داده های کیفیت آب Understanding the water quality dataset

  • خواندن در مجموعه داده های کیفیت آب Reading in the water quality dataset

  • فیلتر مجموعه داده های کیفیت آب Filtering the water quality dataset

  • انواع داده های کیفیت آب Water quality data types

  • تصحیح خطاهای ورود داده Correcting data entry errors

  • شناسایی و از بین بردن جبهه ها Identifying and removing outliers

  • تبدیل دما از فارنهایت به سانتیگراد Converting temperature from Fahrenheit to Celsius

  • گسترده کردن مجموعه داده کیفیت آب Widening the water quality dataset

8. مطالعه موردی در مورد اختلافات داده: مطالبات معلولیت تأمین اجتماعی 8. Data Wrangling Case Study: Social Security Disability Claims

  • درک مجموعه داده های معلولیت تأمین اجتماعی Understanding the Social Security Disability dataset

  • وارد کردن مجموعه داده معلولیت تأمین اجتماعی Importing the Social Security Disability dataset

  • طولانی ساختن مجموعه داده های معلولیت تأمین اجتماعی Making the Social Security Disability dataset long

  • قالب بندی تاریخ ها در مجموعه داده های معلولیت تأمین اجتماعی Formatting dates in the Social Security Disability dataset

  • رسیدگی به سال مالی در مجموعه داده های معلولیت تأمین اجتماعی Handling fiscal years in the Social Security Disability dataset

  • گسترده کردن مجموعه داده های معلولیت تأمین اجتماعی Widening the Social Security Disability dataset

  • تجسم مجموعه داده های معلولیت تأمین اجتماعی Visualizing the Social Security Disability dataset

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

آموزش درگیری داده ها در R
جزییات دوره
4h 12m
49
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
155,430
- از 5
ندارد
دارد
دارد
Mike Chapple
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Mike Chapple Mike Chapple

استاد تدریس در دانشگاه نوتردام

مایک چاپل استاد تدریس فناوری اطلاعات، تجزیه و تحلیل و عملیات در کالج تجارت مندوزا در دانشگاه نوتردام است.



br>در سمت قبلی خود به عنوان مدیر ارشد ارائه خدمات فناوری اطلاعات در دانشگاه نوتردام، او بر امنیت اطلاعات، معماری فناوری اطلاعات، مدیریت پروژه، برنامه ریزی استراتژیک و عملکردهای انطباق با فناوری اطلاعات برای دفتر فناوری اطلاعات نظارت داشت.

مایک یک متخصص امنیت سایبری و تجزیه و تحلیل با بیش از بیست سال تجربه است. او نویسنده بیش از 30 کتاب، از جمله راهنمای مطالعه رسمی (ISC) 2 CISSP و راهنمای مطالعه Sybex از جان وایلی و پسران است که گواهینامه های Security+، CySA+، PenTest+، CISM و CIPP را پوشش می دهد. دوره های آموزشی LinkedIn او طیف گسترده ای از موضوعات مربوط به امنیت سایبری و تجزیه و تحلیل را پوشش می دهد.

درباره برنامه‌های آموزشی امنیت سایبری Mike در CertMike.com اطلاعات بیشتری کسب کنید.