دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش درگیری داده ها در R - آخرین آپدیت

Data Wrangling in R

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: Tidy data فرمت داده ای است که راهی استاندارد برای سازماندهی مقادیر داده در یک مجموعه داده فراهم می کند. با استفاده از اصول منظم داده ها ، آمار شناسان ، تحلیلگران و دانشمندان داده می توانند زمان کمتری را برای تمیز کردن داده ها و زمان بیشتری را برای حل جنبه های جذاب تر تجزیه و تحلیل داده ها صرف کنند. در این دوره ، با اصول داده های مرتب آشنا شوید ، و نحوه ایجاد و دستکاری tibbles داده را کشف کنید - آنها را از داده های منبع به قالب های مرتب تبدیل کنید. مربی ، مایک چاپل ، از زبان برنامه نویسی R و بسته های متنوع برای آموزش مفهوم درگیری داده ها - وظایف تمیز کردن داده ها و تبدیل داده ها که بخش قابل توجهی از وقت تحلیل گران را مصرف می کند ، استفاده می کند. وی با سه مورد موردی عملی همراه است که به تقویت اصول درگیری داده ها و تاکتیک های ارائه شده در این دوره کمک می کند.

موضوعات شامل:

اطلاعات مرتب چیست؟
استفاده از مرتب و منظم
کار با ماساژ
جایگزینی و فیلتر کردن حواشی
وارد کردن داده ها به R
طولانی کردن مجموعه های داده گسترده با جمع آوری ()
ایجاد مجموعه داده های طولانی با گسترش ()
تبدیل انواع داده در R
شناسایی دورریزها
دستکاری رشته ها در R با stringr

سرفصل ها و درس ها

مقدمه Introduction

خوش آمدی Welcome
چه چیزی میخواهید بدانید What you need to know
با استفاده از پرونده های تمرینی Using the exercise files

1. داده مرتب 1. Tidy Data

داده های مرتب چیست؟ What is tidy data?
متغیرها ، مشاهدات و مقادیر Variables, observations, and values
مشکلات داده رایج Common data problems
با استفاده از Tidyverse Using the tidyverse

2. کار با Tibbles 2. Working with Tibbles

ساخت و چاپ تیبل Building and printing tibbles
زیر مجموعه کردن نوارها Subsetting tibbles
فیلتر کردن نوارها Filtering tibbles

3. وارد کردن داده به R 3. Importing Data into R

پرونده های CSV چیست؟ What are CSV files?
وارد کردن پرونده های CSV به R Importing CSV files into R
پرونده های TSV چیست؟ What are TSV files?
وارد کردن پرونده های TSV به R Importing TSV files into R
وارد کردن پرونده های محدود در R Importing delimited files into R
وارد کردن پرونده های با عرض ثابت به R Importing fixed-width files into R
وارد کردن پرونده های اکسل به R Importing Excel files into R
خواندن داده ها از پایگاه داده ها و وب Reading data from databases and the web

4- انتقال داده 4. Data Transformation

گسترده در مقابل مجموعه داده های طولانی Wide vs. long datasets
طولانی ساختن مجموعه داده های گسترده با جمع آوری () Making wide datasets long with gather()
گسترده بودن مجموعه داده های طولانی با گسترش () Making long datasets wide with spread()
تبدیل انواع داده در R Converting data types in R
کار با تاریخ و زمان در R Working with dates and times in R

5. تمیز کردن داده ها 5. Data Cleaning

شناسایی محل های دوردست Detecting outliers
مقادیر گمشده و ارزشهای ویژه در R Missing and special values in R
شکستن ستون های جداگانه () Breaking apart columns with separate()
ترکیب ستون ها با متحد () Combining columns with unite()
دستکاری رشته ها در R با stringr Manipulating strings in R with stringr

6. مطالعه موردی ویرایش داده ها: مصرف زغال سنگ 6. Data Wrangling Case Study: Coal Consumption

درک مجموعه داده های ذغال سنگ Understanding the coal dataset
خواندن در مجموعه داده های ذغال سنگ Reading in the coal dataset
تبدیل مجموعه داده ذغال سنگ از طولانی به پهنای آن Converting the coal dataset from long to wide
تقسیم بندی مجموعه داده های ذغال سنگ Segmenting the coal dataset
تجسم مجموعه داده ذغال سنگ Visualizing the coal dataset

7. مطالعه موردی در مورد اختلافات داده: کیفیت آب 7. Data Wrangling Case Study: Water Quality

درک مجموعه داده های کیفیت آب Understanding the water quality dataset
خواندن در مجموعه داده های کیفیت آب Reading in the water quality dataset
فیلتر مجموعه داده های کیفیت آب Filtering the water quality dataset
انواع داده های کیفیت آب Water quality data types
تصحیح خطاهای ورود داده Correcting data entry errors
شناسایی و از بین بردن جبهه ها Identifying and removing outliers
تبدیل دما از فارنهایت به سانتیگراد Converting temperature from Fahrenheit to Celsius
گسترده کردن مجموعه داده کیفیت آب Widening the water quality dataset

8. مطالعه موردی در مورد اختلافات داده: مطالبات معلولیت تأمین اجتماعی 8. Data Wrangling Case Study: Social Security Disability Claims

درک مجموعه داده های معلولیت تأمین اجتماعی Understanding the Social Security Disability dataset
وارد کردن مجموعه داده معلولیت تأمین اجتماعی Importing the Social Security Disability dataset
طولانی ساختن مجموعه داده های معلولیت تأمین اجتماعی Making the Social Security Disability dataset long
قالب بندی تاریخ ها در مجموعه داده های معلولیت تأمین اجتماعی Formatting dates in the Social Security Disability dataset
رسیدگی به سال مالی در مجموعه داده های معلولیت تأمین اجتماعی Handling fiscal years in the Social Security Disability dataset
گسترده کردن مجموعه داده های معلولیت تأمین اجتماعی Widening the Social Security Disability dataset
تجسم مجموعه داده های معلولیت تأمین اجتماعی Visualizing the Social Security Disability dataset

نتیجه Conclusion

مراحل بعدی Next steps

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

جزییات دوره

زمان دوره: 4h 12m

تعداد ویدیو ها: 49

شرکت: Linkedin (لینکدین)

تاریخ انتشار مرجع: (آخرین آپدیت)

بازدید مرجع : 155,430

امتیاز مرجع: - از 5

فایل تمرین: ندارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Mike Chapple

لینک کوتاه این دوره

https://donyad.com/d/88be

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Mike Chapple

استاد تدریس در دانشگاه نوتردام

مایک چاپل استاد تدریس فناوری اطلاعات، تجزیه و تحلیل و عملیات در کالج تجارت مندوزا در دانشگاه نوتردام است.

br>در سمت قبلی خود به عنوان مدیر ارشد ارائه خدمات فناوری اطلاعات در دانشگاه نوتردام، او بر امنیت اطلاعات، معماری فناوری اطلاعات، مدیریت پروژه، برنامه ریزی استراتژیک و عملکردهای انطباق با فناوری اطلاعات برای دفتر فناوری اطلاعات نظارت داشت.

مایک یک متخصص امنیت سایبری و تجزیه و تحلیل با بیش از بیست سال تجربه است. او نویسنده بیش از 30 کتاب، از جمله راهنمای مطالعه رسمی (ISC) 2 CISSP و راهنمای مطالعه Sybex از جان وایلی و پسران است که گواهینامه های Security+، CySA+، PenTest+، CISM و CIPP را پوشش می دهد. دوره های آموزشی LinkedIn او طیف گسترده ای از موضوعات مربوط به امنیت سایبری و تجزیه و تحلیل را پوشش می دهد.

درباره برنامه‌های آموزشی امنیت سایبری Mike در CertMike.com اطلاعات بیشتری کسب کنید.

RStudio R Big Data IT داده های بزرگ

آموزش درگیری داده ها در R - آخرین آپدیت

Data Wrangling in R

مقدمه Introduction

خوش آمدی Welcome

چه چیزی میخواهید بدانید What you need to know

با استفاده از پرونده های تمرینی Using the exercise files

1. داده مرتب 1. Tidy Data

داده های مرتب چیست؟ What is tidy data?

متغیرها ، مشاهدات و مقادیر Variables, observations, and values

مشکلات داده رایج Common data problems

با استفاده از Tidyverse Using the tidyverse

2. کار با Tibbles 2. Working with Tibbles

ساخت و چاپ تیبل Building and printing tibbles

زیر مجموعه کردن نوارها Subsetting tibbles

فیلتر کردن نوارها Filtering tibbles

3. وارد کردن داده به R 3. Importing Data into R

پرونده های CSV چیست؟ What are CSV files?

وارد کردن پرونده های CSV به R Importing CSV files into R

پرونده های TSV چیست؟ What are TSV files?

وارد کردن پرونده های TSV به R Importing TSV files into R

وارد کردن پرونده های محدود در R Importing delimited files into R

وارد کردن پرونده های با عرض ثابت به R Importing fixed-width files into R

وارد کردن پرونده های اکسل به R Importing Excel files into R

خواندن داده ها از پایگاه داده ها و وب Reading data from databases and the web

4- انتقال داده 4. Data Transformation

گسترده در مقابل مجموعه داده های طولانی Wide vs. long datasets

طولانی ساختن مجموعه داده های گسترده با جمع آوری () Making wide datasets long with gather()

گسترده بودن مجموعه داده های طولانی با گسترش () Making long datasets wide with spread()

تبدیل انواع داده در R Converting data types in R

کار با تاریخ و زمان در R Working with dates and times in R

5. تمیز کردن داده ها 5. Data Cleaning

شناسایی محل های دوردست Detecting outliers

مقادیر گمشده و ارزشهای ویژه در R Missing and special values in R

شکستن ستون های جداگانه () Breaking apart columns with separate()

ترکیب ستون ها با متحد () Combining columns with unite()

دستکاری رشته ها در R با stringr Manipulating strings in R with stringr

6. مطالعه موردی ویرایش داده ها: مصرف زغال سنگ 6. Data Wrangling Case Study: Coal Consumption

درک مجموعه داده های ذغال سنگ Understanding the coal dataset

خواندن در مجموعه داده های ذغال سنگ Reading in the coal dataset

تبدیل مجموعه داده ذغال سنگ از طولانی به پهنای آن Converting the coal dataset from long to wide

تقسیم بندی مجموعه داده های ذغال سنگ Segmenting the coal dataset

تجسم مجموعه داده ذغال سنگ Visualizing the coal dataset

7. مطالعه موردی در مورد اختلافات داده: کیفیت آب 7. Data Wrangling Case Study: Water Quality

درک مجموعه داده های کیفیت آب Understanding the water quality dataset

خواندن در مجموعه داده های کیفیت آب Reading in the water quality dataset

فیلتر مجموعه داده های کیفیت آب Filtering the water quality dataset

انواع داده های کیفیت آب Water quality data types

تصحیح خطاهای ورود داده Correcting data entry errors

شناسایی و از بین بردن جبهه ها Identifying and removing outliers

تبدیل دما از فارنهایت به سانتیگراد Converting temperature from Fahrenheit to Celsius

گسترده کردن مجموعه داده کیفیت آب Widening the water quality dataset

8. مطالعه موردی در مورد اختلافات داده: مطالبات معلولیت تأمین اجتماعی 8. Data Wrangling Case Study: Social Security Disability Claims

درک مجموعه داده های معلولیت تأمین اجتماعی Understanding the Social Security Disability dataset

وارد کردن مجموعه داده معلولیت تأمین اجتماعی Importing the Social Security Disability dataset

طولانی ساختن مجموعه داده های معلولیت تأمین اجتماعی Making the Social Security Disability dataset long

قالب بندی تاریخ ها در مجموعه داده های معلولیت تأمین اجتماعی Formatting dates in the Social Security Disability dataset

رسیدگی به سال مالی در مجموعه داده های معلولیت تأمین اجتماعی Handling fiscal years in the Social Security Disability dataset

گسترده کردن مجموعه داده های معلولیت تأمین اجتماعی Widening the Social Security Disability dataset

تجسم مجموعه داده های معلولیت تأمین اجتماعی Visualizing the Social Security Disability dataset

نتیجه Conclusion

مراحل بعدی Next steps

نمایش نظرات

https://donyad.com/d/88be