🔔 با توجه به بهبود نسبی اینترنت، آمادهسازی دورهها آغاز شده است. به دلیل تداوم برخی اختلالات، بارگذاری دورهها ممکن است با کمی تأخیر انجام شود. مدت اشتراکهای تهیهشده محفوظ است.
لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش آمادهسازی داده با R
- آخرین آپدیت
دانلود Data Wrangling in R
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
اصول دادههای مرتب (Tidy Data) و کاربرد آن در تحلیل داده
فرمت مرتب (Tidy Format)، روشی استاندارد برای سازماندهی مقادیر داده در یک مجموعه داده را فراهم میکند. با بهرهگیری از اصول دادههای مرتب، آمارگران، تحلیلگران و دانشمندان داده میتوانند زمان کمتری را صرف پاکسازی دادهها و زمان بیشتری را به جنبههای جذابتر تحلیل داده اختصاص دهند.
آموزش جامع دادههای مرتب و پاکسازی داده
در این دوره آموزشی، با اصول دادههای مرتب آشنا خواهید شد، کشف خواهید کرد که چگونه tibbles دادهها را ایجاد و دستکاری کنید و بیاموزید که چگونه از tibbles در وارد کردن، تبدیل و پاکسازی دادههای خود استفاده کنید.
تسلط بر Data Wrangling با R و tidyverse
مربی Mike Chapple با استفاده از R و پکیجهای tidyverse، مفهوم Data Wrangling را آموزش میدهد. Data Wrangling شامل وظایف پاکسازی داده و تبدیل داده است که بخش قابل توجهی از زمان تحلیلگران را به خود اختصاص میدهد.
مطالعات موردی عملی برای تقویت مهارتهای Data Wrangling
در پایان، سه مطالعه موردی عملی ارائه میشود که اصول و تاکتیکهای Data Wrangling پوشش داده شده در این دوره را تقویت میکند. این بخش به شما کمک میکند تا مهارتهای خود را در مدیریت و آمادهسازی داده برای تحلیل، به طور چشمگیری بهبود بخشید.
کلمات کلیدی مرتبط: دادههای مرتب، tidy data، تحلیل داده، پاکسازی داده، تبدیل داده، Data Wrangling، R، tidyverse، tibbles، آمادهسازی داده، علم داده.
سرفصل ها و درس ها
مقدمه
Introduction
آنچه باید بدانید
What you need to know
آماده سازی برای پردازش دادهها
Preparing for data wrangling
فایلهای تمرینی
Exercise files
دادههای مرتب (Tidy Data)
1. Tidy Data
مشکلات رایج داده
Common data problems
متغیرها، مشاهدات، و مقادیر
Variables, observations, and values
داده مرتب چیست؟
What is tidy data?
استفاده از tidyverse
Using the tidyverse
2. کار با تیبلز
2. Working with Tibbles
ساخت و چاپ تیبلها
Building and printing tibbles
زیرمجموعه گیری تیبلها
Subsetting tibbles
فیلتر کردن جدولهای تیبل
Filtering tibbles
3. وارد کردن داده به R
3. Importing Data into R
فایلهای TSV چیستند؟
What are TSV files?
وارد کردن فایلهای با عرض ثابت در R
Importing fixed-width files into R
فایلهای CSV چیستند؟
What are CSV files?
وارد کردن فایلهای جدا شده به R
Importing delimited files into R
وارد کردن فایلهای اکسل در R
Importing Excel files into R
وارد کردن فایلهای CSV در R
Importing CSV files into R
وارد کردن فایلهای TSV به R
Importing TSV files into R
خواندن دادهها از پایگاههای داده و وب
Reading data from databases and the web
۴. تبدیل دادهها
4. Data Transformation
تبدیل انواع داده در زبان R
Converting data types in R
تبدیل مجموعهدادههای گسترده به بلند با استفاده از pivot_longer()
Making wide datasets long with pivot_longer()
تبدیل مجموعهدادههای طولانی به مجموعهدادههای پهن با pivot_wider()
Making long datasets wide with pivot_wider()
دادههای گسترده در مقابل دادههای طولانی
Wide vs. long datasets
کار با تاریخ و زمان در زبان R
Working with dates and times in R
۵. پاکسازی دادهها
5. Data Cleaning
ادغام ستونها با unite()
Combining columns with unite()
تجزیه ستونها با `separate()`
Breaking apart columns with separate()
دستکاری رشتهها در R با stringr
Manipulating strings in R with stringr
مقادیر گمشده و ویژه در R
Missing and special values in R
تشخیص دادههای پرت
Detecting outliers
6. مطالعه موردی آمادهسازی داده: مصرف زغالسنگ
6. Data Wrangling Case Study: Coal Consumption
تجسم مجموعه داده زغال سنگ
Visualizing the coal dataset
تقسیمبندی مجموعه داده زغالسنگ
Segmenting the coal dataset
درک مجموعه داده زغال سنگ
Understanding the coal dataset
خواندن در مجموعه داده ذغال سنگ
Reading in the coal dataset
تبدیل مجموعه داده زغال سنگ از فرمت گسترده به فرمت بلند
Converting the coal dataset from wide to long
۷. مطالعه موردی دایتا رَنگِلینگ: کیفیت آب
7. Data Wrangling Case Study: Water Quality
درک مجموعه داده کیفیت آب
Understanding the water quality dataset
تبدیل دما از فارنهایت به سانتیگراد
Converting temperature from Fahrenheit to Celsius
گسترش مجموعه دادههای کیفیت آب
Widening the water quality dataset
خواندن در مجموعه داده های کیفیت آب
Reading in the water quality dataset
فیلتر کردن مجموعه داده کیفیت آب
Filtering the water quality dataset
انواع دادههای کیفیت آب
Water quality data types
تصحیح خطاهای ورود داده
Correcting data entry errors
شناسایی و حذف دادههای پرت
Identifying and removing outliers
۸. مطالعه موردی تمیز کردن دادهها: ناتوانی معلولیت تأمین اجتماعی
8. Data Wrangling Case Study: Social Security Disability
بلند کردن دیتاست از کارافتادگی تأمین اجتماعی
Making the social security disability dataset long
تصویرسازی دادههای ناتوانی تأمین اجتماعی
Visualizing the social security disability dataset
قالببندی تاریخ در مجموعه داده ناتوانی تأمین اجتماعی
Formatting dates in the social security disability dataset
واردات مجموعه داده معلولیت تامین اجتماعی
Importing the social security disability dataset
گسترش مجموعه داده ناتوانی تامین اجتماعی
Widening the social security disability dataset
درک مجموعه داده ناتوانی تأمین اجتماعی
Understanding the social security disability dataset
سالهای مالی در مجموعه داده ناتوانی تأمین اجتماعی
Fiscal years in the social security disability dataset
مایک چاپل استاد تدریس فناوری اطلاعات، تجزیه و تحلیل و عملیات در کالج تجارت مندوزا در دانشگاه نوتردام است.
br>در سمت قبلی خود به عنوان مدیر ارشد ارائه خدمات فناوری اطلاعات در دانشگاه نوتردام، او بر امنیت اطلاعات، معماری فناوری اطلاعات، مدیریت پروژه، برنامه ریزی استراتژیک و عملکردهای انطباق با فناوری اطلاعات برای دفتر فناوری اطلاعات نظارت داشت.
مایک یک متخصص امنیت سایبری و تجزیه و تحلیل با بیش از بیست سال تجربه است. او نویسنده بیش از 30 کتاب، از جمله راهنمای مطالعه رسمی (ISC) 2 CISSP و راهنمای مطالعه Sybex از جان وایلی و پسران است که گواهینامه های Security+، CySA+، PenTest+، CISM و CIPP را پوشش می دهد. دوره های آموزشی LinkedIn او طیف گسترده ای از موضوعات مربوط به امنیت سایبری و تجزیه و تحلیل را پوشش می دهد.
درباره برنامههای آموزشی امنیت سایبری Mike در CertMike.com اطلاعات بیشتری کسب کنید.
نمایش نظرات