لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش جمعآوری و پاکسازی دادهها
- آخرین آپدیت
دانلود Getting and Cleaning Data
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
پیش از آنکه بتوانید با دادهها کار کنید، ابتدا باید آنها را به دست آورید. این دوره آموزشی روشهای اساسی دریافت دادهها را پوشش میدهد؛ از جمله استخراج دادهها از وب، APIها، پایگاههای داده و دریافت فایلها با فرمتهای مختلف از همکاران. همچنین، مفاهیم پایه پاکسازی دادهها و نحوه تبدیل آنها به «دادههای مرتب» (Tidy Data) آموزش داده میشود تا سرعت تحلیلهای آماری در مراحل بعدی به شدت افزایش یابد. در این دوره، اجزای یک مجموعه داده کامل شامل دادههای خام، دستورالعملهای پردازش، کدبوکها و دادههای پردازششده بررسی شده و تمامی مهارتهای لازم برای جمعآوری، پاکسازی و اشتراکگذاری دادهها ارائه میگردد.
سرفصل ها و درس ها
هفته اول
Week 1
انگیزه برای جمعآوری دادهها
Obtaining Data Motivation
دادههای خام و پردازششده
Raw and Processed Data
اجزای دادههای مرتب
Components of Tidy Data
دانلود فایلها
Downloading Files
خواندن فایلهای محلی
Reading Local Files
خواندن فایلهای اکسل
Reading Excel Files
خواندن XML
Reading XML
خواندن JSON
Reading JSON
پکیج data.table
The data.table Package
هفته دوم
Week 2
خواندن دادهها از MySQL
Reading from MySQL
خواندن دادهها از HDF5
Reading from HDF5
خواندن دادهها از وب
Reading from The Web
خواندن دادهها از APIها
Reading From APIs
خواندن دادهها از سایر منابع
Reading From Other Sources
هفته سوم
Week 3
زیرمجموعهسازی و مرتبسازی
Subsetting and Sorting
خلاصهسازی دادهها
Summarizing Data
ایجاد متغیرهای جدید
Creating New Variables
تغییر شکل دادهها
Reshaping Data
مدیریت دیتا-فریمها با dplyr - مقدمه
Managing Data Frames with dplyr - Introduction
مدیریت دیتا-فریمها با dplyr - ابزارهای پایه
Managing Data Frames with dplyr - Basic Tools
ادغام دادهها
Merging Data
هفته چهارم
Week 4
ویرایش متغیرهای متنی
Editing Text Variables
عبارات منظم (Regular Expressions) بخش اول
Regular Expressions I
عبارات منظم (Regular Expressions) بخش دوم
Regular Expressions II
نمایش نظرات