لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش درگیری داده ها در R
Data Wrangling in R
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
Tidy data فرمت داده ای است که راهی استاندارد برای سازماندهی مقادیر داده در یک مجموعه داده فراهم می کند. با استفاده از اصول منظم داده ها ، آمار شناسان ، تحلیلگران و دانشمندان داده می توانند زمان کمتری را برای تمیز کردن داده ها و زمان بیشتری را برای حل جنبه های جذاب تر تجزیه و تحلیل داده ها صرف کنند. در این دوره ، با اصول داده های مرتب آشنا شوید ، و نحوه ایجاد و دستکاری tibbles داده را کشف کنید - آنها را از داده های منبع به قالب های مرتب تبدیل کنید. مربی ، مایک چاپل ، از زبان برنامه نویسی R و بسته های متنوع برای آموزش مفهوم درگیری داده ها - وظایف تمیز کردن داده ها و تبدیل داده ها که بخش قابل توجهی از وقت تحلیل گران را مصرف می کند ، استفاده می کند. وی با سه مورد موردی عملی همراه است که به تقویت اصول درگیری داده ها و تاکتیک های ارائه شده در این دوره کمک می کند.
موضوعات شامل:
اطلاعات مرتب چیست؟ li>
استفاده از مرتب و منظم
کار با ماساژ li>
جایگزینی و فیلتر کردن حواشی
وارد کردن داده ها به R
طولانی کردن مجموعه های داده گسترده با جمع آوری ()
ایجاد مجموعه داده های طولانی با گسترش ()
تبدیل انواع داده در R
شناسایی دورریزها li>
دستکاری رشته ها در R با stringr
سرفصل ها و درس ها
مقدمه
Introduction
خوش آمدی
Welcome
چه چیزی میخواهید بدانید
What you need to know
با استفاده از پرونده های تمرینی
Using the exercise files
1. داده مرتب
1. Tidy Data
داده های مرتب چیست؟
What is tidy data?
متغیرها ، مشاهدات و مقادیر
Variables, observations, and values
مشکلات داده رایج
Common data problems
با استفاده از Tidyverse
Using the tidyverse
2. کار با Tibbles
2. Working with Tibbles
ساخت و چاپ تیبل
Building and printing tibbles
زیر مجموعه کردن نوارها
Subsetting tibbles
فیلتر کردن نوارها
Filtering tibbles
3. وارد کردن داده به R
3. Importing Data into R
پرونده های CSV چیست؟
What are CSV files?
وارد کردن پرونده های CSV به R
Importing CSV files into R
پرونده های TSV چیست؟
What are TSV files?
وارد کردن پرونده های TSV به R
Importing TSV files into R
وارد کردن پرونده های محدود در R
Importing delimited files into R
وارد کردن پرونده های با عرض ثابت به R
Importing fixed-width files into R
وارد کردن پرونده های اکسل به R
Importing Excel files into R
خواندن داده ها از پایگاه داده ها و وب
Reading data from databases and the web
4- انتقال داده
4. Data Transformation
گسترده در مقابل مجموعه داده های طولانی
Wide vs. long datasets
طولانی ساختن مجموعه داده های گسترده با جمع آوری ()
Making wide datasets long with gather()
گسترده بودن مجموعه داده های طولانی با گسترش ()
Making long datasets wide with spread()
تبدیل انواع داده در R
Converting data types in R
کار با تاریخ و زمان در R
Working with dates and times in R
5. تمیز کردن داده ها
5. Data Cleaning
شناسایی محل های دوردست
Detecting outliers
مقادیر گمشده و ارزشهای ویژه در R
Missing and special values in R
شکستن ستون های جداگانه ()
Breaking apart columns with separate()
ترکیب ستون ها با متحد ()
Combining columns with unite()
دستکاری رشته ها در R با stringr
Manipulating strings in R with stringr
6. مطالعه موردی ویرایش داده ها: مصرف زغال سنگ
6. Data Wrangling Case Study: Coal Consumption
درک مجموعه داده های ذغال سنگ
Understanding the coal dataset
خواندن در مجموعه داده های ذغال سنگ
Reading in the coal dataset
تبدیل مجموعه داده ذغال سنگ از طولانی به پهنای آن
Converting the coal dataset from long to wide
تقسیم بندی مجموعه داده های ذغال سنگ
Segmenting the coal dataset
تجسم مجموعه داده ذغال سنگ
Visualizing the coal dataset
7. مطالعه موردی در مورد اختلافات داده: کیفیت آب
7. Data Wrangling Case Study: Water Quality
درک مجموعه داده های کیفیت آب
Understanding the water quality dataset
خواندن در مجموعه داده های کیفیت آب
Reading in the water quality dataset
فیلتر مجموعه داده های کیفیت آب
Filtering the water quality dataset
انواع داده های کیفیت آب
Water quality data types
تصحیح خطاهای ورود داده
Correcting data entry errors
شناسایی و از بین بردن جبهه ها
Identifying and removing outliers
تبدیل دما از فارنهایت به سانتیگراد
Converting temperature from Fahrenheit to Celsius
گسترده کردن مجموعه داده کیفیت آب
Widening the water quality dataset
8. مطالعه موردی در مورد اختلافات داده: مطالبات معلولیت تأمین اجتماعی
8. Data Wrangling Case Study: Social Security Disability Claims
درک مجموعه داده های معلولیت تأمین اجتماعی
Understanding the Social Security Disability dataset
وارد کردن مجموعه داده معلولیت تأمین اجتماعی
Importing the Social Security Disability dataset
طولانی ساختن مجموعه داده های معلولیت تأمین اجتماعی
Making the Social Security Disability dataset long
قالب بندی تاریخ ها در مجموعه داده های معلولیت تأمین اجتماعی
Formatting dates in the Social Security Disability dataset
رسیدگی به سال مالی در مجموعه داده های معلولیت تأمین اجتماعی
Handling fiscal years in the Social Security Disability dataset
گسترده کردن مجموعه داده های معلولیت تأمین اجتماعی
Widening the Social Security Disability dataset
تجسم مجموعه داده های معلولیت تأمین اجتماعی
Visualizing the Social Security Disability dataset
مایک چاپل استاد تدریس فناوری اطلاعات، تجزیه و تحلیل و عملیات در کالج تجارت مندوزا در دانشگاه نوتردام است.
br>در سمت قبلی خود به عنوان مدیر ارشد ارائه خدمات فناوری اطلاعات در دانشگاه نوتردام، او بر امنیت اطلاعات، معماری فناوری اطلاعات، مدیریت پروژه، برنامه ریزی استراتژیک و عملکردهای انطباق با فناوری اطلاعات برای دفتر فناوری اطلاعات نظارت داشت.
مایک یک متخصص امنیت سایبری و تجزیه و تحلیل با بیش از بیست سال تجربه است. او نویسنده بیش از 30 کتاب، از جمله راهنمای مطالعه رسمی (ISC) 2 CISSP و راهنمای مطالعه Sybex از جان وایلی و پسران است که گواهینامه های Security+، CySA+، PenTest+، CISM و CIPP را پوشش می دهد. دوره های آموزشی LinkedIn او طیف گسترده ای از موضوعات مربوط به امنیت سایبری و تجزیه و تحلیل را پوشش می دهد.
درباره برنامههای آموزشی امنیت سایبری Mike در CertMike.com اطلاعات بیشتری کسب کنید.
نمایش نظرات