لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش آمادهسازی دادهها برای یادگیری ماشین در پایتون
- آخرین آپدیت
دانلود Data Prep for Machine Learning in Python
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
مدلهای یادگیری ماشین برای تولید بینشهای معنادار، به دادههای باکیفیت وابسته هستند. به همین دلیل، آمادهسازی دادهها (Data Prep) یکی از حیاتیترین مهارتها در حوزه یادگیری ماشین محسوب میشود.
در این دوره، شما یاد خواهید گرفت که چگونه قبل از پر کردن مقادیر مفقود با استفاده از روشهای جایگذاری (Imputation)، دادهها را وارد و پاکسازی کنید. همچنین با استفاده از نمودارهای هیستوگرام، نمودارهای پراکندگی (Scatter Charts) و نمودارهای جعبهای (Box Plots)، یاد میگیرید که چگونه روندها را شناسایی کرده و از این تحلیلها برای انتخاب مهمترین ویژگیها (Features) استفاده کنید. تکنیکهای مهندسی ویژگی (Feature Engineering) مانند One Hot Encoding، دستهبندی (Binning) و مقیاسگذاری (Scaling) به ما کمک میکنند تا ساختار دادهها را برای استخراج بینشهای باکیفیتتر در یادگیری ماشین تغییر دهیم.
این دوره آمادهسازی دادهها در پایتون، نسبت به دورههای قبلی BIDA، شامل تمرینات تعاملی و چالشهای بیشتری است. همچنین شما این فرصت را خواهید داشت که قبل از آزمون نهایی، مهارتهای خود را در یک مطالعه موردی جامع و هدایتشده در پایتون آزمایش کنید.
پس از اتمام این دوره، شما قادر خواهید بود:
• وارد کردن و پاکسازی دادهها در پایتون
• اعمال روشهای جایگذاری برای تخمین مقادیر مفقود در مجموعه داده
• انجام تحلیل اکتشافی دادهها (EDA) برای یافتن الگوهای اولیه جهت هدایت تحلیلها
• انتخاب ویژگیها برای تمرکز بر مهمترین متغیرها
• اعمال مهندسی ویژگی برای آمادهسازی مجموعه دادهها جهت استفاده در یادگیری ماشین
• انتخاب تکنیکهای مناسب مهندسی ویژگی بر اساس نوع مدل
چه یک مدیر کسبوکار باشید و چه یک تحلیلگر مشتاق در حوزه علم داده، این دوره «آمادهسازی دادهها برای یادگیری ماشین در پایتون» به عنوان یک مقدمه جامع برای شما عمل خواهد کرد.
شما تمام اصطلاحات کلیدی را یاد میگیرید تا بتوانید با تیمهای خود در مورد علم داده گفتگو کنید، تحلیلها را پیادهسازی کنید و درک کنید که علم داده چگونه میتواند به کسبوکار شما کمک کند.
سرفصل ها و درس ها
مقدمهای بر آمادهسازی دادهها
Introduction to Data Prep
معرفی دوره
Course Introduction
دانش پیشنیاز
Pre-requisite Knowledge
راهنمای سریع ساختار دوره، نوتبوکها و تمرینها
A Quick Guide to Course Structure, Notebooks, and Exercises
وارد کردن و پاکسازی دادهها
Importing & Cleaning Data
مقدمه: وارد کردن و پاکسازی دادهها
Introduction - Importing & Cleaning Data
وارد کردن دادهها از فایلهای CSV، اکسل و SQL
Importing Data - CSV, Excel and SQL
انتخاب ستونها
Selecting Columns
فیلتر کردن ردیفها
Filtering Rows
تمرین: وارد کردن و فیلتر کردن دادهها
Exercise - Import & Filter Data
مرور تمرین: وارد کردن و فیلتر کردن دادهها
Exercise Review - Import & Filter Data
تئوری انواع دادهها
Data Types Theory
اعتبارسنجی پایه دادهها
Basic Data Validation
مقایسه با یک منبع داده معتبر
Comparing to a Trusted Datasource
تمرین: اعتبارسنجی دادهها
Exercise - Data Validation
مرور تمرین: اعتبارسنجی دادهها
Exercise Review - Data Validation
تئوری جایگذاری (Imputation)
Imputation Theory
پاکسازی دادهها
Cleaning Data
خطاهای نوع داده
Data Type Errors
جایگذاری با استفاده از صفر
Imputation with Zeros
جایگذاری پایه مقادیر
Basic Imputation of Values
تمرین: پاکسازی و جایگذاری
Exercise - Cleaning & Imputation
مرور تمرین: پاکسازی و جایگذاری
Exercise Review - Cleaning & Imputation
تحلیل اکتشافی دادهها (EDA)
Exploratory Data Analysis
مقدمه: تحلیل اکتشافی دادهها (EDA)
Introduction - Exploratory Data Analysis
آمار توصیفی برای ویژگیهای عددی
Descriptive Stats for Numeric Features
نمودارهای پایه برای ویژگیهای عددی + ترکیب محورها و توابع
Basic Plots for Numeric Features + Combining Axis & Functions
نمودارهای پایه برای ویژگیهای طبقهبندیشده (Categorical)
Basic Plots for Categorical Features
تمرین: بصریسازی ویژگیهای عددی و طبقهبندیشده
Exercise - Visuals for Numeric & Categoric Features
مرور تمرین: بصریسازی ویژگیهای عددی و طبقهبندیشده
Exercise Review - Visuals for Numeric & Categoric Features
تحلیل متغیر پیوسته در مقابل پیوسته (بخش ۱)
Continuous vs Continuous Variable Analysis 1
تحلیل متغیر پیوسته در مقابل پیوسته (بخش ۲)
Continuous vs Continuous Variable Analysis Part 2
تحلیل متغیر طبقهبندیشده در مقابل پیوسته
Categorical vs Continuous Variable Analysis
تمرین: ایجاد و تحلیل نمودارهای چندمتغیره
Exercise - Creating and Analyzing Multivariate Plots
مرور تمرین: ایجاد و تحلیل نمودارهای چندمتغیره
Exercise Review - Creating and Analyzing Multivariate Plots
تقسیم دادههای آموزش و تست (مرور)
Train-Test Split (Recap)
آموزش در مقابل تست
Training Vs Testing
تقسیم دادههای آموزش و تست در SKLearn
Train-Test Split in SKLearn
چالش هفته اول
Week 1 Challenge
مهندسی ویژگی بخش ۱: کدگذاری و تبدیل
Feature Engineering Part 1 - Encoding & Transformation
نمایش نظرات