آموزش پایتون 2023 برای یادگیری ماشینی: راهنمای گام به گام

2023 Python for Machine Learning: A Step-by-Step Guide

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: پروژه های علم داده با رگرسیون خطی، رگرسیون لجستیک، جنگل تصادفی، SVM، KNN، KMeans، XGBoost، PCA و غیره مفاهیم و تکنیک های اساسی یادگیری ماشین، از جمله یادگیری تحت نظارت و بدون نظارت اجرای الگوریتم های مختلف یادگیری ماشین مانند رگرسیون خطی، لجستیک رگرسیون، k-نزدیکترین همسایه، درخت تصمیم، و غیره. تکنیک های ساخت و ارزیابی مدل های یادگیری ماشین، مانند انتخاب ویژگی، مهندسی ویژگی، و تکنیک های ارزیابی مدل. انواع مختلف معیارهای ارزیابی مدل، مانند دقت، دقت، و یادآوری و نحوه تفسیر آنها. استفاده از کتابخانه های یادگیری ماشینی مانند scikit-learn و پانداها برای ساخت و ارزیابی مدل ها. تجربه عملی کار بر روی مجموعه داده ها و پروژه های دنیای واقعی که به دانش آموزان این فرصت را می دهد تا مفاهیم و تکنیک های آموخته شده را در سراسر جهان به کار گیرند. توانایی تجزیه و تحلیل، تفسیر و ارائه نتایج مدل های یادگیری ماشین. درک مبادلات بین الگوریتم های مختلف یادگیری ماشین و مزایا و معایب آنها. درک بهترین شیوه ها برای توسعه، پیاده سازی و تفسیر مدل های یادگیری ماشین. مهارت در عیب یابی مشکلات رایج یادگیری ماشین و اشکال زدایی مدل های یادگیری ماشین. پیش نیازها: برخی از مفاهیم برنامه نویسی ریاضیات ابتدایی تمایل به یادگیری

به دوره آموزشی پروژه های یادگیری ماشینی ما خوش آمدید! این دوره برای افرادی طراحی شده است که می خواهند تجربه عملی در توسعه و پیاده سازی مدل های یادگیری ماشین کسب کنند. در طول دوره، مفاهیم و تکنیک های لازم برای ساخت و ارزیابی مدل های یادگیری ماشینی با استفاده از مجموعه داده های دنیای واقعی را خواهید آموخت.

ما اصول یادگیری ماشین را پوشش می‌دهیم، از جمله یادگیری تحت نظارت و بدون نظارت، و انواع مشکلاتی که با استفاده از این تکنیک‌ها قابل حل هستند. همچنین با الگوریتم‌های رایج یادگیری ماشین، مانند رگرسیون خطی، k-نزدیک‌ترین همسایه‌ها و درخت‌های تصمیم آشنا خواهید شد.


ML پیش نیازهای سخنرانی

  1. دوره Crash Python: این یک دوره مقدماتی است که برای کمک به زبان آموزان در یادگیری سریع اصول اولیه زبان برنامه نویسی Python طراحی شده است.

  2. Numpy: کتابخانه ای در پایتون است که از آرایه های چند بعدی بزرگ از انواع داده های همگن و مجموعه بزرگی از توابع ریاضی سطح بالا برای کار بر روی این آرایه ها پشتیبانی می کند.

  3. Pandas: این یک کتابخانه در پایتون است که ساختارهای داده و ابزارهای تجزیه و تحلیل داده با استفاده آسان را ارائه می دهد. این در بالای Numpy ساخته شده است و به طور گسترده برای تمیز کردن، تبدیل و دستکاری داده ها استفاده می شود.

  4. Matplotlib: یک کتابخانه رسم در پایتون است که طیف وسیعی از ابزارهای تجسم و پشتیبانی از انواع مختلف نمودارها را فراهم می کند. به طور گسترده برای کاوش و تجسم داده ها استفاده می شود.

  5. Seaborn: این یک کتابخانه است که در بالای Matplotlib ساخته شده است که APIهای سطح بالاتری را برای ترسیم ساده تر و جذاب تر ارائه می دهد. به طور گسترده ای برای تجسم داده های آماری استفاده می شود.

  6. Plotly: این یک کتابخانه منبع باز در پایتون است که تجسم های تعاملی و مبتنی بر وب را ارائه می دهد. از طیف گسترده ای از نمودارها پشتیبانی می کند و به طور گسترده برای ایجاد داشبوردهای تعاملی و تجسم داده ها برای وب استفاده می شود.


مدل های ML پوشش داده شده در این دوره

  1. رگرسیون خطی: یک الگوریتم یادگیری نظارت شده که برای پیش بینی یک متغیر هدف پیوسته بر اساس مجموعه ای از متغیرهای مستقل استفاده می شود. یک رابطه خطی بین متغیرهای مستقل و وابسته را فرض می کند.

  2. رگرسیون لجستیک: یک الگوریتم یادگیری نظارت شده که برای پیش بینی یک نتیجه باینری بر اساس مجموعه ای از متغیرهای مستقل استفاده می شود. از یک تابع لجستیک برای مدل سازی احتمال نتیجه استفاده می کند.

  3. درختان تصمیم: یک الگوریتم یادگیری تحت نظارت که از یک مدل درخت مانند از تصمیمات و پیامدهای احتمالی آنها استفاده می کند. اغلب برای کارهای طبقه بندی و رگرسیون استفاده می شود.

  4. جنگل تصادفی: یک الگوریتم یادگیری نظارت شده که چندین درخت تصمیم را ترکیب می کند تا دقت و ثبات پیش بینی ها را افزایش دهد. این یک روش مجموعه ای است که اضافه برازش را کاهش می دهد و تعمیم مدل را بهبود می بخشد.

  5. ماشین بردار پشتیبان (SVM): یک الگوریتم یادگیری نظارت شده که برای کارهای طبقه بندی و رگرسیون استفاده می شود. بهترین مرز (یا ابر صفحه) را پیدا می کند که کلاس های مختلف را در داده ها جدا می کند.

  6. K-Nearest Neighbors (KNN): یک الگوریتم یادگیری تحت نظارت که برای طبقه بندی و وظایف رگرسیون استفاده می شود. k نزدیکترین نقطه به یک نقطه داده جدید را پیدا می کند و آن را بر اساس کلاس اکثریت k نزدیکترین نقطه طبقه بندی می کند.

  7. تنظیم فراپارامتر: فرآیند جستجوی سیستماتیک بهترین ترکیب فراپارامترها برای یک مدل یادگیری ماشینی است. برای بهینه‌سازی عملکرد مدل و جلوگیری از برازش بیش از حد با یافتن مجموعه‌ای از پارامترهای بهینه که روی داده‌های دیده نشده به خوبی کار می‌کنند، استفاده می‌شود.

  8. AdaBoost: یک الگوریتم یادگیری تحت نظارت که با تنظیم وزن مشاهدات با داده ها سازگار می شود. این یک روش مجموعه ای است که برای کارهای طبقه بندی استفاده می شود.

  9. XGBoost: یک الگوریتم یادگیری تحت نظارت که توسعه‌ای از یک الگوریتم تقویت گرادیان است. این به طور گسترده در مسابقات Kaggle و پروژه های صنعتی استفاده می شود.

  10. CatBoost: یک الگوریتم یادگیری تحت نظارت که برای مدیریت موثر متغیرهای طبقه بندی شده طراحی شده است.


مدل‌های بدون نظارت

الگوریتم های خوشه بندی را می توان به طور کلی به سه نوع طبقه بندی کرد: مبتنی بر مرکز، مبتنی بر چگالی و سلسله مراتبی. الگوریتم های خوشه بندی مبتنی بر مرکز مانند k-means، گروه بندی نقاط داده بر اساس نزدیکی آنها به مرکز، یا نقطه مرکزی. الگوریتم های خوشه بندی مبتنی بر چگالی مانند DBSCAN، نقاط داده را بر اساس چگالی آنها در فضای ویژگی گروه بندی می کنند. الگوریتم‌های خوشه‌بندی سلسله مراتبی مانند Agglomerative و Divisive سلسله مراتبی از خوشه‌ها را با ادغام یا تقسیم کردن خوشه‌ها به صورت تکراری ایجاد می‌کنند.

  1. K-Means: یک الگوریتم خوشه‌بندی مبتنی بر مرکز که نقاط داده را بر اساس نزدیکی آنها به یک مرکز گروه‌بندی می‌کند. به طور گسترده ای برای خوشه بندی مجموعه داده های بزرگ استفاده می شود.

  2. DBSCAN: یک الگوریتم خوشه‌بندی مبتنی بر چگالی که نقاط داده را بر اساس چگالی آنها در فضای ویژگی گروه‌بندی می‌کند. برای شناسایی خوشه هایی با شکل دلخواه مفید است.

  3. خوشه بندی سلسله مراتبی: الگوریتمی که سلسله مراتبی از خوشه ها را با ادغام یا تقسیم خوشه ها به صورت مکرر ایجاد می کند. این می تواند ماهیت تجمعی یا تقسیم کننده داشته باشد.

  4. خوشه‌بندی طیفی: یک الگوریتم خوشه‌بندی که با استفاده از بردارهای ویژه ماتریس شباهت داده‌ها، خوشه‌ها را پیدا می‌کند.

  5. تجزیه و تحلیل مؤلفه اصلی (PCA): یک تکنیک کاهش ابعاد است که داده ها را در فضایی با ابعاد پایین تر نمایش می دهد و در عین حال مهم ترین اطلاعات را حفظ می کند.


مدل های پیشرفته

  1. یادگیری عمیق مقدمه: یادگیری عمیق زیرشاخه ای از یادگیری ماشینی است که از شبکه های عصبی مصنوعی با لایه های متعدد به نام شبکه های عصبی عمیق برای مدل سازی و حل مسائل پیچیده مانند تشخیص تصویر و پردازش زبان طبیعی استفاده می کند. این مبتنی بر این ایده است که یک شبکه عصبی می تواند یاد بگیرد که به طور خودکار نمایش داده ها را در سطوح مختلف انتزاع بیاموزد. پرسپترون چند لایه (MLP) یک نوع مدل یادگیری عمیق است که یک مدل شبکه عصبی مصنوعی پیش‌خور است که مجموعه‌ای از داده‌های ورودی را بر روی مجموعه‌ای از خروجی‌های مناسب نگاشت می‌کند. MLP یک الگوریتم یادگیری نظارت شده است که می تواند برای کارهای طبقه بندی و رگرسیون استفاده شود. MLP مبتنی بر این ایده است که یک شبکه عصبی با چندین لایه می‌تواند یاد بگیرد که به طور خودکار نمایش داده‌ها را در سطوح مختلف انتزاع بیاموزد.

  2. پردازش زبان طبیعی (NLP): پردازش زبان طبیعی (NLP) حوزه ای از هوش مصنوعی است که به تعامل بین زبان انسان و رایانه می پردازد. یکی از تکنیک های رایج مورد استفاده در NLP اصطلاح فرکانس سند معکوس فرکانس (tf-idf) است. Tf-idf یک معیار آماری است که اهمیت یک کلمه را در یک سند یا مجموعه ای از اسناد نشان می دهد. اهمیت متناسب با تعداد دفعاتی که یک کلمه در سند ظاهر می شود افزایش می یابد اما با فراوانی کلمه در مجموعه جبران می شود. Tf-idf در NLP برای کارهایی مانند طبقه بندی متن، خوشه بندی متن و بازیابی اطلاعات استفاده می شود. همچنین در خلاصه‌سازی اسناد و استخراج ویژگی برای داده‌های متنی استفاده می‌شود.


آیا شرایط یا پیش نیازهای دوره وجود دارد؟

  • هیچ سطح مهارت مقدماتی برنامه نویسی پایتون لازم نیست

  • کامپیوتر (مک، ویندوز یا لینوکس) داشته باشید

  • می خواهید یاد بگیرید!

این دوره برای چه کسانی است:

  • برنامه نویسان مبتدی پایتون.

  • برنامه نویسان مبتدی علوم داده.

  • دانشجویان علم داده و یادگیری ماشین.

  • هر کسی که علاقه مند به یادگیری بیشتر در مورد پایتون، علم داده، یا تجسم داده است.

  • هر کسی که به دنیای به سرعت در حال گسترش علم داده علاقه مند است!

  • توسعه دهندگانی که می خواهند در پروژه های تجزیه و تحلیل و تجسم کار کنند.

  • هر کسی که می‌خواهد قبل از استفاده از یادگیری ماشین، داده‌ها را کاوش و درک کند.

در طول دوره، شما به تیمی از مربیان با تجربه دسترسی خواهید داشت که در حین کار بر روی پروژه های شما راهنمایی و پشتیبانی می کنند. شما همچنین به جامعه ای از دانشجویان دیگر دسترسی خواهید داشت که در حین کار بر روی پروژه های خود، پشتیبانی و بازخورد بیشتری ارائه می دهند.

این دوره بصورت خود گام است، به این معنی که می توانید ماژول ها و پروژه ها را با سرعت خود تکمیل کنید،


سرفصل ها و درس ها

معرفی Introduction

  • معرفی دوره Course Introduction

  • مقدمه یادگیری ماشین Machine Learning Introduction

  • آناکوندا و پایتون را روی ویندوز نصب کنید Install Anaconda and Python on Windows

  • آناکوندا را در لینوکس نصب کنید Install Anaconda in Linux

  • معرفی نوت بوک Jupyter و میانبرهای صفحه کلید Jupyter Notebook Introduction and Keyboard Shortcuts

  • جایزه Bonus

دوره سقوط پایتون Python Crash Course

  • عملیات حسابی در پایتون Arithmatic Operations in Python

  • انواع داده ها در پایتون Data Types in Python

  • ریخته گری متغیر Variable Casting

  • عملیات رشته ها در پایتون Strings Operation in Python

  • برش رشته در پایتون String Slicing in Python

  • قالب بندی و اصلاح رشته String Formatting and Modification

  • متغیرهای بولی و ارزیابی Boolean Variables and Evaluation

  • لیست در پایتون List in Python

  • تاپل در پایتون Tuple in Python

  • 10 مجموعه 10 Set

  • فرهنگ لغت Dictionary

  • اظهارات مشروط - اگر غیر از این باشد Conditional Statements - If Else

  • در حالی که حلقه ها While Loops

  • برای حلقه ها For Loops

  • کارکرد Functions

  • کار با تاریخ و زمان Working with Date and Time

  • مدیریت فایل خواندن و نوشتن File Handling Read and Write

دوره تصادف Numpy Numpy Crash Course

  • Numpy Introduction - ایجاد Numpy Array Numpy Introduction - Create Numpy Array

  • نمایه سازی و برش آرایه Array Indexing and Slicing

  • انواع داده Numpy Numpy Data Types

  • np.nan و np.inf np.nan and np.inf

  • عملیات آماری Statistical Operations

  • Shape()، Reshape()، Ravel()، Flatten() Shape(), Reshape(), Ravel(), Flatten()

  • arange()، linspace()، range()، تصادفی()، zeros() و ones() arange(), linspace(), range(), random(), zeros(), and ones()

  • جایی که Where

  • Numpy Array خواندن و نوشتن Numpy Array Read and Write

  • الحاق و مرتب سازی Concatenation and Sorting

پانداها برای تجزیه و تحلیل داده ها Pandas for Data Analysis

  • قسمت اول معرفی سری پانداها Pandas Series Introduction Part 1

  • قسمت دوم معرفی سری پانداها Pandas Series Introduction Part 2

  • مجموعه پانداها از فایل خوانده می شود Pandas Series Read From File

  • پایتون های ساخته شده در توابع را در سری ها اعمال کنید Apply Pythons Built in Functions to Series

  • application() برای سری Pandas apply() for Pandas Series

  • Pandas DataFrame ایجاد از ابتدا Pandas DataFrame Creation from Scratch

  • خواندن فایل ها به عنوان DataFrame Read Files as DataFrame

  • دستکاری ستون ها قسمت 1 Columns Manipulation Part 1

  • دستکاری ستون ها قسمت 2 Columns Manipulation Part 2

  • عملیات حسابی Arithmetic Operations

  • مدیریت ارزش NULL NULL Values Handling

  • DataFrame Filtering Data Part 1 DataFrame Data Filtering Part 1

  • DataFrame Filtering Data Part 2 DataFrame Data Filtering Part 2

  • 14 مدیریت ارزش های منحصر به فرد و تکراری 14 Handling Unique and Duplicated Values

  • بازیابی ردیف ها با برچسب شاخص Retrive Rows by Index Label

  • جایگزین مقادیر سلول Replace Cell Values

  • تغییر نام، حذف فهرست و ستون ها Rename, Delete Index and Columns

  • درخواست لامبدا Lambda Apply

  • پانداها گروپبی Pandas Groupby

  • ستون های چندگانه Groupby Groupby Multiple Columns

  • ادغام، پیوستن، و الحاق بخش 1 Merging, Joining, and Concatenation Part 1

  • الحاق Concatenation

  • ادغام و عضویت Merge and Join

  • کار با Datetime Working with Datetime

  • اطلاعات سهام را از YAHOO Finance بخوانید Read Stock Data from YAHOO Finance

Matplotlib برای تجزیه و تحلیل داده ها Matplotlib for Data Analysis

  • مقدمه Matplotlib Matplotlib Introduction

  • طرح خط Matplotlib قسمت 1 Matplotlib Line Plot Part 1

  • طرح درآمد فیلم IMDB قسمت 1 IMDB Movie Revenue Line Plot Part 1

  • داستان خط درآمد فیلم IMDB قسمت 2 IMDB Movie Revenue Line Plot Part 2

  • رتبه طرح خط در مقابل امتیاز رای زمان اجرا Line Plot Rank vs Runtime Votes Metascore

  • یک ظاهر طراحی خط و قرار دادن برچسب Line Styling and Putting Labels

  • نمودار پراکندگی، نوار و هیستوگرام قسمت 1 Scatter, Bar, and Histogram Plot Part 1

  • نمودار پراکندگی، نوار و هیستوگرام قسمت 2 Scatter, Bar, and Histogram Plot Part 2

  • طرح فرعی قسمت 1 Subplot Part 1

  • طرح فرعی قسمت 2 Subplot Part 2

  • طرح های فرعی Subplots

  • ایجاد یک زیرشکل بزرگنمایی شده از یک شکل Creating a Zoomed Sub-Figure of a Figure

  • xlim و ylim، افسانه، شبکه، xticks، yticks xlim and ylim, legend, grid, xticks, yticks

  • نمودار دایره ای و ذخیره شکل Pie Chart and Figure Save

Seaborn برای تجزیه و تحلیل داده ها Seaborn for Data Analysis

  • معرفی Introduction

  • طرح پراکنده Scatter Plot

  • رنگ، سبک و اندازه قسمت 1 Hue, Style and Size Part1

  • رنگ، سبک و اندازه قسمت 2 Hue, Style and Size Part2

  • طرح خط قسمت 1 Line Plot Part 1

  • طرح خط قسمت 2 Line Plot Part 2

  • طرح خط قسمت 3 Line Plot Part 3

  • طرح های فرعی Subplots

  • sns.lineplot() و sns.scatterplot() sns.lineplot() and sns.scatterplot()

  • نقشه گربه cat plot

  • طرح جعبه Box Plot

  • طرح باکسن Boxen Plot

  • طرح ویولن Violin Plot

  • قطعه نوار Bar Plot

  • طرح نقطه ای Point Plot

  • طرح مشترک Joint Plot

  • طرح جفت Pair Plot

  • طرح رگرسیون Regression Plot

  • کنترل زیبایی شناسی شکل ترسیم شده Controlling Ploted Figure Aesthetics

تجسم داده ها در پانداها Data Visualization in Pandas

  • معرفی مجموعه داده های IRIS IRIS Dataset Introduction

  • مجموعه داده IRIS را بارگیری کنید Load IRIS Dataset

  • طرح خط Line Plot

  • محور ثانویه Secondary Axis

  • بار و بره پلات Bar and Barh Plot

  • قطعه نوار انباشته Stacked Bar Plot

  • هیستوگرام Histogram

  • طرح جعبه Box Plot

  • مساحت و طرح پراکندگی Area and Scatter Plot

  • طرح هگزبین Hexbin Plot

  • نمودار دایره ای Pie Chart

  • ماتریس پراکندگی و طرح های فرعی Scatter Matrix and Subplots

تجسم داده ها با Plotly Data Visualization with Plotly

  • مقدمه ای بر پلاتلی و دکمه سر دست Introduction to Plotly and Cufflinks

  • Plotly Line Plot Plotly Line Plot

  • طرح پراکنده Scatter Plot

  • قطعه نوار انباشته Stacked Bar Plot

  • جعبه و قطعه زمین Box and Area Plot

  • طرح سه بعدی 3D Plot

  • نمودار تاریخ، حباب پلات و نقشه حرارتی Hist Plot, Bubble Plot and Heatmap

رگرسیون خطی Linear Regression

  • مقدمه رگرسیون خطی Linear Regression Introduction

  • نمونه های رگرسیون Regression Examples

  • انواع رگرسیون خطی Types of Linear Regression

  • ارزیابی عملکرد مدل Assessing the performance of the model

  • مبادله تعصب-واریانس Bias-Variance tradeoff

  • sklearn و train-test-split چیست What is sklearn and train-test-split

  • ارتقا و واردات بسته پایتون Python Package Upgrade and Import

  • مجموعه داده مسکن بوستون را بارگیری کنید Load Boston Housing Dataset

  • تجزیه و تحلیل مجموعه داده ها Dataset Analysis

  • تجزیه و تحلیل داده های اکتشافی - طرح زوجی Exploratory Data Analysis- Pair Plot

  • تجزیه و تحلیل داده های اکتشافی - نمودار تاریخ Exploratory Data Analysis- Hist Plot

  • تجزیه و تحلیل داده های اکتشافی - نقشه حرارتی Exploratory Data Analysis- Heatmap

  • آموزش اسپلیت و مدل تست قطار Train Test Split and Model Training

  • نحوه ارزیابی عملکرد مدل رگرسیون How to Evaluate the Regression Model Performance

  • قیمت واقعی خانه در مقابل قیمت پیش بینی شده را ترسیم کنید Plot True House Price vs Predicted Price

  • ترسیم منحنی های یادگیری قسمت 1 Plotting Learning Curves Part 1

  • ترسیم منحنی های یادگیری قسمت 2 Plotting Learning Curves Part 2

  • تفسیرپذیری مدل یادگیری ماشین - نمودار باقیمانده Machine Learning Model Interpretability- Residuals Plot

  • تفسیرپذیری مدل یادگیری ماشین - نمودار خطای پیش بینی Machine Learning Model Interpretability- Prediction Error Plot

رگرسیون لجستیک Logistic Regression

  • مقدمه رگرسیون لجستیک Logistic Regression Introduction

  • تابع سیگموئید Sigmoid Function

  • مرز تصمیم گیری Decision Boundary

  • معرفی مجموعه داده تایتانیک Titanic Dataset Introduction

  • در حال بارگذاری مجموعه داده Dataset Loading

  • EDA - نقشه حرارتی و نمودار چگالی EDA - Heatmap and Density Plot

  • بخش 1 تعیین سن گمشده Missing Age Imputation Part 1

  • بخش 2 تعیین سن گمشده Missing Age Imputation Part 2

  • انتساب Missing Embark Town Imputation of Missing Embark Town

  • تصحیح و نگاشت انواع داده ها Data Types Correction and Mapping

  • رمزگذاری یک داغ One-Hot Encoding

  • تقسیم تست قطار Train Test Split

  • آموزش و ارزیابی ساختمان مدل Model Building Training and Evaluation

  • انتخاب ویژگی - حذف ویژگی بازگشتی Feature Selection - Recursive Feature Elimination

  • دقت، امتیاز F1، P، R، منحنی AUC_ROC قسمت 1 Accuracy, F1-Score, P, R, AUC_ROC Curve Part 1

  • دقت، امتیاز F1، P، R، منحنی AUC_ROC قسمت 2 Accuracy, F1-Score, P, R, AUC_ROC Curve Part 2

  • دقت، امتیاز F1، P، R، منحنی AUC_ROC قسمت 3 Accuracy, F1-Score, P, R, AUC_ROC Curve Part 3

  • منحنی ROC و AUC قسمت 1 ROC Curve and AUC Part 1

  • منحنی ROC و AUC قسمت 2 ROC Curve and AUC Part 2

  • منحنی ROC و AUC قسمت 3 ROC Curve and AUC Part 3

ماشین بردار پشتیبانی Support Vector Machine

  • معرفی SVM SVM Introduction

  • هسته های SVM SVM Kernels

  • معرفی مجموعه داده سرطان پستان Breast Cancer Dataset Introduction

  • در حال بارگذاری مجموعه داده Dataset Loading

  • تجسم داده های سرطان قسمت 1 Cancer Data Visualization Part 1

  • تجسم داده های سرطان قسمت 2 Cancer Data Visualization Part 2

  • استاندارد سازی داده ها Data Standardization

  • تقسیم تست قطار Train Test Split

  • ساخت و آموزش مدل SVM خطی Linear SVM Model Building and Training

  • مدل خطی SVM بر روی ویژگی مقیاس شده Linear SVM Model on Scaled Feature

  • هسته های چند جمله ای، سیگموئیدی، RBF در SVM Polynomial, Sigmoid, RBF Kernels in SVM

اعتبار سنجی متقاطع و تنظیم فراپارامتر Cross Validation and Hyperparameter Tuning

  • مقدمه منظم سازی اعتبارسنجی متقاطع و بهینه سازی فراپارامتر Cross Validation Regularization and Hyperparameter Optimization Introduction

  • فرآیند آموزش مدل ML ML Model Training Process

  • در حال بارگیری مجموعه داده های سرطان سینه Breast Cancer Dataset Loading

  • تجسم داده ها Data Visualization

  • تقسیم تست قطار Train Test Split

  • رگرسیون خطی و آموزش مدل SVM Linear Regression and SVM Model Training

  • مقدمه منظم سازی Regularization Introduction

  • تنظیم دستی هایپرپارامتر Manual Hyperparameter Adjustment

  • انواع اعتبارسنجی متقاطع Types of Cross Validation

  • K-Fold و LeaveOneOut Cross Validation K-Fold and LeaveOneOut Cross Validation

  • تنظیم Hypyerparameter Search Grid Grid Search Hypyerparameter Tuning

  • تنظیم فراپارامتر جستجوی تصادفی شبکه Random Grid Search Hyperparameter Tuning

K-نزدیکترین همسایه (KNN) K-Nearest Neighbor (KNN)

  • مقدمه KNN KNN Introduction

  • KNN چگونه کار می کند How KNN Works

  • شراب مجموعه داده Laoding Wine Dataset Laoding

  • تجسم داده ها Data Visualization

  • تقسیم و استانداردسازی تست قطار Train Test Split and Standardization

  • ساخت و آموزش مدل KNN KNN Model Building and Training

  • تنظیم فراپارامتر Hyperparameter Tuning

  • مزایا و معایب KNN Pros and Cons of KNN

درخت تصمیم Decision Tree

  • معرفی درخت تصمیم Decision Tree Introduction

  • درخت تصمیم چگونه کار می کند How Decision Tree Works

  • معیارهای انتخاب ویژگی - ASM چیست. What is Attribute Selection Measures - ASM.

  • در حال بارگذاری مجموعه داده Dataset Loading

  • تجسم مجموعه داده Dataset Visualization

  • تقسیم تست قطار Train Test Split

  • آموزش و ارزیابی مدل Model Training and Evaluation

  • تجسم درخت Tree Visualization

  • بهینه سازی هایپرپارامتر Hyperparameter Optimization

  • در حال بارگیری مجموعه داده های دیابت Diabetes Dataset Loading

  • رگرسیون درخت تصمیم Decision Tree Regression

جنگل تصادفی Random Forest

  • معرفی گروه یادگیری کیف و تقویت Ensemble Learning Bagging and Boosting Introduction

  • مقدمه جنگل تصادفی Random Forest Introduction

  • معرفی مجموعه داده Dataset Introduction

  • تجسم داده ها Data Visualization

  • تقسیم تست قطار و رمزگذاری یک داغ Train Test Split and One-Hot Encoding

  • آموزش و ارزیابی طبقه بندی کننده تصادفی جنگل Random Forest Classifier Training and Evaluation

  • بارگذاری داده برای رگرسیون تصادفی جنگل Data Loading for Random Forest Regression

  • ساختمان مدل رگرسیون جنگل تصادفی Random Forest Regression Model Building

  • بهینه سازی هایپرپارامتر Hyperparameter Optimization

تقویت الگوریتم ها Boosting Algorithms

  • مقدمه تقویت الگوریتم ها Boosting Algorithms Introduction

  • درک مجموعه داده های بیماری قلبی Heart-Disease Dataset Understanding

  • تجسم داده قسمت 1 Data Visualization Part 1

  • تقسیم تست قطار Train Test Split

  • آموزش مدل AdaBoost AdaBoost Model Training

  • تنظیم Hyperparameter AdaBoost AdaBoost Hyperparameter Tuning

  • XGBoost مقدمه XGBoost Introduction

  • آموزش مدل XGBoost و تنظیم Hyperparameter XGBoost Model Training and Hyperparameter Tuning

  • آموزش مدل CatBoost CatBoost Model Training

  • بهینه سازی Hyperparameter CatBoost CatBoost Hyperparameter Optimization

K-Means Clustering K-Means Clustering

  • مقدمه ای بر یادگیری بدون نظارت Introduction to Unsupervised Learning

  • مقدمه ای بر K-Means Introduction to K-Means

  • نحوه انتخاب بهترین تعداد خوشه How to Choose Best Number of Clusters

  • K-Means Clustering با Scikit-Learn K-Means Clustering with Scikit-Learn

  • کاربرد یادگیری بدون نظارت Application of Unsupervised Learning

  • بارگیری اطلاعات مشتریان Customers Data Loading

  • تجسم داده ها Data Visualization

  • آماده سازی داده های خوشه بندی K-Means K-Means Clustering Data Preparation

  • K-Means خوشه بندی برای امتیاز سن و هزینه K-Means Clustering for Age and Spending Score

  • تجسم خوشه ها Clusters Visualization

  • تجسم مرز تصمیم Decision Boundary Visualization

  • قرار دادن همه چیز با هم Putting Everything Together

  • انتخاب تعداد بهینه خوشه Selecting Optimum Number of Clusters

  • خوشه بندی برای درآمد سالانه در مقابل امتیاز هزینه Clustering for Annual Income vs Spending Score

  • خوشه بندی سه بعدی قسمت 1 3D Clustering Part 1

  • خوشه بندی سه بعدی قسمت 2 3D Clustering Part 2

خوشه بندی بر اساس چگالی Density Based Clustering

  • مقدمه DBSCAN DBSCAN Introduction

  • ایجاد مجموعه داده Generate Dataset

  • خوشه بندی DBSCAN DBSCAN Clustering

  • خوشه بندی طیفی Spectral Clustering

  • کدگذاری خوشه بندی طیفی Spectral Clustering Coding

خوشه بندی سلسله مراتبی Hierarchical Clustering

  • مقدمه خوشه بندی سلسله مراتبی Hierarchical Clustering Introduction

  • اصطلاحات مهم در خوشه بندی سلسله مراتبی Important Terms in Hierarchical Clustering

  • بارگذاری اطلاعات بازار سهام Stock Market Data Loading

  • کدگذاری خوشه بندی سلسله مراتبی Hierarchical Clustering Coding

تجزیه و تحلیل اجزای اصلی (PCA) Principle Component Analysis (PCA)

  • مقدمه PCA PCA Introduction

  • نحوه انجام PCA How PCA is Done.

  • بارگیری و درک مجموعه داده های MNIST MNIST Dataset Loading and Understanding

  • برنامه های کاربردی PCA PCA Applications

  • کدگذاری PCA PCA Coding

  • تجزیه و تحلیل فشرده سازی PCA PCA Compression Analysis

  • بازسازی داده ها Data Reconstruction

  • انتخاب تعداد صحیح اجزای اصلی Choosing Right Number of the Principle Components

  • بازسازی داده ها با 95 درصد اطلاعات Data Reconstruction with 95% Information

  • مقایسه طبقه بندی با و بدون PCA Classification Comparison with and without PCA

مقدمه ای بر یادگیری عمیق Introduction to Deep Learning

  • نورون چیست؟ What is Neuron

  • پرسپترون چند لایه Multi-Layer Perceptron

  • شبکه های عصبی کم عمق در مقابل شبکه های عصبی عمیق Shallow vs Deep Neural Networks

  • تابع فعال سازی Activation Function

  • پس انتشار چیست؟ What is Back Propagation

  • بهینه سازها در یادگیری عمیق Optimizers in Deep Learning

  • مراحل ساخت شبکه عصبی Steps to Build Neural Network

  • TensorfFlow را در ویندوز نصب کنید Install TensorfFlow in Windows

  • TensorFlow را در لینوکس نصب کنید Install TensorFlow in Linux

  • بارگیری مجموعه داده ها از دست دادن مشتری Customer Churn Dataset Loading

  • تجسم داده قسمت 1 Data Visualization Part 1

  • تجسم داده ها قسمت 2 Data Visualization Part 2

  • پیش پردازش داده ها Data Preprocessing

  • وارد کردن API های شبکه های عصبی Import Neural Networks APIs

  • نحوه دریافت شکل ورودی و وزن کلاس How to Get Input Shape and Class Weights

  • ساختمان مدل شبکه عصبی Neural Network Model Building

  • توضیح خلاصه مدل Model Summary Explanation

  • آموزش مدل Model Training

  • ارزیابی مدل Model Evaluation

  • ذخیره و بارگذاری مدل Model Save and Load

  • پیش بینی بر روی داده های زندگی واقعی Prediction on Real-Life Data

مقدمه ای بر پردازش زبان طبیعی (NLP) Introduction to Natural Language Processing (NLP)

  • مقدمه ای بر NLP Introduction to NLP

  • تکنیک های کلیدی NLP چیست؟ What are Key NLP Techniques

  • مروری بر ابزار NLP Overview of NLP Tools

  • چالش های رایج در NLP Common Challenges in NLP

  • کیسه کلمات - تکنیک جاسازی کلمات ساده Bag of Words - The Simples Word Embedding Technique

  • فرکانس مدت - فرکانس سند معکوس (TF-IDF) Term Frequency - Inverse Document Frequency (TF-IDF)

  • مجموعه داده های هرزنامه را بارگیری کنید Load Spam Dataset

  • پیش پردازش متن Text Preprocessing

  • مهندسی ویژگی Feature Engineering

  • طرح جفت Pair Plot

  • تقسیم تست قطار Train Test Split

  • بردارسازی TF-IDF TF-IDF Vectorization

  • ارزیابی مدل و پیش بینی بر روی داده های واقعی Model Evaluation and Prediction on Real Data

  • بارگذاری و ذخیره مدل Model Load and Store

نمایش نظرات

آموزش پایتون 2023 برای یادگیری ماشینی: راهنمای گام به گام
جزییات دوره
32 hours
280
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
8,324
4.6 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Laxmi Kant | KGP Talkie Laxmi Kant | KGP Talkie

دانشمند اصلی داده در mBreath و KGPTalkie من یک دانشمند اصلی داده در SleepDoc و دکترای تخصصی هستم. در علوم داده از موسسه فناوری هند (IIT). من همچنین یک شرکت با نام mBreath Technologies را تاسیس کردم. من بیش از 8 سال تجربه در علوم داده ، مدیریت تیم ، توسعه کسب و کار و مشخصات مشتری دارم. من با استارتاپ ها و MNC کار کرده ام. من همچنین چند سال در IIT برنامه نویسی تدریس کرده ام و بعداً یک کانال YouTube با KGP Talkie با مشترکان 20K + راه اندازی کردم. من ارتباط خوبی با صنعت و دانشگاه دارم.