لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش پایتون 2023 برای یادگیری ماشینی: راهنمای گام به گام
2023 Python for Machine Learning: A Step-by-Step Guide
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
پروژه های علم داده با رگرسیون خطی، رگرسیون لجستیک، جنگل تصادفی، SVM، KNN، KMeans، XGBoost، PCA و غیره مفاهیم و تکنیک های اساسی یادگیری ماشین، از جمله یادگیری تحت نظارت و بدون نظارت اجرای الگوریتم های مختلف یادگیری ماشین مانند رگرسیون خطی، لجستیک رگرسیون، k-نزدیکترین همسایه، درخت تصمیم، و غیره. تکنیک های ساخت و ارزیابی مدل های یادگیری ماشین، مانند انتخاب ویژگی، مهندسی ویژگی، و تکنیک های ارزیابی مدل. انواع مختلف معیارهای ارزیابی مدل، مانند دقت، دقت، و یادآوری و نحوه تفسیر آنها. استفاده از کتابخانه های یادگیری ماشینی مانند scikit-learn و پانداها برای ساخت و ارزیابی مدل ها. تجربه عملی کار بر روی مجموعه داده ها و پروژه های دنیای واقعی که به دانش آموزان این فرصت را می دهد تا مفاهیم و تکنیک های آموخته شده را در سراسر جهان به کار گیرند. توانایی تجزیه و تحلیل، تفسیر و ارائه نتایج مدل های یادگیری ماشین. درک مبادلات بین الگوریتم های مختلف یادگیری ماشین و مزایا و معایب آنها. درک بهترین شیوه ها برای توسعه، پیاده سازی و تفسیر مدل های یادگیری ماشین. مهارت در عیب یابی مشکلات رایج یادگیری ماشین و اشکال زدایی مدل های یادگیری ماشین. پیش نیازها: برخی از مفاهیم برنامه نویسی ریاضیات ابتدایی تمایل به یادگیری
به دوره آموزشی پروژه های یادگیری ماشینی ما خوش آمدید! این دوره برای افرادی طراحی شده است که می خواهند تجربه عملی در توسعه و پیاده سازی مدل های یادگیری ماشین کسب کنند. در طول دوره، مفاهیم و تکنیک های لازم برای ساخت و ارزیابی مدل های یادگیری ماشینی با استفاده از مجموعه داده های دنیای واقعی را خواهید آموخت.
ما اصول یادگیری ماشین را پوشش میدهیم، از جمله یادگیری تحت نظارت و بدون نظارت، و انواع مشکلاتی که با استفاده از این تکنیکها قابل حل هستند. همچنین با الگوریتمهای رایج یادگیری ماشین، مانند رگرسیون خطی، k-نزدیکترین همسایهها و درختهای تصمیم آشنا خواهید شد.
ML پیش نیازهای سخنرانی
دوره Crash Python: این یک دوره مقدماتی است که برای کمک به زبان آموزان در یادگیری سریع اصول اولیه زبان برنامه نویسی Python طراحی شده است.
Numpy: کتابخانه ای در پایتون است که از آرایه های چند بعدی بزرگ از انواع داده های همگن و مجموعه بزرگی از توابع ریاضی سطح بالا برای کار بر روی این آرایه ها پشتیبانی می کند.
Pandas: این یک کتابخانه در پایتون است که ساختارهای داده و ابزارهای تجزیه و تحلیل داده با استفاده آسان را ارائه می دهد. این در بالای Numpy ساخته شده است و به طور گسترده برای تمیز کردن، تبدیل و دستکاری داده ها استفاده می شود.
Matplotlib: یک کتابخانه رسم در پایتون است که طیف وسیعی از ابزارهای تجسم و پشتیبانی از انواع مختلف نمودارها را فراهم می کند. به طور گسترده برای کاوش و تجسم داده ها استفاده می شود.
Seaborn: این یک کتابخانه است که در بالای Matplotlib ساخته شده است که APIهای سطح بالاتری را برای ترسیم ساده تر و جذاب تر ارائه می دهد. به طور گسترده ای برای تجسم داده های آماری استفاده می شود.
Plotly: این یک کتابخانه منبع باز در پایتون است که تجسم های تعاملی و مبتنی بر وب را ارائه می دهد. از طیف گسترده ای از نمودارها پشتیبانی می کند و به طور گسترده برای ایجاد داشبوردهای تعاملی و تجسم داده ها برای وب استفاده می شود.
مدل های ML پوشش داده شده در این دوره
رگرسیون خطی: یک الگوریتم یادگیری نظارت شده که برای پیش بینی یک متغیر هدف پیوسته بر اساس مجموعه ای از متغیرهای مستقل استفاده می شود. یک رابطه خطی بین متغیرهای مستقل و وابسته را فرض می کند.
رگرسیون لجستیک: یک الگوریتم یادگیری نظارت شده که برای پیش بینی یک نتیجه باینری بر اساس مجموعه ای از متغیرهای مستقل استفاده می شود. از یک تابع لجستیک برای مدل سازی احتمال نتیجه استفاده می کند.
درختان تصمیم: یک الگوریتم یادگیری تحت نظارت که از یک مدل درخت مانند از تصمیمات و پیامدهای احتمالی آنها استفاده می کند. اغلب برای کارهای طبقه بندی و رگرسیون استفاده می شود.
جنگل تصادفی: یک الگوریتم یادگیری نظارت شده که چندین درخت تصمیم را ترکیب می کند تا دقت و ثبات پیش بینی ها را افزایش دهد. این یک روش مجموعه ای است که اضافه برازش را کاهش می دهد و تعمیم مدل را بهبود می بخشد.
ماشین بردار پشتیبان (SVM): یک الگوریتم یادگیری نظارت شده که برای کارهای طبقه بندی و رگرسیون استفاده می شود. بهترین مرز (یا ابر صفحه) را پیدا می کند که کلاس های مختلف را در داده ها جدا می کند.
K-Nearest Neighbors (KNN): یک الگوریتم یادگیری تحت نظارت که برای طبقه بندی و وظایف رگرسیون استفاده می شود. k نزدیکترین نقطه به یک نقطه داده جدید را پیدا می کند و آن را بر اساس کلاس اکثریت k نزدیکترین نقطه طبقه بندی می کند.
تنظیم فراپارامتر: فرآیند جستجوی سیستماتیک بهترین ترکیب فراپارامترها برای یک مدل یادگیری ماشینی است. برای بهینهسازی عملکرد مدل و جلوگیری از برازش بیش از حد با یافتن مجموعهای از پارامترهای بهینه که روی دادههای دیده نشده به خوبی کار میکنند، استفاده میشود.
AdaBoost: یک الگوریتم یادگیری تحت نظارت که با تنظیم وزن مشاهدات با داده ها سازگار می شود. این یک روش مجموعه ای است که برای کارهای طبقه بندی استفاده می شود.
XGBoost: یک الگوریتم یادگیری تحت نظارت که توسعهای از یک الگوریتم تقویت گرادیان است. این به طور گسترده در مسابقات Kaggle و پروژه های صنعتی استفاده می شود.
CatBoost: یک الگوریتم یادگیری تحت نظارت که برای مدیریت موثر متغیرهای طبقه بندی شده طراحی شده است.
مدلهای بدون نظارت
الگوریتم های خوشه بندی را می توان به طور کلی به سه نوع طبقه بندی کرد: مبتنی بر مرکز، مبتنی بر چگالی و سلسله مراتبی. الگوریتم های خوشه بندی مبتنی بر مرکز مانند k-means، گروه بندی نقاط داده بر اساس نزدیکی آنها به مرکز، یا نقطه مرکزی. الگوریتم های خوشه بندی مبتنی بر چگالی مانند DBSCAN، نقاط داده را بر اساس چگالی آنها در فضای ویژگی گروه بندی می کنند. الگوریتمهای خوشهبندی سلسله مراتبی مانند Agglomerative و Divisive سلسله مراتبی از خوشهها را با ادغام یا تقسیم کردن خوشهها به صورت تکراری ایجاد میکنند.
K-Means: یک الگوریتم خوشهبندی مبتنی بر مرکز که نقاط داده را بر اساس نزدیکی آنها به یک مرکز گروهبندی میکند. به طور گسترده ای برای خوشه بندی مجموعه داده های بزرگ استفاده می شود.
DBSCAN: یک الگوریتم خوشهبندی مبتنی بر چگالی که نقاط داده را بر اساس چگالی آنها در فضای ویژگی گروهبندی میکند. برای شناسایی خوشه هایی با شکل دلخواه مفید است.
خوشه بندی سلسله مراتبی: الگوریتمی که سلسله مراتبی از خوشه ها را با ادغام یا تقسیم خوشه ها به صورت مکرر ایجاد می کند. این می تواند ماهیت تجمعی یا تقسیم کننده داشته باشد.
خوشهبندی طیفی: یک الگوریتم خوشهبندی که با استفاده از بردارهای ویژه ماتریس شباهت دادهها، خوشهها را پیدا میکند.
تجزیه و تحلیل مؤلفه اصلی (PCA): یک تکنیک کاهش ابعاد است که داده ها را در فضایی با ابعاد پایین تر نمایش می دهد و در عین حال مهم ترین اطلاعات را حفظ می کند.
مدل های پیشرفته
یادگیری عمیق مقدمه: یادگیری عمیق زیرشاخه ای از یادگیری ماشینی است که از شبکه های عصبی مصنوعی با لایه های متعدد به نام شبکه های عصبی عمیق برای مدل سازی و حل مسائل پیچیده مانند تشخیص تصویر و پردازش زبان طبیعی استفاده می کند. این مبتنی بر این ایده است که یک شبکه عصبی می تواند یاد بگیرد که به طور خودکار نمایش داده ها را در سطوح مختلف انتزاع بیاموزد. پرسپترون چند لایه (MLP) یک نوع مدل یادگیری عمیق است که یک مدل شبکه عصبی مصنوعی پیشخور است که مجموعهای از دادههای ورودی را بر روی مجموعهای از خروجیهای مناسب نگاشت میکند. MLP یک الگوریتم یادگیری نظارت شده است که می تواند برای کارهای طبقه بندی و رگرسیون استفاده شود. MLP مبتنی بر این ایده است که یک شبکه عصبی با چندین لایه میتواند یاد بگیرد که به طور خودکار نمایش دادهها را در سطوح مختلف انتزاع بیاموزد.
پردازش زبان طبیعی (NLP): پردازش زبان طبیعی (NLP) حوزه ای از هوش مصنوعی است که به تعامل بین زبان انسان و رایانه می پردازد. یکی از تکنیک های رایج مورد استفاده در NLP اصطلاح فرکانس سند معکوس فرکانس (tf-idf) است. Tf-idf یک معیار آماری است که اهمیت یک کلمه را در یک سند یا مجموعه ای از اسناد نشان می دهد. اهمیت متناسب با تعداد دفعاتی که یک کلمه در سند ظاهر می شود افزایش می یابد اما با فراوانی کلمه در مجموعه جبران می شود. Tf-idf در NLP برای کارهایی مانند طبقه بندی متن، خوشه بندی متن و بازیابی اطلاعات استفاده می شود. همچنین در خلاصهسازی اسناد و استخراج ویژگی برای دادههای متنی استفاده میشود.
آیا شرایط یا پیش نیازهای دوره وجود دارد؟
هیچ سطح مهارت مقدماتی برنامه نویسی پایتون لازم نیست
کامپیوتر (مک، ویندوز یا لینوکس) داشته باشید
می خواهید یاد بگیرید!
این دوره برای چه کسانی است:
برنامه نویسان مبتدی پایتون.
برنامه نویسان مبتدی علوم داده.
دانشجویان علم داده و یادگیری ماشین.
هر کسی که علاقه مند به یادگیری بیشتر در مورد پایتون، علم داده، یا تجسم داده است.
هر کسی که به دنیای به سرعت در حال گسترش علم داده علاقه مند است!
توسعه دهندگانی که می خواهند در پروژه های تجزیه و تحلیل و تجسم کار کنند.
هر کسی که میخواهد قبل از استفاده از یادگیری ماشین، دادهها را کاوش و درک کند.
در طول دوره، شما به تیمی از مربیان با تجربه دسترسی خواهید داشت که در حین کار بر روی پروژه های شما راهنمایی و پشتیبانی می کنند. شما همچنین به جامعه ای از دانشجویان دیگر دسترسی خواهید داشت که در حین کار بر روی پروژه های خود، پشتیبانی و بازخورد بیشتری ارائه می دهند.
این دوره بصورت خود گام است، به این معنی که می توانید ماژول ها و پروژه ها را با سرعت خود تکمیل کنید،
سرفصل ها و درس ها
معرفی
Introduction
معرفی دوره
Course Introduction
مقدمه یادگیری ماشین
Machine Learning Introduction
آناکوندا و پایتون را روی ویندوز نصب کنید
Install Anaconda and Python on Windows
آناکوندا را در لینوکس نصب کنید
Install Anaconda in Linux
معرفی نوت بوک Jupyter و میانبرهای صفحه کلید
Jupyter Notebook Introduction and Keyboard Shortcuts
جایزه
Bonus
دوره سقوط پایتون
Python Crash Course
عملیات حسابی در پایتون
Arithmatic Operations in Python
انواع داده ها در پایتون
Data Types in Python
ریخته گری متغیر
Variable Casting
عملیات رشته ها در پایتون
Strings Operation in Python
برش رشته در پایتون
String Slicing in Python
قالب بندی و اصلاح رشته
String Formatting and Modification
متغیرهای بولی و ارزیابی
Boolean Variables and Evaluation
لیست در پایتون
List in Python
تاپل در پایتون
Tuple in Python
10 مجموعه
10 Set
فرهنگ لغت
Dictionary
اظهارات مشروط - اگر غیر از این باشد
Conditional Statements - If Else
در حالی که حلقه ها
While Loops
برای حلقه ها
For Loops
کارکرد
Functions
کار با تاریخ و زمان
Working with Date and Time
مدیریت فایل خواندن و نوشتن
File Handling Read and Write
دانشمند اصلی داده در mBreath و KGPTalkie من یک دانشمند اصلی داده در SleepDoc و دکترای تخصصی هستم. در علوم داده از موسسه فناوری هند (IIT). من همچنین یک شرکت با نام mBreath Technologies را تاسیس کردم. من بیش از 8 سال تجربه در علوم داده ، مدیریت تیم ، توسعه کسب و کار و مشخصات مشتری دارم. من با استارتاپ ها و MNC کار کرده ام. من همچنین چند سال در IIT برنامه نویسی تدریس کرده ام و بعداً یک کانال YouTube با KGP Talkie با مشترکان 20K + راه اندازی کردم. من ارتباط خوبی با صنعت و دانشگاه دارم.
نمایش نظرات