آموزش پروژه یادگیری ماشینی: تجزیه و تحلیل پیش بینی حمله قلبی

Machine Learning Project: Heart Attack Prediction Analysis

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: علم داده و یادگیری ماشین - با پروژه تجزیه و تحلیل حمله قلبی واقعی، یادگیری ماشینی، مهارت های آماری خود را تقویت کنید یادگیری ماشینی سیستم هایی را توصیف می کند که با استفاده از یک مدل آموزش دیده بر روی داده های دنیای واقعی، پیش بینی می کنند. یادگیری ماشینی فقط برای ارسال پیام کوتاه یا تشخیص صدای گوشی هوشمند مفید نیست. علم داده از الگوریتم ها برای درک داده های خام استفاده می کند. تفاوت اصلی بین علم داده و تحلیل داده های سنتی تمرکز آن بر پیش بینی است. علم داده شامل تهیه، تجزیه و تحلیل و پردازش داده ها می شود. این علم از بسیاری از زمینه‌های علمی استخراج می‌شود و به عنوان یک علم، با ایجاد الگوریتم جدید پیشرفت می‌کند. مرحله اول طراحی دفترچه یادداشت پروژه برای استفاده در پروژه بررسی موضوع پروژه شناسایی متغیرها در مجموعه داده های مورد نیاز کتابخانه های پایتون بارگیری مجموعه داده تجزیه و تحلیل اولیه روی مجموعه داده بررسی مقادیر گمشده بررسی مقادیر منحصر به فرد جداسازی متغیرها (عددی یا طبقه بندی) بررسی آماری متغیرها متغیرها (تحلیل با Distplot) متغیرهای طبقه‌بندی (تحلیل با نمودار دایره‌ای) بررسی داده‌های از دست رفته با توجه به نتیجه تحلیل متغیرهای عددی – متغیر هدف (تحلیل با FacetGrid) متغیرهای طبقه‌بندی – متغیر هدف (Amunterong Themesselami) تجزیه و تحلیل با طرح جفتی) مقیاس‌بندی ویژگی با روش مقیاس‌کننده قوی برای تجسم جدید ایجاد یک DataFrame جدید با تابع Melt() عددی - متغیرهای طبقه‌ای (تحلیل با نمودار ازدحام) متغیرهای عددی - دسته‌بندی متغیرها (تحلیل با نمودار جعبه‌ای (Analysis with Box PlotAlysipation) با Heatmap) رها کردن ستون‌ها با همبستگی کم تجسم پرت‌ها برخورد با نقاط پرت تعیین توزیع‌های متغیرهای عددی عملیات تبدیل بر روی داده‌های نامتقارن استفاده از یک روش رمزگذاری داغ برای متغیرهای طبقه‌بندی ویژگی‌های مقیاس‌گذاری با استفاده از Robust Hotgorit برای داده‌های Scaling و MethodsThorhm به ScalerSearchingSt. istic اعتبار سنجی متقاطع رگرسیون برای الگوریتم رگرسیون لجستیک منحنی Roc و ناحیه زیر منحنی (AUC) برای الگوریتم رگرسیون لجستیک بهینه‌سازی فراپارامتر (با GridSearchCV) برای الگوریتم رگرسیون لجستیکی الگوریتم درختی پشتیبانی از الگوریتم بردار ماشین الگوریتم RandomWiperTimd. الگوریتم نتیجه گیری پروژه و اشتراک گذاری پیش نیازها: تمایل به تسلط بر یادگیری ماشینی a-z، پایتون، علم داده، آمار دانش زبان برنامه نویسی پایتون آشنایی با کتابخانه های تجسم داده ها مانند Seaborn، Matplotlib در Python دانش یادگیری ماشینی پایه توانایی کار و نصب نرم افزار بر روی کامپیوتر رایگان نرم افزار و ابزار مورد استفاده در طول دوره عزم به یادگیری و صبر.

آموزش ماشین، پایتون، آمار، علم داده، پایتون یادگیری ماشین، علم داده پایتون، یادگیری ماشین a-z، دانشمند داده، r، پایتون برای علم داده


سلام،

به دوره «پروژه یادگیری ماشینی: تجزیه و تحلیل پیش‌بینی حمله قلبی» خوش آمدید.

علم داده‌های یادگیری ماشینی - مهارت‌های یادگیری ماشینی خود را با یک پروژه واقعی پیش‌بینی حمله قلبی تقویت کنید


یادگیری ماشینی سیستم‌هایی را توصیف می‌کند که با استفاده از یک مدل آموزش‌دیده بر روی داده‌های دنیای واقعی، پیش‌بینی می‌کنند. به عنوان مثال، فرض کنید می‌خواهیم سیستمی بسازیم که بتواند تشخیص دهد که آیا گربه در تصویر است یا خیر. ما ابتدا تصاویر زیادی را برای آموزش مدل یادگیری ماشین خود جمع آوری می کنیم. در طول این مرحله آموزشی، تصاویر را به همراه اطلاعاتی در مورد اینکه آیا آنها حاوی گربه هستند یا خیر، به مدل می‌دهیم. در حین آموزش، مدل الگوهایی را در تصاویر می آموزد که بیشترین ارتباط را با گربه ها دارند. سپس این مدل می‌تواند از الگوهای آموخته‌شده در طول آموزش برای پیش‌بینی اینکه آیا تصاویر جدیدی که از آن تغذیه می‌شود حاوی یک گربه هستند استفاده کند. در این مثال خاص، ممکن است از یک شبکه عصبی برای یادگیری این الگوها استفاده کنیم، اما یادگیری ماشینی می‌تواند بسیار ساده‌تر از این باشد.

یک دوره یادگیری ماشینی تکنیک ها و مفاهیم پشت متن پیشگویانه، دستیاران مجازی و هوش مصنوعی را به شما می آموزد. شما می توانید مهارت های اساسی مورد نیاز برای پیشرفت در ساخت شبکه های عصبی و ایجاد توابع پیچیده تر را از طریق زبان های برنامه نویسی پایتون و R توسعه دهید. آموزش یادگیری ماشین به شما کمک می‌کند از روندها، فناوری‌ها و برنامه‌های جدید در این زمینه جلوتر بمانید.

ما داده های بیشتری نسبت به قبل داریم. اما داده ها به تنهایی نمی توانند چیزهای زیادی در مورد دنیای اطراف به ما بگویند. ما باید اطلاعات را تفسیر کنیم و الگوهای پنهان را کشف کنیم. این جایی است که علم داده وارد می شود. علم داده از الگوریتم هایی برای درک داده های خام استفاده می کند. تفاوت اصلی بین علم داده و تحلیل داده های سنتی تمرکز آن بر پیش بینی است. علم داده به دنبال یافتن الگوهایی در داده ها و استفاده از آن الگوها برای پیش بینی داده های آینده است. برای پردازش مقادیر زیادی داده، کشف الگوها و پیش‌بینی روندها از یادگیری ماشینی استفاده می‌کند. علم داده شامل تهیه، تجزیه و تحلیل و پردازش داده ها می شود. از بسیاری از زمینه‌های علمی استخراج می‌شود و به عنوان یک علم، با ایجاد الگوریتم‌های جدید برای تجزیه و تحلیل داده‌ها و اعتبارسنجی روش‌های فعلی پیشرفت می‌کند.

کاربرد علم داده یک مهارت مورد تقاضا در بسیاری از صنایع در سراسر جهان است - از جمله امور مالی، حمل و نقل، آموزش، تولید، منابع انسانی، و بانکداری. دوره های علوم داده را با پایتون، آمار، یادگیری ماشینی و غیره کاوش کنید تا دانش خود را افزایش دهید. اگر اهل تحقیق، آمار و تجزیه و تحلیل هستید، آموزش علوم داده دریافت کنید.


آیا می دانید نیازهای علم داده تا سال 2026 11.5 میلیون فرصت شغلی ایجاد می کند؟


آیا می‌دانید متوسط ​​حقوق برای مشاغل علم داده 100.000 دلار است!


مشاغل علم داده در حال شکل دادن به آینده هستند

تقریباً در هر زمینه‌ای، از امنیت دولتی گرفته تا برنامه‌های دوستیابی، به متخصصان علوم داده نیاز است. میلیون ها کسب و کار و ادارات دولتی برای موفقیت و ارائه خدمات بهتر به مشتریان خود به داده های بزرگ متکی هستند. بنابراین مشاغل علم داده تقاضای زیادی دارند.


  • اگر می خواهید یکی از مهارت های مورد نیاز کارفرما را بیاموزید؟

  • اگر در مورد علم داده کنجکاو هستید و به دنبال شروع سفر خودآموز خود به دنیای داده با پایتون هستید؟

  • اگر یک توسعه دهنده باتجربه هستید و به دنبال یک فرود در Data Science هستید!

در همه موارد، شما در جای درستی هستید!

ما برای شما "یادگیری ماشینی با پروژه پیش بینی حمله واقعی" یک دوره آموزشی ساده برای زبان برنامه نویسی پایتون و یادگیری ماشین طراحی کرده ایم.

در دوره آموزشی، توضیحی ساده از پروژه خواهید داشت. با این دوره، شما یک پروژه علم داده را از ابتدا تا انتها انجام خواهید داد. من آن را با یک مثال واقعی ساده و آسان کردم.

ما درهای دنیای علم داده و یادگیری ماشین را باز خواهیم کرد و عمیق‌تر خواهیم رفت. شما اصول یادگیری ماشین و کتابخانه های زیبای آن مانند Scikit Learn را خواهید آموخت.

در طول دوره، نحوه استفاده از پایتون برای تجزیه و تحلیل داده‌ها، ایجاد تجسم‌های زیبا و استفاده از الگوریتم‌های یادگیری ماشین قدرتمند را به شما آموزش می‌دهیم.

این دوره آموزشی یادگیری ماشین علم داده برای همه است!

Python یک زبان برنامه نویسی همه منظوره، سطح بالا و چند منظوره است. بهترین چیز در مورد پایتون این است که از بسیاری از فناوری‌های امروزی از جمله کتابخانه‌های وسیع برای توییتر، داده‌کاوی، محاسبات علمی، طراحی، سرور بک‌اند برای وب‌سایت‌ها، شبیه‌سازی‌های مهندسی، یادگیری مصنوعی، واقعیت افزوده و غیره پشتیبانی می‌کند! همچنین، از انواع برنامه‌نویسی پشتیبانی می‌کند.

چه چیزی یاد خواهید گرفت؟

در این دوره، ما از ابتدا شروع می‌کنیم و با استفاده از مجموعه داده‌های حمله قلبی تا پایان «یادگیری ماشین» می‌رویم.

قبل از هر درس، یک بخش تئوری وجود خواهد داشت. پس از یادگیری قسمت های تئوری، موضوع را با مثال های عملی تقویت می کنیم.

در طول دوره، موضوعات زیر را مشاهده خواهید کرد:


  • مقدمه

اولین گام به پروژه

طراحی نوت بوک مورد استفاده در پروژه

بررسی موضوع پروژه

تشخیص متغیرها در مجموعه داده


  • اولین سازمان

کتابخانه های مورد نیاز پایتون

در حال بارگیری مجموعه داده

تحلیل اولیه در مجموعه داده


  • آماده سازی برای تجزیه و تحلیل داده های اکتشافی (EDA)

بررسی مقادیر گمشده

بررسی مقادیر منحصر به فرد

جداسازی متغیرها (عددی یا دسته‌ای)

بررسی آمار متغیرها


  • تجزیه و تحلیل داده های اکتشافی (EDA) - تجزیه و تحلیل تک متغیره

متغیرهای عددی (تجزیه و تحلیل با Distplot): درس 1

متغیرهای عددی (تجزیه و تحلیل با Distplot): درس 2

متغیرهای طبقه بندی شده (تحلیل با نمودار دایره ای): درس 1

متغیرهای طبقه بندی شده (تجزیه و تحلیل با نمودار دایره ای): درس 2

بررسی داده های از دست رفته بر اساس نتایج تجزیه و تحلیل


  • تجزیه و تحلیل داده های اکتشافی (EDA) - تجزیه و تحلیل دو متغیره

متغیرهای عددی – متغیر هدف (تحلیل با FacetGrid): درس 1

متغیرهای عددی – متغیر هدف (تحلیل با FacetGrid): درس 2

متغیرهای طبقه بندی – متغیر هدف (تحلیل با نمودار شمارش): درس 1

متغیرهای طبقه بندی – متغیر هدف (تحلیل با نمودار شمارش): درس 2

بررسی متغیرهای عددی در بین خود (تحلیل با نمودار زوجی) درس 1

بررسی متغیرهای عددی در بین خود (تحلیل با نمودار زوجی) درس 2

مقیاس‌سازی ویژگی با روش مقیاس‌کننده قوی

ایجاد یک DataFrame جدید با تابع Melt()

متغیرهای عددی - دسته‌ای (تحلیل با نمودار ازدحام): درس 1

متغیرهای عددی - دسته‌ای (تحلیل با نمودار ازدحام): درس 2

متغیرهای عددی - دسته بندی (تحلیل با نمودار جعبه): درس 1

متغیرهای عددی - دسته بندی (تحلیل با نمودار جعبه): درس 2

روابط بین متغیرها (تجزیه و تحلیل با Heatmap): درس 1

روابط بین متغیرها (تجزیه و تحلیل با Heatmap): درس 2


  • آماده سازی برای مدل سازی

افتادن ستون ها با همبستگی کم

تجسم موارد پرت

برخورد با موارد پرت – متغیر Trtbps: درس 1

برخورد با موارد پرت – متغیر Trtbps: درس 2

برخورد با موارد پرت – متغیر Thalach

برخورد با Outliers – Oldpeak Variable

تعیین توزیع متغیرهای عددی

عملیات تبدیل در داده های نامتقارن

استفاده از یک روش رمزگذاری داغ برای متغیرهای طبقه بندی شده

مقیاس‌سازی ویژگی با روش مقیاس‌کننده قوی برای الگوریتم‌های یادگیری ماشین

تفکیک داده ها به مجموعه تست و آموزش


  • مدل سازی

رگرسیون لجستیک

تایید متقابل

منحنی راک و ناحیه زیر منحنی (AUC)

بهینه سازی Hyperparameter (با GridSearchCV)

الگوریتم درخت تصمیم

پشتیبانی از الگوریتم ماشین برداری

الگوریتم جنگل تصادفی

بهینه سازی Hyperparameter (با GridSearchCV)


  • نتیجه گیری

نتیجه‌گیری و اشتراک‌گذاری پروژه


سوالات متداول درباره یادگیری ماشین، علم داده

یادگیری ماشینی چیست؟

یادگیری ماشینی سیستم‌هایی را توصیف می‌کند که با استفاده از یک مدل آموزش‌دیده بر روی داده‌های دنیای واقعی، پیش‌بینی می‌کنند. به عنوان مثال، فرض کنید می‌خواهیم سیستمی بسازیم که بتواند تشخیص دهد که آیا گربه در تصویر است یا خیر. ما ابتدا تصاویر زیادی را برای آموزش مدل یادگیری ماشین خود جمع آوری می کنیم. در طول این مرحله آموزشی، تصاویر را به همراه اطلاعاتی در مورد اینکه آیا آنها حاوی گربه هستند یا خیر، به مدل می‌دهیم. در حین آموزش، مدل الگوهایی را در تصاویر می آموزد که بیشترین ارتباط را با گربه ها دارند. سپس این مدل می‌تواند از الگوهای آموخته‌شده در طول آموزش برای پیش‌بینی اینکه آیا تصاویر جدیدی که از آن تغذیه می‌شود حاوی یک گربه هستند استفاده کند. در این مثال خاص، ممکن است از یک شبکه عصبی برای یادگیری این الگوها استفاده کنیم، اما یادگیری ماشینی می تواند بسیار ساده تر از این باشد. حتی برازش یک خط به مجموعه ای از نقاط داده مشاهده شده، و استفاده از آن خط برای انجام پیش بینی های جدید، به عنوان یک مدل یادگیری ماشین به حساب می آید.


یادگیری ماشین برای چه مواردی استفاده می شود؟

امروزه یادگیری ماشین تقریباً در هر زمینه ای اعمال می شود. این شامل تشخیص های پزشکی، تشخیص چهره، پیش بینی آب و هوا، پردازش تصویر و موارد دیگر است. در هر موقعیتی که در آن تشخیص، پیش‌بینی و تحلیل الگو حیاتی است، یادگیری ماشین می‌تواند مفید باشد. یادگیری ماشینی اغلب زمانی که در صنایع و جایگاه‌های جدید به کار می‌رود، یک فناوری مخرب است. مهندسان یادگیری ماشین می‌توانند راه‌های جدیدی برای اعمال فناوری یادگیری ماشین برای بهینه‌سازی و خودکارسازی فرآیندهای موجود بیابند. با داده‌های مناسب، می‌توانید از فناوری یادگیری ماشین برای شناسایی الگوهای بسیار پیچیده و پیش‌بینی‌های بسیار دقیق استفاده کنید.


آیا یادگیری ماشینی نیاز به کدنویسی دارد؟

استفاده از یادگیری ماشینی بدون کدنویسی امکان پذیر است، اما ساختن سیستم های جدید معمولاً به کد نیاز دارد. به عنوان مثال، سرویس Rekognition آمازون به شما امکان می دهد یک تصویر را از طریق یک مرورگر وب آپلود کنید، که سپس اشیاء موجود در تصویر را شناسایی می کند. این از یک مدل از پیش آموزش دیده استفاده می کند، بدون نیاز به کدنویسی. با این حال، توسعه سیستم‌های یادگیری ماشینی شامل نوشتن کدهای پایتون برای آموزش، تنظیم و استقرار مدل‌های شما است. اجتناب از نوشتن کد برای پیش پردازش داده های وارد شده به مدل شما دشوار است. بیشتر کارهایی که توسط یک متخصص یادگیری ماشین انجام می شود شامل تمیز کردن داده های مورد استفاده برای آموزش ماشین است. آنها همچنین "مهندسی ویژگی" را برای یافتن اینکه از چه داده هایی استفاده کنند و چگونه آنها را برای استفاده در یک مدل یادگیری ماشین آماده کنند، انجام می دهند. ابزارهایی مانند AutoML و SageMaker تنظیم خودکار مدل ها را انجام می دهند. اغلب فقط چند خط کد می تواند یک مدل را آموزش دهد و از روی آن پیش بینی کند. درک مقدماتی پایتون شما را در استفاده از سیستم های یادگیری ماشین موثرتر می کند.


بهترین زبان برای یادگیری ماشین چیست؟

Python پرکاربردترین زبان در یادگیری ماشینی است. مهندسانی که سیستم های یادگیری ماشینی را می نویسند اغلب از نوت بوک های Jupyter و Python با هم استفاده می کنند. Jupyter Notebooks یک برنامه کاربردی وب است که با ایجاد و به اشتراک گذاری اسنادی که حاوی کدهای زنده، معادلات و موارد دیگر هستند، امکان آزمایش را فراهم می کند. یادگیری ماشینی شامل آزمون و خطا می شود تا ببینیم کدام ابرپارامترها و انتخاب های مهندسی ویژگی بهترین کار را دارند. داشتن یک محیط توسعه مانند پایتون مفید است تا قبل از اجرای هر بار نیازی به کامپایل و بسته بندی کد نداشته باشید. پایتون تنها انتخاب زبان برای یادگیری ماشینی نیست. Tensorflow یک چارچوب محبوب برای توسعه شبکه های عصبی است و یک API C++ ارائه می دهد. یک چارچوب یادگیری ماشینی برای سی شارپ به نام ML وجود دارد. خالص. اسکالا یا جاوا گاهی با آپاچی اسپارک برای ساختن سیستم‌های یادگیری ماشینی که مجموعه‌های عظیم داده را دریافت می‌کنند، استفاده می‌شوند. ممکن است متوجه شوید که از زبان های مختلف زیادی در یادگیری ماشین استفاده می کنید، اما پایتون مکان خوبی برای شروع است.


انواع مختلف یادگیری ماشینی چیست؟

یادگیری ماشین به طور کلی بین یادگیری ماشین نظارت شده و یادگیری ماشین بدون نظارت تقسیم می شود. در یادگیری ماشینی تحت نظارت، ما مدل‌های یادگیری ماشینی را روی داده‌های برچسب‌دار آموزش می‌دهیم. به عنوان مثال، الگوریتمی که برای تشخیص هرزنامه است ممکن است هزاران آدرس ایمیل با برچسب "هرزنامه" یا "غیر هرزنامه" را وارد کند. آن مدل آموزش‌دیده می‌تواند ایمیل‌های هرزنامه جدید را حتی از روی داده‌هایی که هرگز دیده نشده است شناسایی کند. در یادگیری بدون نظارت، یک مدل یادگیری ماشینی به دنبال الگوهایی در داده‌های بدون ساختار می‌گردد. یکی از انواع یادگیری های بدون نظارت، خوشه بندی است. در این مثال، یک مدل می‌تواند فیلم‌های مشابه را با مطالعه فیلم‌نامه‌ها یا بازیگران آن‌ها شناسایی کند، سپس فیلم‌ها را با هم در ژانرها گروه‌بندی کند. این مدل بدون نظارت آموزش ندیده بود که بداند یک فیلم به کدام ژانر تعلق دارد. بلکه ژانرها را با مطالعه ویژگی های خود فیلم ها آموخت. تکنیک های زیادی در این دو نوع یادگیری ماشینی وجود دارد، به عنوان مثال یادگیری عمیق، یادگیری تقویتی، و موارد دیگر.


آیا یادگیری ماشینی شغل خوبی است؟

یادگیری ماشین یکی از سریع‌ترین و پرطرفدارترین مشاغل علوم رایانه امروزی است. به طور مداوم در حال رشد و تکامل، می توانید یادگیری ماشینی را در صنایع مختلف، از حمل و نقل و تکمیل تا علوم پزشکی، اعمال کنید. مهندسان یادگیری ماشین برای ایجاد هوش مصنوعی کار می کنند که بتواند الگوها را بهتر شناسایی کند و مشکلات را حل کند. رشته یادگیری ماشینی اغلب با فناوری های پیشرفته و مخرب سر و کار دارد. با این حال، چون به یک انتخاب شغلی محبوب تبدیل شده است، می تواند رقابتی نیز باشد. مهندسان مشتاق یادگیری ماشین می‌توانند از طریق گواهی‌نامه‌ها، اردوهای راه‌اندازی، ارسال‌های مخزن کد و تجربه عملی، خود را از رقبا متمایز کنند.


تفاوت بین یادگیری ماشین و هوش مصنوعی چیست؟

یادگیری ماشین زیرمجموعه کوچکتری از طیف وسیع‌تر هوش مصنوعی است. در حالی که هوش مصنوعی هر "ماشین هوشمند" را توصیف می کند که می تواند اطلاعات را استخراج کند و تصمیم بگیرد، یادگیری ماشین روشی را توصیف می کند که از طریق آن می تواند این کار را انجام دهد. از طریق یادگیری ماشین، برنامه‌ها می‌توانند دانش را بدون ارائه صریح کاربر به دست آورند. این یکی از اولین و اولین گام ها به سمت "هوش مصنوعی واقعی" است و برای کاربردهای عملی متعدد بسیار مفید است. در برنامه‌های یادگیری ماشین، هوش مصنوعی مجموعه‌ای از اطلاعات را تغذیه می‌کند. از این مجموعه اطلاعات می آموزد که چه چیزی را باید انتظار داشت و چه چیزی را پیش بینی کرد. اما همچنان محدودیت هایی دارد. یک مهندس یادگیری ماشین باید اطمینان حاصل کند که هوش مصنوعی اطلاعات درستی را دریافت می کند و می تواند از منطق آن برای تجزیه و تحلیل صحیح آن اطلاعات استفاده کند.


یک مهندس یادگیری ماشین باید چه مهارت هایی را بداند؟

یک مهندس یادگیری ماشین باید یک برنامه نویس بسیار ماهر با دانش عمیق علوم کامپیوتر، ریاضیات، علم داده و نظریه هوش مصنوعی باشد. مهندسان یادگیری ماشین باید بتوانند عمیقاً در برنامه های کاربردی پیچیده و برنامه نویسی آنها کاوش کنند. مانند سایر رشته‌ها، مهندسین یادگیری ماشین سطح پایه و مهندسین یادگیری ماشینی با تخصص سطح بالا وجود دارند. Python و R دو تا از محبوب‌ترین زبان‌ها در زمینه یادگیری ماشین هستند.


علم داده چیست؟

ما داده های بیشتری نسبت به قبل داریم. اما داده ها به تنهایی نمی توانند چیزهای زیادی در مورد دنیای اطراف به ما بگویند. ما باید اطلاعات را تفسیر کنیم و الگوهای پنهان را کشف کنیم. این جایی است که علم داده وارد می شود. علم داده از الگوریتم هایی برای درک داده های خام استفاده می کند. تفاوت اصلی بین علم داده و تحلیل داده های سنتی تمرکز آن بر پیش بینی است. علم داده به دنبال یافتن الگوهایی در داده ها و استفاده از آن الگوها برای پیش بینی داده های آینده است. برای پردازش مقادیر زیادی داده، کشف الگوها و پیش‌بینی روندها از یادگیری ماشینی استفاده می‌کند. علم داده شامل تهیه، تجزیه و تحلیل و پردازش داده ها می شود. از بسیاری از زمینه‌های علمی استخراج می‌شود و به عنوان یک علم، با ایجاد الگوریتم‌های جدید برای تجزیه و تحلیل داده‌ها و اعتبارسنجی روش‌های فعلی پیشرفت می‌کند.


یک دانشمند داده چه کاری انجام می دهد؟

دانشمندان داده از یادگیری ماشینی برای کشف الگوهای پنهان در مقادیر زیادی از داده های خام استفاده می کنند تا مشکلات واقعی را روشن کنند. این به چندین مرحله نیاز دارد. ابتدا باید یک مشکل مناسب را شناسایی کنند. در مرحله بعد، آنها تعیین می کنند که برای حل چنین وضعیتی به چه داده هایی نیاز است و نحوه بدست آوردن داده ها را مشخص می کنند. پس از به دست آوردن داده ها، آنها باید داده ها را تمیز کنند. ممکن است داده ها به درستی قالب بندی نشده باشند، ممکن است داده های غیرضروری اضافی داشته باشند، ممکن است ورودی هایی نداشته باشند یا برخی از داده ها نادرست باشند. بنابراین دانشمندان داده باید قبل از تجزیه و تحلیل داده ها از تمیز بودن داده ها اطمینان حاصل کنند. برای تجزیه و تحلیل داده ها، آنها از تکنیک های یادگیری ماشین برای ساخت مدل ها استفاده می کنند. پس از ایجاد یک مدل، آنها را آزمایش، اصلاح و در نهایت به تولید می‌رسانند.


محبوب ترین زبان های برنامه نویسی برای علم داده کدامند؟

پایتون محبوب ترین زبان برنامه نویسی برای علم داده است. این یک زبان جهانی است که کتابخانه های زیادی در دسترس دارد. همچنین یک زبان مبتدی خوب است. R نیز محبوب است. با این حال، پیچیده تر است و برای تجزیه و تحلیل آماری طراحی شده است. اگر می خواهید در تجزیه و تحلیل آماری تخصص داشته باشید، ممکن است انتخاب خوبی باشد. شما می خواهید پایتون یا R و SQL را بدانید. SQL یک زبان پرس و جو است که برای پایگاه داده های رابطه ای طراحی شده است. دانشمندان داده با حجم زیادی از داده ها سر و کار دارند و بسیاری از این داده ها را در پایگاه های داده رابطه ای ذخیره می کنند. این سه زبان برنامه نویسی پرکاربرد هستند. زبان های دیگری مانند جاوا، سی پلاس پلاس، جاوا اسکریپت و اسکالا نیز استفاده می شوند، البته کمتر. اگر قبلاً سابقه ای در آن زبان ها دارید، می توانید ابزارهای موجود در آن زبان ها را بررسی کنید. با این حال، اگر از قبل زبان برنامه نویسی دیگری می دانید، احتمالاً می توانید خیلی سریع پایتون را انتخاب کنید.


چه مدت طول می کشد تا دانشمند داده شوید؟

البته این پاسخ متفاوت است. هر چه زمان بیشتری را به یادگیری مهارت های جدید اختصاص دهید، سریع تر یاد خواهید گرفت. همچنین به محل شروع شما بستگی دارد. اگر در حال حاضر پایه قوی در ریاضیات و آمار دارید، کمتر برای یادگیری خواهید داشت. اگر هیچ پیش زمینه ای در آمار یا ریاضیات پیشرفته ندارید، همچنان می توانید دانشمند داده شوید. فقط کمی بیشتر طول می کشد. علم داده به یادگیری مادام العمر نیاز دارد، بنابراین شما هرگز واقعاً یادگیری را به پایان نخواهید رساند. یک سوال بهتر ممکن است این باشد، "چگونه می توانم اندازه گیری کنم که آیا دانش کافی برای تبدیل شدن به یک دانشمند داده دارم یا خیر؟" خود را برای تکمیل پروژه های علم داده با استفاده از داده های باز به چالش بکشید. هر چه بیشتر تمرین کنید، بیشتر یاد خواهید گرفت و اعتماد به نفس بیشتری خواهید داشت. هنگامی که چندین پروژه دارید که می توانید به عنوان یک دانشمند داده به نمونه های خوبی از مجموعه مهارت های خود اشاره کنید، آماده ورود به این حوزه هستید.


چگونه می توانم علم داده را به تنهایی یاد بگیرم؟

این امکان وجود دارد که علم داده را به تنهایی یاد بگیرید، به شرطی که تمرکز و انگیزه داشته باشید. خوشبختانه تعداد زیادی دوره آنلاین و بوت کمپ در دسترس است. با تعیین آنچه در علم داده به شما علاقه مند است شروع کنید. اگر به تجسم ها گرایش دارید، شروع به یادگیری در مورد آنها کنید. شروع با چیزی که شما را هیجان زده می کند، شما را برای برداشتن اولین قدم تشویق می کند. اگر مطمئن نیستید از کجا می خواهید شروع کنید، سعی کنید با یادگیری پایتون شروع کنید. این یک مقدمه عالی برای زبان های برنامه نویسی است و به عنوان یک دانشمند داده مفید خواهد بود. با کار کردن از طریق آموزش ها یا دوره های آکادمی بلوط در مورد موضوع انتخابی خود شروع کنید. هنگامی که پایه ای در مهارت های مورد علاقه خود ایجاد کردید، صحبت با فردی در این زمینه می تواند کمک کند. دریابید که کارفرمایان به دنبال چه مهارت هایی هستند و به یادگیری آن مهارت ها ادامه دهید. وقتی به تنهایی یاد می گیرید، تعیین اهداف یادگیری عملی می تواند انگیزه شما را حفظ کند.


آیا علم داده نیاز به کدنویسی دارد؟

هیئت داوران هنوز در این مورد حاضر نیستند. برخی از مردم بر این باورند که بدون دانستن نحوه کدنویسی می‌توان دانشمند داده شد، اما برخی دیگر مخالف هستند. الگوریتم های زیادی در این زمینه توسعه و بهینه سازی شده است. می‌توانید استدلال کنید که درک نحوه استفاده از الگوریتم‌ها مهم‌تر از نحوه کدنویسی آنهاست. با رشد این زمینه، پلتفرم های بیشتری در دسترس هستند که بسیاری از فرآیندها را خودکار می کنند. با این حال، همانطور که اکنون مطرح است، کارفرمایان در درجه اول به دنبال افرادی هستند که بتوانند کدنویسی کنند و شما به مهارت های برنامه نویسی اولیه نیاز دارید. نقش دانشمند داده در حال تکامل است، به طوری که ممکن است در آینده درست نباشد. بهترین توصیه این است که مسیری را پیدا کنید که متناسب با مجموعه مهارت شما باشد.


یک دانشمند داده چه مهارت هایی را باید بداند؟

یک دانشمند داده به مهارت های زیادی نیاز دارد. آنها به درک قوی از تجزیه و تحلیل آماری و ریاضیات نیاز دارند که از ارکان اساسی علم داده هستند. درک خوب این مفاهیم به شما در درک مقدمات اساسی علم داده کمک می کند. آشنایی با یادگیری ماشین نیز مهم است. یادگیری ماشین ابزار ارزشمندی برای یافتن الگوها در مجموعه داده های بزرگ است. برای مدیریت مجموعه داده های بزرگ، دانشمندان داده باید با پایگاه های داده آشنا باشند. زبان پرس و جو ساختاریافته (SQL) یک مهارت ضروری برای دانشمندان داده است. با این حال، پایگاه داده های غیر رابطه ای (NoSQL) در حال افزایش محبوبیت هستند، بنابراین درک بیشتر ساختار پایگاه داده مفید است. زبان برنامه نویسی غالب در علم داده پایتون است – اگرچه R نیز محبوب است. پایه حداقل یکی از این زبان ها نقطه شروع خوبی است. در نهایت، برای برقراری ارتباط با یافته ها، دانشمندان داده به دانش تجسم ها نیاز دارند. تجسم داده‌ها به آن‌ها اجازه می‌دهد تا داده‌های پیچیده را به شیوه‌ای در دسترس به اشتراک بگذارند.


آیا علم داده شغل خوبی است؟

تقاضا برای دانشمندان داده در حال افزایش است. ما فقط دانشمندان داده نداریم. ما مهندسان داده، مدیران داده، و مدیران تجزیه و تحلیل داریم. مشاغل نیز به طور کلی پرداخت خوبی دارند. این ممکن است شما را متعجب کند که آیا این یک شغل امیدوارکننده برای شما خواهد بود. درک بهتر از نوع کاری که یک دانشمند داده انجام می دهد می تواند به شما کمک کند تا بفهمید که آیا ممکن است این مسیر برای شما باشد یا خیر. اول از همه، شما باید تحلیلی فکر کنید. علم داده در مورد به دست آوردن درک عمیق تر از اطلاعات از طریق داده است. آیا اطلاعات را بررسی می کنید و از غواصی در آمار لذت می برید؟ اگرچه کار واقعی ممکن است کاملاً فنی باشد، یافته‌ها هنوز نیاز به اطلاع رسانی دارند. آیا می توانید یافته های پیچیده را برای کسی که سابقه فنی ندارد توضیح دهید؟ بسیاری از دانشمندان داده در تیم های متقابل کار می کنند و باید نتایج خود را با افراد با پیشینه های بسیار متفاوت به اشتراک بگذارند. اگر این یک محیط کاری عالی به نظر می رسد، ممکن است شغلی امیدوارکننده برای شما باشد.


با دوره به روز من، شما این شانس را خواهید داشت که خود را به روز نگه دارید و خود را با طیف وسیعی از مهارت های برنامه نویسی پایتون مجهز کنید. همچنین خوشحالم که به شما بگویم که برای حمایت از یادگیری شما و پاسخگویی به سوالات دائماً در دسترس خواهم بود.

چرا می خواهید در این دوره شرکت کنید؟

پاسخ ما ساده است: کیفیت آموزش.

وقتی ثبت نام می کنید، تخصص توسعه دهندگان باتجربه OAK Academy را احساس خواهید کرد. ،


کیفیت تولید ویدیو و صدا

همه ویدیوهای ما به صورت ویدیو و صوتی با کیفیت بالا ایجاد/تولید می شوند تا بهترین تجربه یادگیری را به شما ارائه دهند.

شما خواهید بود،

  • دیدن واضح

  • شنیدن واضح

  • حرکت در طول دوره بدون حواس‌پرتی


شما همچنین دریافت خواهید کرد:

دسترسی مادام العمر به دوره

پشتیبانی سریع دوستانه در بخش Q A

گواهی تکمیل Udemy برای دانلود آماده است

ما پشتیبانی کامل را ارائه می‌کنیم و به هر سؤالی پاسخ می‌دهیم.

اگر برای یادگیری آماده هستید

در حال حاضر وارد شوید؛ پروژه یادگیری ماشینی: تجزیه و تحلیل پیش بینی حمله قلبی

یادگیری ماشینی علم داده - مهارت های یادگیری ماشینی و آمار خود را با یک پروژه تجزیه و تحلیل واقعی حمله قلبی تقویت کنید

در دوره می بینمت!



سرفصل ها و درس ها

مقدمه ای بر یادگیری ماشینی با پروژه پیش بینی حمله واقعی قلب Introduction to Machine Learning with Real Hearth Attack Prediction Project

  • اولین قدم برای پروژه پیش بینی حمله به قلب First Step to the Hearth Attack Prediction Project

  • سوالات متداول در مورد یادگیری ماشین، علم داده FAQ about Machine Learning, Data Science

  • طراحی نوت بوک برای استفاده در پروژه Notebook Design to be Used in the Project

  • فایل لینک پروژه - پروژه پیش بینی حمله به قلب، یادگیری ماشینی Project Link File - Hearth Attack Prediction Project, Machine Learning

  • بررسی موضوع پروژه Examining the Project Topic

  • شناسایی متغیرها در مجموعه داده Recognizing Variables In Dataset

  • امتحان Quiz

سازمان اول First Organization

  • کتابخانه های مورد نیاز پایتون Required Python Libraries

  • بارگیری مجموعه داده های آماری در علم داده Loading the Statistics Dataset in Data Science

  • تجزیه و تحلیل اولیه روی مجموعه داده Initial analysis on the dataset

  • امتحان Quiz

آماده سازی برای تجزیه و تحلیل داده های اکتشافی (EDA) در علم داده Preparation For Exploratory Data Analysis (EDA) in Data Science

  • بررسی ارزش های گمشده Examining Missing Values

  • بررسی ارزش های منحصر به فرد Examining Unique Values

  • جداسازی متغیرها (عددی یا طبقه ای) Separating variables (Numeric or Categorical)

  • بررسی آمار متغیرها Examining Statistics of Variables

  • امتحان Quiz

تجزیه و تحلیل داده های اکتشافی (EDA) - تجزیه و تحلیل تک متغیره Exploratory Data Analysis (EDA) - Uni-variate Analysis

  • متغیرهای عددی (تحلیل با Distplot): درس 1 Numeric Variables (Analysis with Distplot): Lesson 1

  • متغیرهای عددی (تحلیل با Distplot): درس 2 Numeric Variables (Analysis with Distplot): Lesson 2

  • متغیرهای طبقه بندی شده (تحلیل با نمودار دایره ای): درس 1 Categoric Variables (Analysis with Pie Chart): Lesson 1

  • متغیرهای دسته بندی (تحلیل با نمودار دایره ای): درس 2 Categoric Variables (Analysis with Pie Chart): Lesson 2

  • بررسی داده های از دست رفته بر اساس نتایج تجزیه و تحلیل Examining the Missing Data According to the Analysis Result

  • امتحان Quiz

تجزیه و تحلیل داده های اکتشافی (EDA) - تجزیه و تحلیل دو متغیره Exploratory Data Analysis (EDA) - Bi-variate Analysis

  • متغیرهای عددی – متغیر هدف (تحلیل با FacetGrid): درس 1 Numeric Variables – Target Variable (Analysis with FacetGrid): Lesson 1

  • متغیرهای عددی – متغیر هدف (تحلیل با FacetGrid): درس 2 Numeric Variables – Target Variable (Analysis with FacetGrid): Lesson 2

  • متغیرهای طبقه بندی – متغیر هدف (تحلیل با نمودار شمارش): درس 1 Categoric Variables – Target Variable (Analysis with Count Plot): Lesson 1

  • متغیرهای دسته‌بندی – متغیر هدف (تحلیل با نمودار شمارش): درس 2 Categoric Variables – Target Variable (Analysis with Count Plot): Lesson 2

  • بررسی متغیرهای عددی در بین خود (تحلیل با نمودار زوجی) درس 1 Examining Numeric Variables Among Themselves (Analysis with Pair Plot) Lesson 1

  • بررسی متغیرهای عددی در بین خود (تحلیل با نمودار زوجی) درس 2 Examining Numeric Variables Among Themselves (Analysis with Pair Plot) Lesson 2

  • مقیاس‌بندی ویژگی با روش مقیاس‌کننده قوی Feature Scaling with the Robust Scaler Method

  • ایجاد یک DataFrame جدید با تابع Melt(). Creating a New DataFrame with the Melt() Function

  • متغیرهای عددی - دسته بندی (تحلیل با نمودار ازدحام): درس 1 Numerical - Categorical Variables (Analysis with Swarm Plot): Lesson 1

  • متغیرهای عددی - دسته بندی (تحلیل با نمودار ازدحام): درس 2 Numerical - Categorical Variables (Analysis with Swarm Plot): Lesson 2

  • متغیرهای عددی - دسته بندی (تحلیل با نمودار جعبه): درس 1 Numerical - Categorical Variables (Analysis with Box Plot): Lesson 1

  • متغیرهای عددی - دسته بندی (تحلیل با نمودار جعبه): درس 2 Numerical - Categorical Variables (Analysis with Box Plot): Lesson 2

  • روابط بین متغیرها (تحلیل با نقشه حرارتی): درس 1 Relationships between variables (Analysis with Heatmap): Lesson 1

  • روابط بین متغیرها (تحلیل با نقشه حرارتی): درس 2 Relationships between variables (Analysis with Heatmap): Lesson 2

  • امتحان Quiz

آمادگی برای مدلسازی در یادگیری ماشینی Preparation for Modelling in Machine Learning

  • رها کردن ستون ها با همبستگی کم Dropping Columns with Low Correlation

  • تجسم نقاط پرت Visualizing Outliers

  • برخورد با موارد پرت – متغیر Trtbps: درس 1 Dealing with Outliers – Trtbps Variable: Lesson 1

  • برخورد با موارد پرت – متغیر Trtbps: درس 2 Dealing with Outliers – Trtbps Variable: Lesson 2

  • برخورد با موارد دور از دسترس - متغیر Thalach Dealing with Outliers – Thalach Variable

  • برخورد با موارد دور از دسترس - متغیر Oldpeak Dealing with Outliers – Oldpeak Variable

  • تعیین توزیع متغیرهای عددی Determining Distributions of Numeric Variables

  • عملیات تبدیل بر روی داده های نامتقارن Transformation Operations on Unsymmetrical Data

  • استفاده از یک روش کدگذاری داغ برای متغیرهای طبقه بندی شده Applying One Hot Encoding Method to Categorical Variables

  • مقیاس‌بندی ویژگی با روش مقیاس‌کننده قوی برای الگوریتم‌های یادگیری ماشین Feature Scaling with the Robust Scaler Method for Machine Learning Algorithms

  • جداسازی داده ها به مجموعه تست و آموزش Separating Data into Test and Training Set

  • امتحان Quiz

مدل سازی برای یادگیری ماشین Modelling for Machine Learning

  • رگرسیون لجستیک Logistic Regression

  • اعتبار سنجی متقابل Cross Validation

  • منحنی راک و ناحیه زیر منحنی (AUC) Roc Curve and Area Under Curve (AUC)

  • بهینه سازی هایپرپارامتر (با GridSearchCV) Hyperparameter Optimization (with GridSearchCV)

  • الگوریتم درخت تصمیم Decision Tree Algorithm

  • الگوریتم ماشین برداری پشتیبانی Support Vector Machine Algorithm

  • الگوریتم جنگل تصادفی Random Forest Algorithm

  • بهینه سازی هایپرپارامتر (با GridSearchCV) Hyperparameter Optimization (with GridSearchCV)

  • امتحان Quiz

نتیجه Conclusion

  • نتیجه گیری و به اشتراک گذاری پروژه Project Conclusion and Sharing

  • امتحان Quiz

اضافی Extra

  • یادگیری ماشینی با پروژه پیش بینی حمله واقعی قلب Machine Learning with Real Hearth Attack Prediction Project

نمایش نظرات

آموزش پروژه یادگیری ماشینی: تجزیه و تحلیل پیش بینی حمله قلبی
جزییات دوره
7 hours
53
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
324
4.5 از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Oak Academy Oak Academy

زنده باد دانش فنی سلام در آنجا ، تا سال 2024 ، بیش از 1 میلیون شغل محاسباتی پر نشده وجود خواهد داشت و شکاف مهارت ها یک مشکل جهانی است. این نقطه شروع ما بود. در آکادمی OAK ، ما کارشناسان فناوری هستیم که سالها و سالها در این بخش بوده ایم. ما ریشه عمیق در دنیای فناوری داریم. ما صنعت فناوری را می شناسیم. و ما می دانیم که بزرگترین مشکل صنعت فناوری "شکاف مهارتهای فنی" است و راه حل ما این است. آکادمی OAK پل ارتباطی بین صنعت فناوری و افرادی خواهد بود -در حال برنامه ریزی یک حرفه جدید است فکر تحول شغلی است - می خواهید تغییر شغلی یا اختراع مجدد ، - تمایل به یادگیری سرگرمی های جدید با سرعت خود را داشته باشید

OAK Academy Team OAK Academy Team

مربی