تجزیه و تحلیل خوشهای جزء اصلی یادگیری ماشین بدون نظارت و علم داده است.
برای داده کاوی و کلان داده بسیار مفید است زیرا برخلاف یادگیری ماشینی تحت نظارت، به طور خودکار الگوها را در داده ها، بدون نیاز به برچسب، پیدا می کند.
در یک محیط دنیای واقعی، میتوانید تصور کنید که یک ربات یا یک هوش مصنوعی همیشه به پاسخ بهینه دسترسی نخواهد داشت، یا شاید پاسخ صحیح بهینهای وجود نداشته باشد. شما دوست دارید آن ربات بتواند به تنهایی دنیا را کاوش کند و فقط با جستجوی الگوها چیزهایی را یاد بگیرد.
آیا تا به حال فکر کرده اید که چگونه داده هایی را که در الگوریتم های یادگیری ماشینی تحت نظارت خود استفاده می کنیم به دست می آوریم؟
به نظر می رسد ما همیشه یک CSV یا یک جدول خوب داریم که با Xs و Yهای متناظر کامل شده است.
اگر خودتان درگیر کسب دادهها نبودهاید، شاید به این موضوع فکر نکرده باشید، اما کسی باید این دادهها را بسازد!
این "Y"ها باید از جایی بیایند، و اغلب اوقات شامل کار دستی است.
گاهی اوقات، شما به این نوع اطلاعات دسترسی ندارید یا به دست آوردن آن غیرممکن یا پرهزینه است.
اما هنوز هم میخواهید در مورد ساختار دادهها ایده داشته باشید. اگر تجزیه و تحلیل دادهها را انجام میدهید، تشخیص خودکار الگو در دادههای شما بسیار ارزشمند خواهد بود.
این جایی است که یادگیری ماشینی بدون نظارت وارد عمل می شود.
در این دوره ابتدا در مورد خوشه بندی صحبت می کنیم. اینجاست که به جای آموزش روی لیبل، سعی می کنیم لیبل های خودمان را بسازیم! ما این کار را با گروه بندی داده هایی که شبیه هم هستند انجام خواهیم داد.
در این دوره آموزشی، نحوه ساخت الگوریتم خوشهبندی k-means را خواهید آموخت.
پیش نیازها:
1. الگوریتم خوشه بندی k-means را خودتان با استفاده از آنچه در دوره یاد گرفتید، پیاده سازی کنید.
2. کد خود را روی هر مجموعه داده ای که انتخاب می کنید اجرا کنید!
پس از اتمام کار، پیوندی به نوت بوک Colab خود به اشتراک بگذارید یا یک فایل پایتون را آپلود کنید تا آن را با بقیه کلاس به اشتراک بگذارید!
نمایش نظرات