دوره داده کاوی - یادگیری بدون نظارت برای دانش آموزان طراحی شده است تا درک جامعی از تکنیک های یادگیری بدون نظارت در زمینه داده کاوی به دانش آموزان ارائه دهد. یادگیری بدون نظارت، دستهای از یادگیری ماشینی است که در آن الگوریتمها بر روی دادههای بدون برچسب برای کشف الگوها، ساختارها و روابط بدون دانش یا راهنمایی قبلی اعمال میشوند.
در طول دوره، دانشآموزان الگوریتمهای مختلف یادگیری بدون نظارت و کاربردهای آنها را در کشف بینشهای پنهان از مجموعه دادههای بزرگ کشف خواهند کرد. تاکید بر درک اصول، روششناسی و اجرای عملی این الگوریتمها به جای تمرکز بر مشتقات ریاضی خواهد بود.
این دوره با مقدمه ای بر یادگیری بدون نظارت آغاز می شود که مفاهیم و اهداف اساسی را پوشش می دهد. دانش آموزان یاد خواهند گرفت که چگونه یادگیری بدون نظارت با یادگیری نظارت شده و یادگیری نیمه نظارتی متفاوت است و مزایا و محدودیت های تکنیک های بدون نظارت. اهمیت پیش پردازش و آماده سازی داده ها نیز برای اطمینان از نتایج با کیفیت مورد بحث قرار خواهد گرفت.
اولین موضوع اصلی دوره، تکنیک های خوشه بندی خواهد بود. دانشآموزان به الگوریتمهای خوشهبندی مختلف مانند خوشهبندی سلسله مراتبی، خوشهبندی k-means، خوشهبندی مبتنی بر چگالی (به عنوان مثال، DBSCAN) و خوشهبندی حداکثر انتظار (EM) شیرجه خواهند زد. آنها یاد خواهند گرفت که چگونه از این الگوریتم ها برای گروه بندی نقاط داده مشابه و شناسایی الگوها و ساختارهای اساسی استفاده کنند. چالش ها و ملاحظات در انتخاب روش های خوشه بندی مناسب برای سناریوهای مختلف بررسی خواهد شد.
سپس این دوره به سمت کاهش ابعاد می رود، که هدف آن کاهش تعداد ویژگی ها یا متغیرها در یک مجموعه داده در عین حفظ اطلاعات مرتبط است. دانشآموزان تکنیکهایی مانند تجزیه و تحلیل مؤلفههای اصلی (PCA)، تجزیه ارزش منفرد (SVD) و جاسازی تصادفی همسایه t-توزیع شده (t-SNE) را بررسی خواهند کرد. آنها متوجه خواهند شد که چگونه می توان از این روش ها برای تجسم داده های با ابعاد بالا و استخراج نمایش های معنی دار استفاده کرد که تجزیه و تحلیل و تفسیر را تسهیل می کند.
کاوی قوانین انجمن یکی دیگر از موضوعات کلیدی خواهد بود که در این دوره پوشش داده می شود. دانشآموزان در مورد الگوریتم محبوب Apriori و الگوریتم رشد FP که برای کشف روابط و ارتباطات جالب بین آیتمها در مجموعه دادههای تراکنشی استفاده میشوند، یاد خواهند گرفت. آنها در مورد ارزیابی و تفسیر قوانین انجمن، از جمله اقدامات پشتیبانی، اطمینان، و افزایش، و کاربردهای عملی آنها در تجزیه و تحلیل سبد بازار و سیستمهای توصیه، بینشهایی کسب خواهند کرد.
این دوره همچنین به تشخیص موارد پرت میپردازد، که یک وظیفه مهم در یادگیری بدون نظارت است. دانش آموزان رویکردهای آماری مانند z-score و z-score اصلاح شده و همچنین رویکردهای مبتنی بر فاصله مانند Local Outlier Factor و Isolation Forest را بررسی خواهند کرد. آنها نحوه شناسایی ناهنجاریها در دادهها را درک میکنند، که میتواند بینشهای ارزشمندی در مورد تشخیص تقلب بالقوه، تشخیص نفوذ شبکه، یا پیشبینی خرابی سیستم ارائه دهد.
ارزیابی و اعتبارسنجی مدلهای یادگیری بدون نظارت یکی از جنبههای ضروری دوره خواهد بود. دانش آموزان در مورد معیارهای ارزیابی داخلی و خارجی، از جمله ضریب silhouette، خلوص و شاخص رند یاد خواهند گرفت. آنها در ارزیابی کیفیت نتایج خوشهبندی و اندازهگیری عملکرد تکنیکهای کاهش ابعاد مهارت کسب خواهند کرد.
در طول دوره، دانشآموزان در معرض کاربردهای مختلف یادگیری بدون نظارت در دنیای واقعی قرار خواهند گرفت. آنها کشف خواهند کرد که چگونه تقسیم بندی بازار را می توان از طریق خوشه بندی به دست آورد و کسب و کارها را قادر می سازد تا بخش های خاص مشتری را به طور موثر هدف قرار دهند. آنها همچنین خوشهبندی تصویر و متن را که کاربردهایی در تشخیص تصویر، سازماندهی اسناد و سیستمهای توصیه دارد، بررسی خواهند کرد. این دوره تشخیص ناهنجاری را برجسته میکند، که نقش مهمی در شناسایی تراکنشهای جعلی، نفوذهای شبکه، یا نقصهای ساخت بازی میکند. در نهایت، دانشآموزان یاد میگیرند که چگونه یادگیری بدون نظارت سیستمهای توصیهگر را تقویت میکند و توصیههای شخصیشده را بر اساس رفتار و ترجیحات کاربر ارائه میدهد.
تجربه عملی جزء مهمی از دوره خواهد بود. دانشآموزان روی تمرینها و پروژههای عملی کار خواهند کرد، و الگوریتمهای یادگیری بدون نظارت را در مجموعه دادههای دنیای واقعی با استفاده از ابزارهای دادهکاوی محبوب و کتابخانههای برنامهنویسی مانند Sikit-learn Python یا بسته R's caret به کار خواهند برد. آنها در پیش پردازش داده ها، انتخاب الگوریتم های مناسب، تنظیم دقیق پارامترها و تفسیر و تجسم نتایج مهارت خواهند داشت.
در پایان دوره، دانشآموزان درک کاملی از تکنیکهای یادگیری بدون نظارت، کاربردهای عملی آنها و توانایی استفاده از این روشها برای کشف بینشها و الگوهای ارزشمند از دادههای بدون برچسب خواهند داشت.
360DigiTMG یک موسسه آموزشی پیشرو است
نمایش نظرات