لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش یادگیری ماشین: خوشهبندی و بازیابی اطلاعات
- آخرین آپدیت
دانلود Machine Learning: Clustering & Retrieval
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
مطالعات موردی: یافتن اسناد مشابه
یک خواننده به یک مقاله خبری خاص علاقهمند است و شما میخواهید مقالات مشابهی را برای پیشنهاد دادن به او پیدا کنید. مفهوم درست شباهت چیست؟ علاوه بر این، اگر میلیونها سند دیگر وجود داشته باشد چه میشود؟ آیا هر بار که میخواهید سند جدیدی را بازیابی کنید، باید در تمام اسناد دیگر جستجو کنید؟ چگونه اسناد مشابه را در کنار هم گروهبندی میکنید؟ چگونه موضوعات جدید و نوظهوری را که اسناد پوشش میدهند، کشف میکنید؟
در این مطالعه موردی سوم با عنوان یافتن اسناد مشابه، شما الگوریتمهای مبتنی بر شباهت برای بازیابی اطلاعات را بررسی خواهید کرد. در این دوره، همچنین نمایشهای ساختاریافته برای توصیف اسناد موجود در مجموعه داده، از جمله خوشهبندی و مدلهای عضویت ترکیبی مانند تخصیص دیریکله پنهان (LDA) را بررسی میکنید. شما الگوریتم بیشینهسازی امید ریاضی (EM) را برای یادگیری خوشهبندی اسناد پیادهسازی کرده و نحوه مقیاسبندی این روشها را با استفاده از MapReduce خواهید دید.
دستاوردهای یادگیری: در پایان این دوره، شما قادر خواهید بود:
- یک سیستم بازیابی اسناد را با استفاده از k-نزدیکترین همسایه ایجاد کنید.
- معیارهای مختلف شباهت برای دادههای متنی را شناسایی کنید.
- محاسبات در جستجوی k-نزدیکترین همسایه را با استفاده از KD-trees کاهش دهید.
- نزدیکترین همسایگان تقریبی را با استفاده از هشینگ حساس به مکان (LSH) تولید کنید.
- وظایف یادگیری نظارت شده و نظارت نشده را با هم مقایسه و تحلیل کنید.
- اسناد را بر اساس موضوع با استفاده از k-means خوشهبندی کنید.
- نحوه موازیسازی k-means را با استفاده از MapReduce توصیف کنید.
- رویکردهای خوشهبندی احتمالی را با استفاده از مدلهای ترکیبی بررسی کنید.
- یک مدل ترکیب گاوسی را با استفاده از بیشینهسازی امید ریاضی (EM) برازش کنید.
- مدلسازی عضویت ترکیبی را با استفاده از تخصیص دیریکله پنهان (LDA) انجام دهید.
- مراحل نمونهبردار گیبز و نحوه استفاده از خروجی آن برای استنتاج را توصیف کنید.
- تکنیکهای مقداردهی اولیه برای اهداف بهینهسازی غیر محدب را مقایسه کنید.
- این تکنیکها را در پایتون پیادهسازی کنید.
سرفصل ها و درس ها
خوشآمدگویی
Welcome
خوشآمدگویی و معرفی وظایف خوشهبندی و بازیابی
Welcome and introduction to clustering and retrieval tasks
مرور کلی دوره
Course overview
موضوعات پوشش داده شده در هر ماژول
Module-by-module topics covered
پیشنیازهای لازم
Assumed background
جستجوی نزدیکترین همسایه
Nearest Neighbor Search
بازیابی به عنوان جستجوی k-نزدیکترین همسایه
Retrieval as k-nearest neighbor search
الگوریتم 1-NN
1-NN algorithm
الگوریتم k-NN
k-NN algorithm
نمایش اسناد
Document representation
معیارهای فاصله: اقلیدسی و اقلیدسی مقیاسشده
Distance metrics: Euclidean and scaled Euclidean
نوشتن فاصله اقلیدسی (مقیاسشده) با استفاده از ضرب داخلی (وزنی)
Writing (scaled) Euclidean distance using (weighted) inner products
نمایش نظرات