لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش مجموعه داده های عظیم بازیابی و استخراج اطلاعات
Information Retrieval and Mining Massive Data Sets
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
تکنیک های مختلف برای ساختن یک سیستم بازیابی اطلاعات در مقیاس گوگل را بیاموزید. این دوره در ابتدا به 6 بخش تقسیم می شود. قسمت 1: ساختن یک سیستم بازیابی اطلاعات قسمت 2: الگوهای متداول استخراج و تداعی ها قسمت 3: طبقه بندی و خوشه بندی قسمت 4: وب کاوی قسمت 5: سیستم های توصیه پیش نیازها: دانش احتمال و جبر خطی. درک خوبی از الگوریتم های سطح تحصیلات تکمیلی. تجربه کار با یک زبان برنامه نویسی (C، Python، Java)
هدف معرفی تکنیک های مختلف مورد نیاز برای ساختن یک سیستم IR است. در این دوره ما روش های مختلفی را برای حل مشکل کلان داده بررسی خواهیم کرد. ما راه حل های جایگزین و معاوضه را ارزیابی خواهیم کرد. در بخش بعدی دوره، ما در مورد الگوریتم های مختلف داده کاوی برای درک مجموعه داده های عظیم بحث خواهیم کرد.
سرفصل ها و درس ها
مقدمه ای بر موتور جستجوی بولی
Introduction To a Boolean Search Engine
داده کاوی چیست؟
What is Data Mining
داده های ساختاریافته، داده های بدون ساختار و بازیابی اطلاعات
Structured Data, Unstructured data and Information Retrieval
ماتریس بروز سند مدت (1)
Term-Document Incidence Matrix (1)
ماتریس بروز سند مدت (2)
Term-Document Incidence Matrix (2)
شاخص معکوس
Inverted Index
معاوضه در اجرای یک شاخص معکوس
Tradeoffs in implementing an Inverted Index
پردازش AND، OR، NOT پرس و جوها
Processing AND, OR, NOT queries
مروری بر خط لوله ساختمانی شاخص
Overview of Index Construction Pipeline
بهینه سازی پرس و جو با استفاده از فرکانس سند (1)
Query optimization using Document Frequency (1)
بهینه سازی پرس و جو با استفاده از فرکانس سند (2)
Query Optimization Using Document Frequency (2)
مدل بازیابی بولی
Boolean Retrieval Model
نمونه ای از مدل بازیابی بولی
Example of a Boolean Retrieval Model
محدودیت های مدل بازیابی بولی
Limitations of Boolean Retrieval Model
نحوه ارزیابی عملکرد یک سیستم IR
How to evaluate performance of an IR System
Google zeitgeist
Google zeitgeist
ساختار داده فرهنگ لغت. بازیابی متحمل
Dictionary Data Structure. Tolerant retrieval
تجزیه اسناد و مسائل مرتبط با آن
Parsing Documents and Issues Associated with it
فرآیند توکن سازی در یک سیستم IR
Tokenization Process in an IR System
عادی سازی شرایط
Normalization to Terms
ارسال سریعتر با اشاره گرهای پرش ادغام می شود
Faster Postings Merges With Skip Pointers
نحوه رسیدگی به پرس و جو عبارت
How to Handle Phrase Query
عبارت عبارت با استفاده از نمایه موقعیت
Phrase Query Using Positional Index
نحوه رسیدگی به درخواست مجاورت
How to handle proximity query
بحث در مورد اندازه شاخص موقعیتی
Discussion on Positional Index Size
ساخت شاخص. تخمین اندازه پست ها، نمایه سازی مبتنی بر مرتب سازی، نمایه پویا
Index construction. Postings size estimation, sort-based indexing, dynamic index
پیاده سازی ساختار داده دیکشنری
Dictionary Data Structure Implementation
سوالات وایلد کارت
Wild card queries
سوالات مربوط به پرس و جوهای کارت وایلد
Questions on Wild Card Queries
مدیریت پرس و جو کارت وایلد با استفاده از شاخص Permuterm
Wild Card Query Handling Using Permuterm Index
مدیریت پرس و جو کارت وایلد با استفاده از شاخص K-Gram
Wild Card Query Handling Using K-Gram Index
الگوریتم ساندکس
Soundex Algorithm
تکنیک های تصحیح املا در یک سیستم IR
Spelling Correction Techniques in an IR System
سوال در مورد الگوریتم Soundex
Question On Soundex Algorithm
نمایش نظرات