لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش کار با دادهها: بازیابی و ذخیرهسازهای برداری در LangChain
- آخرین آپدیت
دانلود Working with Data: Retrieval and Vector Stores in LangChain
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
ساخت سیستمهای بازیابی قابل اعتماد و مقیاسپذیر برای برنامههای LLM پیچیده است. از جذب منابع دادههای متنوع تا بهینهسازی جستجوی شباهت و پرسوجوهای ترکیبی (Hybrid)، بسیاری از توسعهدهندگان در طراحی معماریهای بازیابی که به طور موثر عمل کنند، با چالش روبرو هستند. در این دوره آموزشی با عنوان «کار با دادهها: بازیابی و ذخیرهسازهای برداری در LangChain»، شما توانایی ساخت سیستمهای بازیابی مقیاسپذیر برای اپلیکیشنهای مدلهای زبانی بزرگ را کسب خواهید کرد. ابتدا، مباحث جذب دادهها (Data Ingestion)، تقسیم متن (Text Splitting)، امبدینگها (Embeddings) و ذخیرهسازهای برداری که قدرت جستجوی معنایی را فراهم میکنند، بررسی خواهید کرد. سپس، نحوه عملکرد بازیابها (Retrievers)، روشهای بهبود فراخوانی (Recall) و دقت (Precision)، و چگونگی ارزیابی و بهینهسازی عملکرد بازیابی را خواهید آموخت. در نهایت، پیادهسازی پرسوجوهای ساختاریافته و جریانهای کاری بازیابی ترکیبی را یاد میگیرید. پس از اتمام این دوره، شما مهارتها و دانش پیشرفته بازیابی در LangChain را برای ساخت و بهینهسازی سیستمهای بازیابی مقیاسپذیر LLM به دست خواهید آورد.
سرفصل ها و درس ها
بارگذارهای سند و جذب دادهها در LangChain
Document loaders and data ingestion in LangChain
مقدمهای بر بارگذارهای سند و جذب دادهها
Introduction to document loaders and data ingestion
درک شیء سند (Document object)
Understanding the Document object
کار با بارگذارهای سند رایج مبتنی بر فایل
Working with common file-based document loaders
بارگذاری دادهها از وب و منابع API
Loading data from web and API sources
بارگذاری دستهای و پردازش مجموعههای بزرگ اسناد
Batch loading and processing large document collections
بارگذاری تنبل (Lazy loading) برای جذب بهینه اسناد از نظر حافظه
Lazy loading for memory-efficient document ingestion
استراتژیهای تقسیم متن
Text splitting strategies
چرا تقسیم متن مورد نیاز است؟
Why text splitting is required
مقدمهای بر تقسیمکنندههای متن در LangChain
Introduction to text splitters in LangChain
استفاده از CharacterTextSplitter برای تقسیم ساده
CharacterTextSplitter for simple splitting
استفاده از RecursiveCharacterTextSplitter برای حفظ مرزهای معنایی
RecursiveCharacterTextSplitter for preserving semantic boundaries
پیکربندی اندازه تکهها (Chunk size) و همپوشانی (Overlap)
Configuring chunk size and overlap
تقسیمکنندههای تخصصی برای محتوای ساختاریافته
Specialized splitters for structured content
درک امبدینگها و نمایشهای برداری
Understanding embeddings and vector representations
چرا به امبدینگها نیاز داریم؟
Why embeddings are needed
امبدینگها به عنوان نمایشهای برداری
Embeddings as vector representations
مدلهای امبدینگ در عمل با LangChain
Embedding models in practice with LangChain
درک شباهت بین امبدینگها
Understanding similarity between embeddings
ابعاد امبدینگ و توازن بین عملکرد و کیفیت
Embedding dimensions and performance tradeoffs
ارزیابی کیفیت و محدودیتهای امبدینگ
Evaluating embedding quality and limitations
ذخیرهسازهای برداری و جستجوی شباهت مقیاسپذیر
Vector stores and scalable similarity search
ذخیرهسازهای برداری چیستند و چرا به آنها نیاز داریم؟
What are vector stores, and why do you need them?
کار با ذخیرهسازهای برداری با استفاده از LangChain
Working with vector stores using LangChain
کار با FAISS برای جستجوی برداری محلی
Working with Facebook AI Similarity Search (FAISS) for local vector search
کار با Pinecone برای جستجوی برداری مقیاسپذیر
Working with Pinecone for scalable vector search
انجام جستجوی شباهت با معیارهای مختلف فاصله
Performing similarity search with different distance metrics
فیلتر کردن متادیتا و جستجوی ترکیبی
Metadata filtering and hybrid search
مرتبطترین محتوای حداکثری (MMR) برای بازیابی متنوع
Maximal marginal relevance (MMR) for diverse retrieval
بازیابها و استراتژیهای پیشرفته بازیابی در LangChain
Retrievers and advanced retrieval strategies in LangChain
درک انتزاع بازیاب (Retriever) در LangChain
Understanding the retriever abstraction in LangChain
پیادهسازی انواع مختلف بازیابها در LangChain
Implementing different types of retrievers in LangChain
بهبود فراخوانی با بازیابی چند-پرسوجویی
Improving recall with multi-query retrieval
بهبود دقت با فشردهسازی متنی (Contextual Compression)
Improving precision with contextual compression
ارزیابی سیستمهای بازیابی
Evaluating retrieval systems
توازنها و سبکسنگین کردن در سیستمهای بازیابی
Trade-offs in retrieval systems
پرسوجوهای ساختاریافته و ترکیبی با LangChain
Structured and hybrid querying with LangChain
پرسوجوی دادههای ساختاریافته در LangChain
Querying structured data in LangChain
تبدیل زبان طبیعی به SQL با استفاده از LCEL و ایجنتها
Natural language to SQL using LCEL and agents
چالشهای پرسوجوی دادههای ساختاریافته با LLMها
Challenges in querying structured data with LLMs
پرسوجوی قابل اعتماد با استفاده از LLMها
Reliable querying with LLMs
سیستمهای ترکیبی: ادغام دادههای ساختاریافته و بدون ساختار
Hybrid systems: Combining structured and unstructured data
انتخاب رویکرد مناسب برای دسترسی به دادهها
Selecting the appropriate data access approach
نمایش نظرات