آموزش کار با داده‌ها: بازیابی و ذخیره‌سازهای برداری در LangChain - آخرین آپدیت

دانلود Working with Data: Retrieval and Vector Stores in LangChain

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: ساخت سیستم‌های بازیابی قابل اعتماد و مقیاس‌پذیر برای برنامه‌های LLM پیچیده است. از جذب منابع داده‌های متنوع تا بهینه‌سازی جستجوی شباهت و پرس‌وجوهای ترکیبی (Hybrid)، بسیاری از توسعه‌دهندگان در طراحی معماری‌های بازیابی که به طور موثر عمل کنند، با چالش روبرو هستند. در این دوره آموزشی با عنوان «کار با داده‌ها: بازیابی و ذخیره‌سازهای برداری در LangChain»، شما توانایی ساخت سیستم‌های بازیابی مقیاس‌پذیر برای اپلیکیشن‌های مدل‌های زبانی بزرگ را کسب خواهید کرد. ابتدا، مباحث جذب داده‌ها (Data Ingestion)، تقسیم متن (Text Splitting)، امبدینگ‌ها (Embeddings) و ذخیره‌سازهای برداری که قدرت جستجوی معنایی را فراهم می‌کنند، بررسی خواهید کرد. سپس، نحوه عملکرد بازیاب‌ها (Retrievers)، روش‌های بهبود فراخوانی (Recall) و دقت (Precision)، و چگونگی ارزیابی و بهینه‌سازی عملکرد بازیابی را خواهید آموخت. در نهایت، پیاده‌سازی پرس‌وجوهای ساختاریافته و جریان‌های کاری بازیابی ترکیبی را یاد می‌گیرید. پس از اتمام این دوره، شما مهارت‌ها و دانش پیشرفته بازیابی در LangChain را برای ساخت و بهینه‌سازی سیستم‌های بازیابی مقیاس‌پذیر LLM به دست خواهید آورد.

سرفصل ها و درس ها

بارگذارهای سند و جذب داده‌ها در LangChain Document loaders and data ingestion in LangChain

  • مقدمه‌ای بر بارگذارهای سند و جذب داده‌ها Introduction to document loaders and data ingestion

  • درک شیء سند (Document object) Understanding the Document object

  • کار با بارگذارهای سند رایج مبتنی بر فایل Working with common file-based document loaders

  • بارگذاری داده‌ها از وب و منابع API Loading data from web and API sources

  • بارگذاری دسته‌ای و پردازش مجموعه‌های بزرگ اسناد Batch loading and processing large document collections

  • بارگذاری تنبل (Lazy loading) برای جذب بهینه اسناد از نظر حافظه Lazy loading for memory-efficient document ingestion

استراتژی‌های تقسیم متن Text splitting strategies

  • چرا تقسیم متن مورد نیاز است؟ Why text splitting is required

  • مقدمه‌ای بر تقسیم‌کننده‌های متن در LangChain Introduction to text splitters in LangChain

  • استفاده از CharacterTextSplitter برای تقسیم ساده CharacterTextSplitter for simple splitting

  • استفاده از RecursiveCharacterTextSplitter برای حفظ مرزهای معنایی RecursiveCharacterTextSplitter for preserving semantic boundaries

  • پیکربندی اندازه تکه‌ها (Chunk size) و همپوشانی (Overlap) Configuring chunk size and overlap

  • تقسیم‌کننده‌های تخصصی برای محتوای ساختاریافته Specialized splitters for structured content

درک امبدینگ‌ها و نمایش‌های برداری Understanding embeddings and vector representations

  • چرا به امبدینگ‌ها نیاز داریم؟ Why embeddings are needed

  • امبدینگ‌ها به عنوان نمایش‌های برداری Embeddings as vector representations

  • مدل‌های امبدینگ در عمل با LangChain Embedding models in practice with LangChain

  • درک شباهت بین امبدینگ‌ها Understanding similarity between embeddings

  • ابعاد امبدینگ و توازن بین عملکرد و کیفیت Embedding dimensions and performance tradeoffs

  • ارزیابی کیفیت و محدودیت‌های امبدینگ Evaluating embedding quality and limitations

ذخیره‌سازهای برداری و جستجوی شباهت مقیاس‌پذیر Vector stores and scalable similarity search

  • ذخیره‌سازهای برداری چیستند و چرا به آن‌ها نیاز داریم؟ What are vector stores, and why do you need them?

  • کار با ذخیره‌سازهای برداری با استفاده از LangChain Working with vector stores using LangChain

  • کار با FAISS برای جستجوی برداری محلی Working with Facebook AI Similarity Search (FAISS) for local vector search

  • کار با Pinecone برای جستجوی برداری مقیاس‌پذیر Working with Pinecone for scalable vector search

  • انجام جستجوی شباهت با معیارهای مختلف فاصله Performing similarity search with different distance metrics

  • فیلتر کردن متادیتا و جستجوی ترکیبی Metadata filtering and hybrid search

  • مرتبط‌ترین محتوای حداکثری (MMR) برای بازیابی متنوع Maximal marginal relevance (MMR) for diverse retrieval

بازیاب‌ها و استراتژی‌های پیشرفته بازیابی در LangChain Retrievers and advanced retrieval strategies in LangChain

  • درک انتزاع بازیاب (Retriever) در LangChain Understanding the retriever abstraction in LangChain

  • پیاده‌سازی انواع مختلف بازیاب‌ها در LangChain Implementing different types of retrievers in LangChain

  • بهبود فراخوانی با بازیابی چند-پرس‌وجویی Improving recall with multi-query retrieval

  • بهبود دقت با فشرده‌سازی متنی (Contextual Compression) Improving precision with contextual compression

  • ارزیابی سیستم‌های بازیابی Evaluating retrieval systems

  • توازن‌ها و سبک‌سنگین کردن در سیستم‌های بازیابی Trade-offs in retrieval systems

پرس‌وجوهای ساختاریافته و ترکیبی با LangChain Structured and hybrid querying with LangChain

  • پرس‌وجوی داده‌های ساختاریافته در LangChain Querying structured data in LangChain

  • تبدیل زبان طبیعی به SQL با استفاده از LCEL و ایجنت‌ها Natural language to SQL using LCEL and agents

  • چالش‌های پرس‌وجوی داده‌های ساختاریافته با LLMها Challenges in querying structured data with LLMs

  • پرس‌وجوی قابل اعتماد با استفاده از LLMها Reliable querying with LLMs

  • سیستم‌های ترکیبی: ادغام داده‌های ساختاریافته و بدون ساختار Hybrid systems: Combining structured and unstructured data

  • انتخاب رویکرد مناسب برای دسترسی به داده‌ها Selecting the appropriate data access approach

نمایش نظرات

آموزش کار با داده‌ها: بازیابی و ذخیره‌سازهای برداری در LangChain
جزییات دوره
2h 29m
37
(آخرین آپدیت)
3
از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Deepali Srivastava Deepali Srivastava

نویسنده