آموزش کار با داده‌ها: بازیابی و ذخیره‌سازهای برداری در LangChain - آخرین آپدیت

دانلود Working with Data: Retrieval and Vector Stores in LangChain

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: ساخت سیستم‌های بازیابی قابل اعتماد و مقیاس‌پذیر برای برنامه‌های LLM پیچیده است. از وارد کردن منابع داده‌های متنوع تا بهینه‌سازی جستجوی شباهت و پرس‌وجوهای ترکیبی (Hybrid)، بسیاری از توسعه‌دهندگان در طراحی معماری‌های بازیابی که به طور موثر عمل کنند، با چالش روبرو هستند. در این دوره، «کار با داده‌ها: بازیابی و ذخیره‌سازهای برداری در LangChain»، شما توانایی ساخت سیستم‌های بازیابی مقیاس‌پذیر برای برنامه‌های مدل‌های زبانی بزرگ را کسب خواهید کرد. ابتدا، مفاهیم وارد کردن داده‌ها (Data Ingestion)، تقسیم متن (Text Splitting)، جاسازی‌ها (Embeddings) و ذخیره‌سازهای برداری که قدرت جستجوی معنایی را فراهم می‌کنند، بررسی خواهید کرد. سپس، نحوه عملکرد بازیاب‌ها (Retrievers)، روش‌های بهبود نرخ فراخوانی (Recall) و دقت (Precision)، و نحوه ارزیابی و بهینه‌سازی عملکرد بازیابی را خواهید آموخت. در نهایت، پیاده‌سازی پرس‌وجوهای ساختاریافته و گردش‌کارهای بازیابی ترکیبی را یاد می‌گیرید. پس از اتمام این دوره، مهارت‌ها و دانش پیشرفته بازیابی در LangChain را برای ساخت و بهینه‌سازی سیستم‌های بازیابی مقیاس‌پذیر LLM به دست خواهید آورد.

سرفصل ها و درس ها

بارگذاری اسناد و وارد کردن داده‌ها در LangChain Document loaders and data ingestion in LangChain

  • مقدمه‌ای بر بارگذاری اسناد و وارد کردن داده‌ها Introduction to document loaders and data ingestion

  • درک آبجکت Document Understanding the Document object

  • کار با بارگذارهای متداول اسناد مبتنی بر فایل Working with common file-based document loaders

  • بارگذاری داده‌ها از وب و منابع API Loading data from web and API sources

  • بارگذاری دسته‌ای و پردازش مجموعه‌های بزرگ اسناد Batch loading and processing large document collections

  • بارگذاری تنبل (Lazy Loading) برای وارد کردن بهینه داده‌ها در حافظه Lazy loading for memory-efficient document ingestion

استراتژی‌های تقسیم متن Text splitting strategies

  • چرا تقسیم متن ضروری است؟ Why text splitting is required

  • آشنایی با تقسیم‌کننده‌های متن در LangChain Introduction to text splitters in LangChain

  • استفاده از CharacterTextSplitter برای تقسیم ساده CharacterTextSplitter for simple splitting

  • استفاده از RecursiveCharacterTextSplitter برای حفظ مرزهای معنایی RecursiveCharacterTextSplitter for preserving semantic boundaries

  • پیکربندی اندازه تکه (Chunk Size) و هم‌پوشانی (Overlap) Configuring chunk size and overlap

  • تقسیم‌کننده‌های تخصصی برای محتوای ساختاریافته Specialized splitters for structured content

درک جاسازی‌ها (Embeddings) و نمایش‌های برداری Understanding embeddings and vector representations

  • چرا به جاسازی‌ها (Embeddings) نیاز داریم؟ Why embeddings are needed

  • جاسازی‌ها به عنوان نمایش‌های برداری Embeddings as vector representations

  • مدل‌های جاسازی در عمل با LangChain Embedding models in practice with LangChain

  • درک شباهت بین جاسازی‌ها Understanding similarity between embeddings

  • ابعاد جاسازی و توازن بین عملکرد و کیفیت Embedding dimensions and performance tradeoffs

  • ارزیابی کیفیت و محدودیت‌های جاسازی Evaluating embedding quality and limitations

ذخیره‌سازهای برداری و جستجوی شباهت مقیاس‌پذیر Vector stores and scalable similarity search

  • ذخیره‌سازهای برداری چیستند و چرا به آن‌ها نیاز داریم؟ What are vector stores, and why do you need them?

  • کار با ذخیره‌سازهای برداری با استفاده از LangChain Working with vector stores using LangChain

  • کار با FAISS برای جستجوی برداری محلی Working with Facebook AI Similarity Search (FAISS) for local vector search

  • کار با Pinecone برای جستجوی برداری مقیاس‌پذیر Working with Pinecone for scalable vector search

  • انجام جستجوی شباهت با معیارهای مختلف فاصله Performing similarity search with different distance metrics

  • فیلتر کردن متاداده‌ها و جستجوی ترکیبی Metadata filtering and hybrid search

  • مرتبط‌ترین حاشیه بیشینه (MMR) برای بازیابی متنوع Maximal marginal relevance (MMR) for diverse retrieval

بازیاب‌ها و استراتژی‌های پیشرفته بازیابی در LangChain Retrievers and advanced retrieval strategies in LangChain

  • درک مفهوم انتزاعی بازیاب (Retriever) در LangChain Understanding the retriever abstraction in LangChain

  • پیاده‌سازی انواع مختلف بازیاب‌ها در LangChain Implementing different types of retrievers in LangChain

  • بهبود نرخ فراخوانی با بازیابی چندپرس‌وجویی (Multi Query) Improving recall with multi-query retrieval

  • بهبود دقت با فشرده‌سازی متنی (Contextual Compression) Improving precision with contextual compression

  • ارزیابی سیستم‌های بازیابی Evaluating retrieval systems

  • توازن‌ها و سبک‌سنگین کردن‌های سیستم‌های بازیابی Trade-offs in retrieval systems

پرس‌وجوهای ساختاریافته و ترکیبی با LangChain Structured and hybrid querying with LangChain

  • پرس‌وجوی داده‌های ساختاریافته در LangChain Querying structured data in LangChain

  • تبدیل زبان طبیعی به SQL با استفاده از LCEL و عوامل (Agents) Natural language to SQL using LCEL and agents

  • چالش‌های پرس‌وجوی داده‌های ساختاریافته با LLMها Challenges in querying structured data with LLMs

  • پرس‌وجوی قابل اعتماد با LLMها Reliable querying with LLMs

  • سیستم‌های ترکیبی: ادغام داده‌های ساختاریافته و بدون ساختار Hybrid systems: Combining structured and unstructured data

  • انتخاب رویکرد مناسب برای دسترسی به داده‌ها Selecting the appropriate data access approach

نمایش نظرات

آموزش کار با داده‌ها: بازیابی و ذخیره‌سازهای برداری در LangChain
جزییات دوره
2h 29m
37
(آخرین آپدیت)
3
از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Deepali Srivastava Deepali Srivastava

نویسنده