لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش کار با دادهها: بازیابی و ذخیرهسازهای برداری در LangChain
- آخرین آپدیت
دانلود Working with Data: Retrieval and Vector Stores in LangChain
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
ساخت سیستمهای بازیابی قابل اعتماد و مقیاسپذیر برای برنامههای LLM پیچیده است. از وارد کردن منابع دادههای متنوع تا بهینهسازی جستجوی شباهت و پرسوجوهای ترکیبی (Hybrid)، بسیاری از توسعهدهندگان در طراحی معماریهای بازیابی که به طور موثر عمل کنند، با چالش روبرو هستند. در این دوره، «کار با دادهها: بازیابی و ذخیرهسازهای برداری در LangChain»، شما توانایی ساخت سیستمهای بازیابی مقیاسپذیر برای برنامههای مدلهای زبانی بزرگ را کسب خواهید کرد. ابتدا، مفاهیم وارد کردن دادهها (Data Ingestion)، تقسیم متن (Text Splitting)، جاسازیها (Embeddings) و ذخیرهسازهای برداری که قدرت جستجوی معنایی را فراهم میکنند، بررسی خواهید کرد. سپس، نحوه عملکرد بازیابها (Retrievers)، روشهای بهبود نرخ فراخوانی (Recall) و دقت (Precision)، و نحوه ارزیابی و بهینهسازی عملکرد بازیابی را خواهید آموخت. در نهایت، پیادهسازی پرسوجوهای ساختاریافته و گردشکارهای بازیابی ترکیبی را یاد میگیرید. پس از اتمام این دوره، مهارتها و دانش پیشرفته بازیابی در LangChain را برای ساخت و بهینهسازی سیستمهای بازیابی مقیاسپذیر LLM به دست خواهید آورد.
سرفصل ها و درس ها
بارگذاری اسناد و وارد کردن دادهها در LangChain
Document loaders and data ingestion in LangChain
مقدمهای بر بارگذاری اسناد و وارد کردن دادهها
Introduction to document loaders and data ingestion
درک آبجکت Document
Understanding the Document object
کار با بارگذارهای متداول اسناد مبتنی بر فایل
Working with common file-based document loaders
بارگذاری دادهها از وب و منابع API
Loading data from web and API sources
بارگذاری دستهای و پردازش مجموعههای بزرگ اسناد
Batch loading and processing large document collections
بارگذاری تنبل (Lazy Loading) برای وارد کردن بهینه دادهها در حافظه
Lazy loading for memory-efficient document ingestion
استراتژیهای تقسیم متن
Text splitting strategies
چرا تقسیم متن ضروری است؟
Why text splitting is required
آشنایی با تقسیمکنندههای متن در LangChain
Introduction to text splitters in LangChain
استفاده از CharacterTextSplitter برای تقسیم ساده
CharacterTextSplitter for simple splitting
استفاده از RecursiveCharacterTextSplitter برای حفظ مرزهای معنایی
RecursiveCharacterTextSplitter for preserving semantic boundaries
پیکربندی اندازه تکه (Chunk Size) و همپوشانی (Overlap)
Configuring chunk size and overlap
تقسیمکنندههای تخصصی برای محتوای ساختاریافته
Specialized splitters for structured content
درک جاسازیها (Embeddings) و نمایشهای برداری
Understanding embeddings and vector representations
چرا به جاسازیها (Embeddings) نیاز داریم؟
Why embeddings are needed
جاسازیها به عنوان نمایشهای برداری
Embeddings as vector representations
مدلهای جاسازی در عمل با LangChain
Embedding models in practice with LangChain
درک شباهت بین جاسازیها
Understanding similarity between embeddings
ابعاد جاسازی و توازن بین عملکرد و کیفیت
Embedding dimensions and performance tradeoffs
ارزیابی کیفیت و محدودیتهای جاسازی
Evaluating embedding quality and limitations
ذخیرهسازهای برداری و جستجوی شباهت مقیاسپذیر
Vector stores and scalable similarity search
ذخیرهسازهای برداری چیستند و چرا به آنها نیاز داریم؟
What are vector stores, and why do you need them?
کار با ذخیرهسازهای برداری با استفاده از LangChain
Working with vector stores using LangChain
کار با FAISS برای جستجوی برداری محلی
Working with Facebook AI Similarity Search (FAISS) for local vector search
کار با Pinecone برای جستجوی برداری مقیاسپذیر
Working with Pinecone for scalable vector search
انجام جستجوی شباهت با معیارهای مختلف فاصله
Performing similarity search with different distance metrics
فیلتر کردن متادادهها و جستجوی ترکیبی
Metadata filtering and hybrid search
مرتبطترین حاشیه بیشینه (MMR) برای بازیابی متنوع
Maximal marginal relevance (MMR) for diverse retrieval
بازیابها و استراتژیهای پیشرفته بازیابی در LangChain
Retrievers and advanced retrieval strategies in LangChain
درک مفهوم انتزاعی بازیاب (Retriever) در LangChain
Understanding the retriever abstraction in LangChain
پیادهسازی انواع مختلف بازیابها در LangChain
Implementing different types of retrievers in LangChain
بهبود نرخ فراخوانی با بازیابی چندپرسوجویی (Multi Query)
Improving recall with multi-query retrieval
بهبود دقت با فشردهسازی متنی (Contextual Compression)
Improving precision with contextual compression
ارزیابی سیستمهای بازیابی
Evaluating retrieval systems
توازنها و سبکسنگین کردنهای سیستمهای بازیابی
Trade-offs in retrieval systems
پرسوجوهای ساختاریافته و ترکیبی با LangChain
Structured and hybrid querying with LangChain
پرسوجوی دادههای ساختاریافته در LangChain
Querying structured data in LangChain
تبدیل زبان طبیعی به SQL با استفاده از LCEL و عوامل (Agents)
Natural language to SQL using LCEL and agents
چالشهای پرسوجوی دادههای ساختاریافته با LLMها
Challenges in querying structured data with LLMs
پرسوجوی قابل اعتماد با LLMها
Reliable querying with LLMs
سیستمهای ترکیبی: ادغام دادههای ساختاریافته و بدون ساختار
Hybrid systems: Combining structured and unstructured data
انتخاب رویکرد مناسب برای دسترسی به دادهها
Selecting the appropriate data access approach
نمایش نظرات