دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش کار با داده‌ها: بازیابی و ذخیره‌سازهای برداری در LangChain - آخرین آپدیت

دانلود Working with Data: Retrieval and Vector Stores in LangChain

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: ساخت سیستم‌های بازیابی قابل اعتماد و مقیاس‌پذیر برای برنامه‌های LLM پیچیده است. از جذب منابع داده‌های متنوع تا بهینه‌سازی جستجوی شباهت و پرس‌وجوهای ترکیبی (Hybrid)، بسیاری از توسعه‌دهندگان در طراحی معماری‌های بازیابی که به طور موثر عمل کنند، با چالش روبرو هستند. در این دوره آموزشی با عنوان «کار با داده‌ها: بازیابی و ذخیره‌سازهای برداری در LangChain»، شما توانایی ساخت سیستم‌های بازیابی مقیاس‌پذیر برای اپلیکیشن‌های مدل‌های زبانی بزرگ را کسب خواهید کرد. ابتدا، مباحث جذب داده‌ها (Data Ingestion)، تقسیم متن (Text Splitting)، امبدینگ‌ها (Embeddings) و ذخیره‌سازهای برداری که قدرت جستجوی معنایی را فراهم می‌کنند، بررسی خواهید کرد. سپس، نحوه عملکرد بازیاب‌ها (Retrievers)، روش‌های بهبود فراخوانی (Recall) و دقت (Precision)، و چگونگی ارزیابی و بهینه‌سازی عملکرد بازیابی را خواهید آموخت. در نهایت، پیاده‌سازی پرس‌وجوهای ساختاریافته و جریان‌های کاری بازیابی ترکیبی را یاد می‌گیرید. پس از اتمام این دوره، شما مهارت‌ها و دانش پیشرفته بازیابی در LangChain را برای ساخت و بهینه‌سازی سیستم‌های بازیابی مقیاس‌پذیر LLM به دست خواهید آورد.

سرفصل ها و درس ها

بارگذارهای سند و جذب داده‌ها در LangChain Document loaders and data ingestion in LangChain

مقدمه‌ای بر بارگذارهای سند و جذب داده‌ها Introduction to document loaders and data ingestion
درک شیء سند (Document object) Understanding the Document object
کار با بارگذارهای سند رایج مبتنی بر فایل Working with common file-based document loaders
بارگذاری داده‌ها از وب و منابع API Loading data from web and API sources
بارگذاری دسته‌ای و پردازش مجموعه‌های بزرگ اسناد Batch loading and processing large document collections
بارگذاری تنبل (Lazy loading) برای جذب بهینه اسناد از نظر حافظه Lazy loading for memory-efficient document ingestion

استراتژی‌های تقسیم متن Text splitting strategies

چرا تقسیم متن مورد نیاز است؟ Why text splitting is required
مقدمه‌ای بر تقسیم‌کننده‌های متن در LangChain Introduction to text splitters in LangChain
استفاده از CharacterTextSplitter برای تقسیم ساده CharacterTextSplitter for simple splitting
استفاده از RecursiveCharacterTextSplitter برای حفظ مرزهای معنایی RecursiveCharacterTextSplitter for preserving semantic boundaries
پیکربندی اندازه تکه‌ها (Chunk size) و همپوشانی (Overlap) Configuring chunk size and overlap
تقسیم‌کننده‌های تخصصی برای محتوای ساختاریافته Specialized splitters for structured content

درک امبدینگ‌ها و نمایش‌های برداری Understanding embeddings and vector representations

چرا به امبدینگ‌ها نیاز داریم؟ Why embeddings are needed
امبدینگ‌ها به عنوان نمایش‌های برداری Embeddings as vector representations
مدل‌های امبدینگ در عمل با LangChain Embedding models in practice with LangChain
درک شباهت بین امبدینگ‌ها Understanding similarity between embeddings
ابعاد امبدینگ و توازن بین عملکرد و کیفیت Embedding dimensions and performance tradeoffs
ارزیابی کیفیت و محدودیت‌های امبدینگ Evaluating embedding quality and limitations

ذخیره‌سازهای برداری و جستجوی شباهت مقیاس‌پذیر Vector stores and scalable similarity search

ذخیره‌سازهای برداری چیستند و چرا به آن‌ها نیاز داریم؟ What are vector stores, and why do you need them?
کار با ذخیره‌سازهای برداری با استفاده از LangChain Working with vector stores using LangChain
کار با FAISS برای جستجوی برداری محلی Working with Facebook AI Similarity Search (FAISS) for local vector search
کار با Pinecone برای جستجوی برداری مقیاس‌پذیر Working with Pinecone for scalable vector search
انجام جستجوی شباهت با معیارهای مختلف فاصله Performing similarity search with different distance metrics
فیلتر کردن متادیتا و جستجوی ترکیبی Metadata filtering and hybrid search
مرتبط‌ترین محتوای حداکثری (MMR) برای بازیابی متنوع Maximal marginal relevance (MMR) for diverse retrieval

بازیاب‌ها و استراتژی‌های پیشرفته بازیابی در LangChain Retrievers and advanced retrieval strategies in LangChain

درک انتزاع بازیاب (Retriever) در LangChain Understanding the retriever abstraction in LangChain
پیاده‌سازی انواع مختلف بازیاب‌ها در LangChain Implementing different types of retrievers in LangChain
بهبود فراخوانی با بازیابی چند-پرس‌وجویی Improving recall with multi-query retrieval
بهبود دقت با فشرده‌سازی متنی (Contextual Compression) Improving precision with contextual compression
ارزیابی سیستم‌های بازیابی Evaluating retrieval systems
توازن‌ها و سبک‌سنگین کردن در سیستم‌های بازیابی Trade-offs in retrieval systems

پرس‌وجوهای ساختاریافته و ترکیبی با LangChain Structured and hybrid querying with LangChain

پرس‌وجوی داده‌های ساختاریافته در LangChain Querying structured data in LangChain
تبدیل زبان طبیعی به SQL با استفاده از LCEL و ایجنت‌ها Natural language to SQL using LCEL and agents
چالش‌های پرس‌وجوی داده‌های ساختاریافته با LLMها Challenges in querying structured data with LLMs
پرس‌وجوی قابل اعتماد با استفاده از LLMها Reliable querying with LLMs
سیستم‌های ترکیبی: ادغام داده‌های ساختاریافته و بدون ساختار Hybrid systems: Combining structured and unstructured data
انتخاب رویکرد مناسب برای دسترسی به داده‌ها Selecting the appropriate data access approach

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش کار با داده‌ها: بازیابی و ذخیره‌سازهای برداری در LangChain

جزییات دوره

زمان دوره: 2h 29m

تعداد ویدیو ها: 37

شرکت: Pluralsight (پلورال سایت)

تاریخ انتشار مرجع: (آخرین آپدیت)

بازدید مرجع : 3

امتیاز مرجع: از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Deepali Srivastava

لینک کوتاه این دوره

https://donyad.com/d/1cc6ff

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

آموزش کار با داده‌ها: بازیابی و ذخیره‌سازهای برداری در LangChain - آخرین آپدیت

دانلود Working with Data: Retrieval and Vector Stores in LangChain

بارگذارهای سند و جذب داده‌ها در LangChain Document loaders and data ingestion in LangChain

مقدمه‌ای بر بارگذارهای سند و جذب داده‌ها Introduction to document loaders and data ingestion

درک شیء سند (Document object) Understanding the Document object

کار با بارگذارهای سند رایج مبتنی بر فایل Working with common file-based document loaders

بارگذاری داده‌ها از وب و منابع API Loading data from web and API sources

بارگذاری دسته‌ای و پردازش مجموعه‌های بزرگ اسناد Batch loading and processing large document collections

بارگذاری تنبل (Lazy loading) برای جذب بهینه اسناد از نظر حافظه Lazy loading for memory-efficient document ingestion

استراتژی‌های تقسیم متن Text splitting strategies

چرا تقسیم متن مورد نیاز است؟ Why text splitting is required

مقدمه‌ای بر تقسیم‌کننده‌های متن در LangChain Introduction to text splitters in LangChain

استفاده از CharacterTextSplitter برای تقسیم ساده CharacterTextSplitter for simple splitting

استفاده از RecursiveCharacterTextSplitter برای حفظ مرزهای معنایی RecursiveCharacterTextSplitter for preserving semantic boundaries

پیکربندی اندازه تکه‌ها (Chunk size) و همپوشانی (Overlap) Configuring chunk size and overlap

تقسیم‌کننده‌های تخصصی برای محتوای ساختاریافته Specialized splitters for structured content

درک امبدینگ‌ها و نمایش‌های برداری Understanding embeddings and vector representations

چرا به امبدینگ‌ها نیاز داریم؟ Why embeddings are needed

امبدینگ‌ها به عنوان نمایش‌های برداری Embeddings as vector representations

مدل‌های امبدینگ در عمل با LangChain Embedding models in practice with LangChain

درک شباهت بین امبدینگ‌ها Understanding similarity between embeddings

ابعاد امبدینگ و توازن بین عملکرد و کیفیت Embedding dimensions and performance tradeoffs

ارزیابی کیفیت و محدودیت‌های امبدینگ Evaluating embedding quality and limitations

ذخیره‌سازهای برداری و جستجوی شباهت مقیاس‌پذیر Vector stores and scalable similarity search

ذخیره‌سازهای برداری چیستند و چرا به آن‌ها نیاز داریم؟ What are vector stores, and why do you need them?

کار با ذخیره‌سازهای برداری با استفاده از LangChain Working with vector stores using LangChain

کار با FAISS برای جستجوی برداری محلی Working with Facebook AI Similarity Search (FAISS) for local vector search

کار با Pinecone برای جستجوی برداری مقیاس‌پذیر Working with Pinecone for scalable vector search

انجام جستجوی شباهت با معیارهای مختلف فاصله Performing similarity search with different distance metrics

فیلتر کردن متادیتا و جستجوی ترکیبی Metadata filtering and hybrid search

مرتبط‌ترین محتوای حداکثری (MMR) برای بازیابی متنوع Maximal marginal relevance (MMR) for diverse retrieval

بازیاب‌ها و استراتژی‌های پیشرفته بازیابی در LangChain Retrievers and advanced retrieval strategies in LangChain

درک انتزاع بازیاب (Retriever) در LangChain Understanding the retriever abstraction in LangChain

پیاده‌سازی انواع مختلف بازیاب‌ها در LangChain Implementing different types of retrievers in LangChain

بهبود فراخوانی با بازیابی چند-پرس‌وجویی Improving recall with multi-query retrieval

بهبود دقت با فشرده‌سازی متنی (Contextual Compression) Improving precision with contextual compression

ارزیابی سیستم‌های بازیابی Evaluating retrieval systems

توازن‌ها و سبک‌سنگین کردن در سیستم‌های بازیابی Trade-offs in retrieval systems

پرس‌وجوهای ساختاریافته و ترکیبی با LangChain Structured and hybrid querying with LangChain

پرس‌وجوی داده‌های ساختاریافته در LangChain Querying structured data in LangChain

تبدیل زبان طبیعی به SQL با استفاده از LCEL و ایجنت‌ها Natural language to SQL using LCEL and agents

چالش‌های پرس‌وجوی داده‌های ساختاریافته با LLMها Challenges in querying structured data with LLMs

پرس‌وجوی قابل اعتماد با استفاده از LLMها Reliable querying with LLMs

سیستم‌های ترکیبی: ادغام داده‌های ساختاریافته و بدون ساختار Hybrid systems: Combining structured and unstructured data

انتخاب رویکرد مناسب برای دسترسی به داده‌ها Selecting the appropriate data access approach

نمایش نظرات

https://donyad.com/d/1cc6ff