آموزش استقرار و نگهداری سیستم‌های RAG - آخرین آپدیت

دانلود Deploying and Maintaining RAG Systems

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: مدل‌های زبانی بزرگ (LLM) قدرتمند هستند، اما بدون دسترسی به داده‌های واقعی، ممکن است دچار توهم شوند. تولید تقویت‌شده با بازیابی (RAG) با ترکیب فرآیند تولید متن و جستجوی متنی، این مشکل را حل می‌کند. در این دوره، «استقرار و نگهداری سیستم‌های RAG»، شما یاد می‌گیرید چگونه سرویس‌های هوش مصنوعی مقیاس‌پذیر، دقیق و قابل رصد بسازید که از قابلیت بازیابی به عنوان یک رکن اصلی استفاده می‌کنند. ابتدا، معماری و بلوک‌های سازنده اصلی یک سیستم RAG مدرن را بررسی خواهید کرد. سپس، نحوه استقرار و ارائه سیستم‌های RAG در محیط عملیاتی با استفاده از نقاط اتصال API، مانیتورینگ و استراتژی‌های بازگشت (Rollback) را می‌آموزید. در نهایت، عملکرد بازیابی، فشرده‌سازی و بهینه‌سازی هزینه‌ها را در مقیاس بالا بهینه خواهید کرد. در پایان این دوره، شما مهارت‌های لازم برای مدیریت مطمئن یک سرویس RAG آماده تولید را کسب کرده و می‌توانید تصمیمات informed در مورد قابلیت رصد، تأخیر (Latency) و مقیاس‌پذیری بگیرید.

سرفصل ها و درس ها

توضیح اجزای کلیدی و معماری مدل‌های RAG Explain Key Components and Architecture of RAG Models

  • سیستم RAG چیست و چرا از آن استفاده می‌کنیم؟ What Is a RAG System and Why Use It?

  • ستون‌های اصلی یک سیستم RAG The Pillars of a RAG System

  • تنظیمات بهینه‌سازی و سبک-سنگین کردن پارامترها Optimization Knobs and Trade-offs

توسعه سرویس RAG آماده برای محیط عملیاتی Develop a Production Ready RAG Service

  • دمو: ارائه RAG از طریق API: کالبدشکافی یک درخواست عملیاتی Demo: Serving RAG via API: Anatomy of a Production Request

  • قابلیت رصد: لاگ‌گذاری، مانیتورینگ و ردیابی Observability: Logging, Monitoring, and Tracing

  • نسخه‌بندی و بازگشت: حفظ پایداری سیستم RAG Versioning and Rollbacks: Keeping RAG Stable

بهینه‌سازی سیستم‌های RAG برای مقیاس و هزینه Optimize RAG Systems for Scale and Cost

  • طراحی ایندکس و تکنیک‌های فشرده‌سازی Index Design and Compression Techniques

  • بودجه تأخیر و تنظیمات بازیابی Latency Budgets and Retrieval Tuning

  • دمو: کشینگ و افزایش سرعت بازیابی در عمل Demo: Caching and Retrieval Speedup in Action

نمایش نظرات

آموزش استقرار و نگهداری سیستم‌های RAG
جزییات دوره
27m
9
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
10
3 از 5
دارد
دارد
دارد
Harsh Karna
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Harsh Karna Harsh Karna

Harsh یک مهندس نرم افزار ماهر با بیش از 4 سال تجربه در مهندسی داده ها و توسعه نرم افزار است. او در فن آوری های داده های بزرگ مانند Hadoop ، Spark و SQL به همراه سیستم عامل های ابری مانند AWS و Azure تخصص زیادی دارد ، جایی که او ETL قوی و چارچوب های داده را بر روی سیستم عامل هایی مانند Snowflake و Databricks ساخته است. در زبانهای برنامه نویسی مانند پایتون ، SQL و جاوا مهارت دارد ، Harsh همچنین در چارچوب های Django و Flask تجربه دارد. کار وی شامل طراحی و اجرای خطوط لوله داده ، دریاچه های داده و انبارهای داده است. HARSH با سابقه ای در علوم داده ، یادگیری ماشین و آمار ، به پروژه های متنوعی از جمله پردازش زبان طبیعی و دید رایانه کمک کرده است. او به عنوان یک فریلنسر ، پروژه هایی را در مهندسی داده ها ، داده های بزرگ ، محاسبات ابری ، تجزیه و تحلیل داده ها و ژنرال هوش مصنوعی مقابله می کند. در خارج از کار ، سخت عاشق مسافرت ، یادگیری در مورد فرهنگ های جدید و ملاقات با مردم از سراسر جهان است. او مربیگری رایگان را به دانشجویان و افراد متقاضی شغل ارائه می دهد و به آنها کمک می کند تا در صنعت فناوری حرکت کنند.