لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
RAG چندوجهی: سیستمهای جستجو و توصیهکننده هوش مصنوعی با GPT-4
Multimodal RAG: AI Search & Recommender Systems with GPT-4
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
تسلط بر RAG چندوجهی: ساخت سیستمهای توصیهکننده جستجوی مبتنی بر هوش مصنوعی با GPT-4، CLIP، و ChromaDB، درک و پیادهسازی Retrieval-Augmented Generation (RAG) با دادههای چندوجهی (متن، تصاویر). با استفاده از GPT-4، CLIP و ChromaDB، سیستمهای جستجو و توصیهکننده مبتنی بر هوش مصنوعی بسازید. ایجاد و استفاده از جاسازی متن و تصویر برای انجام جستجوهای چندوجهی. توسعه برنامه های کاربردی تعاملی با Streamlit برای رسیدگی به پرسش های کاربر و ارائه توصیه های مبتنی بر هوش مصنوعی پیش نیازها: درک اولیه برنامه نویسی پایتون. آشنایی با مفاهیم یادگیری ماشین (Embeddings، Vector). هیچ تجربه قبلی با سیستم های چندوجهی مورد نیاز نیست، اما دانش ابزارهای هوش مصنوعی مانند GPT یا CLIP مفید خواهد بود. رایانه ای با دسترسی به اینترنت و قابلیت نصب کتابخانه های پایتون مانند Streamlit، OpenAI و ChromaDB.
آیا آماده هستید تا به دنیای پیشرفته سیستمهای جستجو و توصیهکننده مبتنی بر هوش مصنوعی شیرجه بزنید؟ این دوره شما را از طریق فرآیند ساخت سیستمهای چندوجهی بازیابی-نسل افزوده (RAG) که دادههای متن و تصویر را برای بازیابی اطلاعات و توصیههای پیشرفته ترکیب میکند، راهنمایی میکند.
در این دوره آموزشی، میآموزید که چگونه از ابزارهای پیشرفته مانند GPT-4، CLIP و ChromaDB برای ساختن سیستمهای هوش مصنوعی که قادر به پردازش دادههای چندوجهی هستند، استفاده کنید - با بهبود روشهای جستجوی سنتی با قدرت یادگیری ماشینی و جاسازیها.
آنچه یاد خواهید گرفت:
Master Multimodal RAG: مفهوم Retrieval-Augmented Generation (RAG) و نحوه پیادهسازی آن را برای دادههای مبتنی بر متن و تصویر درک کنید.
ساخت سیستمهای توصیه جستجوی مبتنی بر هوش مصنوعی: با استفاده از مدلهای قدرتمند هوش مصنوعی مانند GPT-4 و CLIP، یاد بگیرید که چگونه موتورهای جستجو و سیستمهای توصیهکننده بسازید که میتوانند پرسوجوهای چندوجهی را مدیریت کنند.
استفاده از Embeddings برای جستجوی چندوجهی: تجربه عملی ایجاد و استفاده از جاسازیها برای فعال کردن جستجو و توصیهها بر اساس ورودی متن یا تصویر را به دست آورید.
برنامههای کاربردی تعاملی را با Streamlit توسعه دهید: برنامههای کاربرپسند ایجاد کنید که امکان جستجو و توصیههای همزمان را بر اساس دادههای متن یا تصویر ارائهشده توسط کاربر فراهم میکند.
تکنولوژی های کلیدی که با آنها کار خواهید کرد:
GPT-4 : یک مدل زبان پیشرفته که توصیه های مبتنی بر هوش مصنوعی را تقویت می کند.
CLIP: یک مدل هوش مصنوعی پیشرفته برای ایجاد تصاویر و جاسازی متن، که امکان جستجوی تصاویر با متن را فراهم می کند.
ChromaDB: یک پایگاه داده برداری با کارایی بالا که امکان جستجوی سریع و کارآمد را برای جاسازی های چندوجهی فراهم می کند.
Streamlit: یک چارچوب ساده و در عین حال قدرتمند برای ساخت برنامه های کاربردی وب تعاملی.
تجربه قبلی با سیستم های چندوجهی ندارید؟ مشکلی نیست!
این دوره طراحی شده است تا مفاهیم پیشرفته هوش مصنوعی را با دستورالعمل های دقیق و گام به گام در دسترس قرار دهد که شما را در هر فرآیند راهنمایی می کند - از تولید جاسازی ها تا ساخت سیستم های کامل هوش مصنوعی. دانش پایه پایتون و کنجکاوی برای هوش مصنوعی تمام چیزی است که برای شروع نیاز دارید.
همین امروز ثبت نام کنید و با تسلط بر هنر سیستم های RAG چندوجهی، مهارت های توسعه هوش مصنوعی خود را به سطح بعدی ارتقا دهید!
سرفصل ها و درس ها
مقدمه
Introduction
مقدمه و پیش نیازها
Introduction & Prerequisites
ساختار دوره
Course Structure
این دمو را تماشا کنید - آنچه در این دوره خواهید ساخت
WATCH THIS DEMO - What You'll Build in This Course
کد منبع و منابع را دانلود کنید
Download Source code and Resources
کد منبع را دانلود کنید
Download source code
راه اندازی محیط توسعه
Development environment Setup
راه اندازی محیط توسعه - بررسی اجمالی
Development Environment Setup - Overview
RAG (Retrieval Augmented Generation) و سیستم های چندوجهی Deep Dive
RAG (Retrieval Augmented Generation) and Multimodal Systems Deep Dive
RAG Systems - دوره له شدن عمیق شیرجه
RAG Systems - Deep Dive Crush Course
مزایای RAG و کاربرد عملی
RAG Benefits and Practical Application
RAG چندوجهی - بررسی اجمالی و انگیزه و مزایا - چگونه کار می کند
Multimodal RAG - Overview & Motivation and Benefits - How it Works
جستجو در یک سیستم RAG چند وجهی
Search in a Multimodal RAG System
چگونه جستجو در یک سیستم RAG چند وجهی ادغام می شود - گردش کار کامل
How Search is Integrated into a Multimodal RAG System - Full Workflow
چرا جستجوی چندوجهی بسیار قدرتمند است
Why Multimodal Search is so Powerful
توضیح تصویری چرا جستجوی چندوجهی اینقدر قدرتمند است
Visual Explanation Why Multimodal Search is so Powerful
عملی: سیستم RAG جستجوی چندوجهی
Hands-on: Multimodal Search RAG System
راه اندازی سیستم جستجوی چندوجهی - ایجاد جاسازی تصاویر
Multimodal Search System Setup - Create Embeddings of Images
سیستم جستجوی چندوجهی را تمام کنید
Finish the Multimodal Search System
Hands-On - سیستم توصیه کننده چندوجهی
Hands-On - Multimodal Recommender System
سیستم توصیه کننده چندوجهی - بررسی اجمالی
Multimodal Recommender System - Overview
دریافت مجموعه داده ما از در آغوش گرفتن صورت و نمایش تعداد ردیفها
Getting our Dataset from Hugging Face & Showing Number of Rows
ذخیره همه تصاویر به صورت محلی
Saving all Images Locally
ذخیره جاسازی های تصویر در پایگاه داده برداری
Saving Image Embeddings to Vector Database
آزمایش سیستم توصیهکننده چندوجهی ما - واکشی تصاویر صحیح
Testing our Multimodal Recommender System - Fetching the Correct Images
راه اندازی RAG Flow - قسمت 1
Setting up the RAG Flow - Part 1
قرار دادن همه اینها با هم و آزمایش سیستم چندوجهی توصیه کننده RAG
Putting it all Together and Testing the Multimodal Recommender RAG System
افزودن یک رابط کاربری به سیستم توصیهکننده چندوجهی - Streamlit
Adding a UI to the Multimodal Recommender System - Streamlit
نمایش نظرات