لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش بنچمارک و ارزیابی مدلهای زبانی بزرگ (LLM)
- آخرین آپدیت
دانلود LLM Benchmarking and Evaluation Training
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
این دوره جامع در زمینه ارزیابی و بهکارگیری قابلیتهای LLM، شما را با مهارتهای لازم برای تحلیل، پیادهسازی و سنجش مدلهای زبانی بزرگ در سناریوهای واقعی آشنا میکند. آموزش با قابلیتهای هستهای آغاز شده و به مباحث خلاصهسازی، ترجمه و نحوه تولید محتوای صنعتی توسط LLMها میپردازد. در ادامه، کاربردهای تعاملی و تحلیلی از جمله چتباتها، دستیاران مجازی و تحلیل احساسات را از طریق دموهای عملی با استفاده از LangChain و ChromaDB بررسی خواهید کرد. در نهایت، با تسلط بر چارچوبهای بنچمارک و ارزیابی مانند ROUGE، GLUE، SuperGLUE و BIG-bench، نحوه اندازهگیری دقت، مرتبط بودن و عملکرد مدلها را خواهید آموخت.
برای موفقیت در این دوره، داشتن درک پایهای از LLMها، زبان پایتون و مبانی پردازش زبان طبیعی (NLP) توصیه میشود.
در پایان این دوره شما قادر خواهید بود:
- قابلیتهای LLM را بررسی کنید: درک خلاصهسازی، ترجمه و کاربردهای آنها
- اپلیکیشنهای LLM بسازید: ساخت چتباتها و ابزارهای تحلیل احساسات با ابزارهای واقعی
- عملکرد مدل را ارزیابی کنید: استفاده از ROUGE، GLUE و BIG-bench برای بنچمارک LLMها
- تحلیل موارد استفاده: ارزیابی مزایا، محدودیتها و استقرار راهکارهای مبتنی بر LLM
این دوره برای توسعهدهندگان هوش مصنوعی، مهندسان یادگیری ماشین و متخصصان GenAI ایدهآل است.
سرفصل ها و درس ها
قابلیتهای هستهای LLMها
Core Capabilities of LLMs
اهداف آموزشی
Learning Objectives
چهار قابلیت اصلی LLM
Four Major Capabilities of LLM
بررسی کلی، مزایا، محدودیتها و کاربردهای صنعتی خلاصهسازی
Overview, Benefits, Limitations, and Industrial Applications of Summarization
دمو: خلاصهساز متن
Demo: Text Summarizer
بررسی کلی، مزایا، محدودیتها و کاربردهای صنعتی ترجمه محتوا
Overview, Benefits, Limitations, and Industrial Applications of Content Translation
کاربردهای تعاملی و تحلیلی LLM
Interactive and Analytical LLM Applications
بررسی کلی، مزایا، محدودیتها و کاربردهای صنعتی چتباتها و دستیاران مجازی
Overview, Benefits, Limitations, and Industrial Applications of Chatbots and Virtual Assistants
دمو: بازیاب پاسخگو برای چندین PDF با ChromaDB و LangChain
Demo: MultiPDF QA Retriever with ChromaDB and LangChain
بررسی کلی، مزایا و محدودیتهای تحلیل احساسات
Overview, Benefits, and Limitations of Sentiment Analysis
دمو: تحلیل احساسات
Demo: Sentiment Analysis
ارزیابی و بنچمارک LLM
LLM Evaluation and Benchmarking
بنچمارک و مراحل اجرای آن
Benchmarking and Its Steps
بنچمارکهای مدلهای زبانی
Benchmarks for Language Models
دمو: بنچمارک ROUGE
Demo: ROUGE Benchmark
نیاز به بنچمارکهای جدید
Need for New Benchmarks
تسکهای بنچمارک GLUE
GLUE Benchmark Tasks
تسکهای بنچمارک SuperGLUE: بخش اول
SuperGLUE Benchmark Tasks: Part 1
تسکهای بنچمارک SuperGLUE: بخش دوم
SuperGLUE Benchmark Tasks: Part 2
بنچمارک فراتر از بازی تقلید (BIG bench)
Beyond the Imitation Game Benchmark (BIG-bench)
نمایش نظرات