پیشنیازها:
تست برنامههای هوش مصنوعی و LLM با DeepEval، RAGas و ابزارهای بیشتر با استفاده از Ollama و مدلهای زبان بزرگ محلی (LLM)
با این دوره عملی، بر مهارتهای ضروری تست و ارزیابی برنامههای هوش مصنوعی، به ویژه مدلهای زبان بزرگ (LLM)، مسلط شوید. این دوره به متخصصان تضمین کیفیت (QA)، مهندسان QA هوش مصنوعی، توسعهدهندگان، دانشمندان داده و متخصصان هوش مصنوعی، تکنیکهای پیشرفتهای را ارائه میدهد تا عملکرد هوش مصنوعی را ارزیابی کنند، سوگیریها را شناسایی کنند و از توسعه کاربردهای قوی و پایدار اطمینان حاصل نمایند.
سرفصلهای دوره:
بخش 1: مبانی تست اپلیکیشنهای هوش مصنوعی (مقدمهای بر تست LLM، انواع اپلیکیشنهای هوش مصنوعی، معیارهای ارزیابی، کتابخانههای ارزیابی LLM).
بخش 2: استقرار LLM محلی با Ollama (استقرار مدلهای زبان بزرگ محلی، مدلهای هوش مصنوعی، راهاندازی LLMها به صورت محلی، پیادهسازی Ollama، GUI/CLI، تنظیم Ollama به عنوان API).
بخش 3: راهاندازی محیط (Jupyter Notebook برای تستها، راهاندازی Confident AI).
بخش 4: مبانی DeepEval (تست سنتی LLM، اولین کد DeepEval برای AnswerRelevance، Context Precision، ارزیابی در Confident AI، تست با LLM محلی، درک LLMTestCases و Goldens).
بخش 5: ارزیابی پیشرفته LLM (LangChain برای LLMها، ارزیابی ارتباط پاسخ (Answer Relevancy)، دقت متن (Context Precision)، تشخیص سوگیری، معیارهای سفارشی با GEval، تست سوگیری پیشرفته).
بخش 6: تست RAG با DeepEval (مقدمهای بر RAG، درک اپلیکیشنهای RAG، نمایش، ایجاد GEval برای RAG، تست برای اختصار و کامل بودن).
بخش 7: تست پیشرفته RAG با DeepEval (ایجاد دادههای تستی متعدد، Goldens در Confident AI، خروجی واقعی و متن بازیابی، LLMTestCases از مجموعه داده، اجرای ارزیابی برای RAG).
بخش 8: تست عاملهای هوش مصنوعی (AI Agents) و فراخوانی ابزارها (Tool Callings) (درک عاملهای هوش مصنوعی، کار با ایجنتها، تست ایجنتها با و بدون سیستمهای واقعی، تست با چندین مجموعه داده).
بخش 9: ارزیابی LLM با RAGAS (مقدمهای بر RAGAS، بازیابی متن (Context Recall)، حساسیت به نویز (Noise Sensitivity)، MultiTurnSample، معیارهای عمومی برای خلاصهسازی و مضر بودن).
بخش 10: تست اپلیکیشنهای RAG با RAGAS (مقدمه و راهاندازی، ایجاد بازیابها و فروشگاههای برداری، مجموعه داده MultiTurnSample برای RAG، ارزیابی RAG با RAGAS).
Karthik KK
معمار نرم افزار ، مشاور ، Youtuber و بهترین فروشنده من Karthik K.K هستم من در مورد ابزارها و فن آوری های مختلف مشاوره ، وبلاگ نویسی و تحقیق انجام می دهم که علاقه من را برمی انگیزد. من بیش از 13 سال است که مشغول تست اتوماسیون نرم افزار هستم و علاقه من به یادگیری مطالب جدید که امکان اتوماسیون را فراهم می کند هرگز به خطر نیفتاده است. به دلیل اشتیاق من در تست اتوماسیون ، کاملاً در معرض ابزارها و زبانهایی قرار گرفتم دسک تاپ و وب: QTP ، سلنیوم ، Specflow ، VS Coded UI ، Ranorex ، Test Complete و Cucumber موبایل: Appium ، Robotium ، Calabash ، Espresso ، Selendroid زبان ها: C # ، Java ، Ruby ، Powershell ، Javascript ، VBScript ابزارهای ابری: لاجوردی ، بارانداز Misc Tools: Mockito ، مطمئن باشید ، Bound-Box ، FluentAutomation علاقه مند به: MVC ، چارچوب موجودیت ، LINQ ، جعلی ، استقرار توزیع شده ، SAAS
نمایش نظرات