آموزش لایه داده و دانش در هوش مصنوعی مولد (GenAI) - آخرین آپدیت

دانلود GenAI Data and Knowledge Layer

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: مهندسان اغلب در زمینه نحوه نمایش داده‌ها به صورت بردار، انتخاب و مدیریت ذخیره‌سازهای برداری، طراحی گراف‌های دانش و ایجاد خط لوله‌های (Pipelines) قدرتمندی که داده‌ها را در مقیاس بالا به‌روز و قابل تست نگه دارند، با چالش روبرو هستند. در دوره «لایه داده و دانش GenAI»، شما توانایی طراحی و پیاده‌سازی لایه‌های داده و دانشی را کسب می‌کنید که برای محیط‌های عملیاتی (Production) آماده بوده و قدرت‌بخش برنامه‌های قابل اعتماد هوش مصنوعی مولد هستند. ابتدا بررسی خواهید کرد که چگونه Embeddings، ذخیره‌سازهای برداری و استراتژی‌های تکه‌بندی (Chunking)، داده‌های خام را به نمایش‌های معنایی مؤثر برای تولید تقویت‌شده با بازیابی (RAG) تبدیل می‌کنند. سپس، نحوه معماری و مدیریت پایگاه‌های داده برداری، یکپارچه‌سازی گراف‌های دانش و سازمان‌دهی خط لوله‌های جامع برای جذب، تبدیل و ایندکس مستمر داده‌ها را خواهید آموخت. در نهایت، یاد می‌گیرید که چگونه از تکنیک‌های پیش‌پردازش پیشرفته و تولید داده‌های مصنوعی برای بهبود کیفیت بازیابی، استحکام و پوشش تست سیستم‌های GenAI خود استفاده کنید. در پایان این دوره، شما مهارت‌ها و دانش لازم برای ساخت و نگهداری سیستم‌های مقیاس‌پذیر و صنعتی GenAI را که بر پایه داده‌های اختصاصی شما استوار هستند، به دست خواهید آورد.

سرفصل ها و درس ها

مبانی امبدینگ‌ها و ذخیره‌سازهای برداری Embeddings and Vector Stores Fundamentals

  • امبدینگ‌ها: از بردارها تا معناشناسی Embeddings from Vectors to Semantics

  • ریاضیات شباهت معنایی The Mathematics of Semantic Similarity

  • درک فضاهای برداری از طریق بصری‌سازی Understanding Vector Spaces through Visualization

  • مدل‌های امبدینگ: OpenAI، Cohere و مدل‌های متن‌باز Embedding Models OpenAI, Cohere and Open Source

  • ارزیابی کیفیت امبدینگ: MTEB و فراتر از آن Evaluating Embedding Quality MTEB and Beyond

  • تولید امبدینگ‌ها در مقیاس بالا Generating Embeddings at Scale

  • ساخت خط لوله‌های امبدینگ مقاوم Building Robust Embedding Pipelines

  • جستجوی شباهت معنایی در عمل Semantic Similarity Search in Practice

معماری و عملیات پایگاه داده برداری Vector Database Architecture and Operations

  • ذخیره‌سازهای برداری Vector Stores

  • ساختار داخلی پایگاه‌های داده برداری Vector Database Internals

  • الگوریتم‌های ایندکس‌گذاری Indexing Algorithms

  • استراتژی‌های ذخیره‌سازی برای مقیاس‌پذیری Storage Strategies for Scale

  • مقایسه پایگاه‌های داده برداری Vector Database Comparison

  • استفاده از Pgvector و راهکارهای Self-hosted Pgvector and Self-hosted Solutions

  • طراحی شمای پایگاه داده برداری Designing Vector Database Schemas

  • الگوهای پیشرفته پرس‌وجو (Query) Advanced Query Patterns

  • عملیات در محیط عملیاتی (Production) Production Operations

  • مانیتورینگ سلامت ایندکس و بازیابی Monitoring Index Health and Recovery

گراف‌های دانش و دانش ساختاریافته Knowledge Graphs and Structured Knowledge

  • مبانی گراف‌های دانش Knowledge Graphs Fundamentals

  • مقایسه گراف دانش با پایگاه داده و ذخیره‌ساز برداری Knowledge Graphs vs. Databases vs. Vector Stores

  • طراحی هستی‌شناسی (Ontology) و شمای گراف Ontology and Schema Design

  • بازشناسی موجودیت‌ها از متن‌های بدون ساختار Entity Recognition from Unstructured Text

  • استخراج روابط و ساخت دانش Relation Extraction and Knowledge Construction

  • ساخت گراف‌های دانش با استفاده از LLMها Building Knowledge Graphs with LLMs

  • تکنیک‌های امبدینگ گراف Graph Embedding Techniques

  • بازیابی ترکیبی: بردارها و پیمایش گراف Hybrid Retrieval Vectors and Graph Traversal

  • پرس‌وجو در گراف‌های دانش Querying Knowledge Graphs

  • نگهداری و تکامل گراف دانش Knowledge Graph Maintenance and Evolution

خط لوله‌های عملیاتی، پیش‌پردازش پیشرفته و داده‌های مصنوعی Production Pipelines, Advanced Preprocessing, and Synthetic Data

  • معماری خط لوله جامع داده (End-to-End) End-to-end Data Pipeline Architecture

  • استراتژی‌های تکه‌بندی (Chunking) Chunking Strategies

  • مدیریت محتوای چندوجهی (Multi-Modal) Multi Modal Content Handling

  • غنی‌سازی متاداده‌ها و تزریق بافت (Context) Metadata Enrichment and Context Injection

  • سازمان‌دهی خط لوله‌ها Orchestrating Pipelines

  • تولید داده‌های مصنوعی و تست Synthetic Data Generation and Testing

نمایش نظرات

آموزش لایه داده و دانش در هوش مصنوعی مولد (GenAI)
جزییات دوره
1h 56m
34
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
7
از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Laurentiu Raducu Laurentiu Raducu

همه چیز از دبیرستان شروع شد، زمانی که Laurentiu برای اولین بار راه خود را در سفر علم کامپیوتر آغاز کرد. در ابتدا او با C++ شروع کرد و به سرعت عاشق چشم انداز یادگیری توسعه نرم افزار شد. به لطف علاقه اش به شطرنج، اولین برنامه کامپیوتری او یک بازی شطرنج مبتنی بر کنسول ASCII بود که در C++ توسعه یافت. پس از مدتی، در دوران دانشگاه، لورنتیو شروع به آزمایش با سایر زبان های برنامه نویسی OOP، مانند جاوا، کاتلین یا پایتون کرد. او شروع به بازی با پشته ها و فریم ورک های مختلف فناوری، توسعه و انتشار برنامه های نرم افزاری برای دستگاه های اندرویدی کرد. با این حال، زمانی که لاورنتیو تصمیم گرفت دنیای امنیت سایبری را کشف کند، همه چیز شروع به تغییر کرد. او شروع به رفتن به هکاتون های امنیتی، رویدادهای CTF کرد و چالش های متعددی را در وب سایت هایی مانند overthewire.org تکمیل کرد. در همان زمان، او متوجه شد که ممکن است ایده خوبی باشد که سفر خود را با استفاده از فیلم‌های کوتاه مستند کند، و سپس فکر کرد که می‌تواند یک سخنران شود و به مردم کمک کند بیشتر در مورد فناوری بیاموزند.