آموزش برنامه نویسی AI: از اتوآنمان های متغیر گرفته تا انتشار پایدار با Pytorch و بغل کردن صورت - آخرین آپدیت

دانلود Programming Generative AI: From Variational Autoencoders to Stable Diffusion with PyTorch and Hugging Face

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:

در این دوره ، جاناتان دینو - یک مربی اختصاصی ، نویسنده و سخنران - یک تور تعاملی از مدل سازی عمیق تولید می کند. بیاموزید که چگونه مدل های تولیدی خود را از ابتدا آموزش دهید تا بی نهایت تصاویر ایجاد شود. کشف کنید که چگونه می توانید متن را با مدل های بزرگ زبان شبیه به آنهایی که برنامه های کاربردی مانند ChatGPT ایجاد می کنند ، ایجاد کنید. خط لوله متن به تصویر خود را بنویسید تا درک کنید که چگونه مدل های تولیدی مبتنی بر سریع کار می کنند. به علاوه ، مدل های بزرگ پیش ساخته مانند انتشار پایدار را برای تولید تصاویر از موضوعات جدید در سبک های بینایی منحصر به فرد شخصی سازی کنید. این دوره یک منبع کاربردی را برای تکمیل هر دانش نظری یا مفهومی شما ارائه می دهد.

این دوره توسط جاناتان دینو و پیرسون ایجاد شده است. ما خوشحالیم که این آموزش را در کتابخانه خود میزبانی می کنیم.


سرفصل ها و درس ها

مقدمه Introduction

  • برنامه نویسی AI: مقدمه Programming generative AI: Introduction

1. چه ، چرا و چگونه AI مولد 1. The What, Why, and How of Generative AI

  • موضوعات موضوعاتی Topics

  • سه گانه مدل سازی مولد The generative modeling trilemma

  • مدل های تولیدی رسمی Formalizing generative models

  • هوش مصنوعی تولیدی در طبیعت Generative AI in the wild

  • چگونه ماشین آلات ایجاد می کنند How machines create

  • مولد در مقابل مدلهای تبعیض آمیز Generative versus discriminative models

  • آشنایی با Google Colab Introduction to Google Colab

  • بسیاری از رسانه ها Multitudes of media

  • تعریف هوش مصنوعی Defining generative AI

2. Pytorch برای بی تاب 2. PyTorch for the Impatient

  • Treilemma نرم افزار یادگیری عمیق The deep learning software trilemma

  • مقایسه نزول شیب و SGD Comparing gradient descent and SGD

  • تنسورها در پیتورچ Tensors in PyTorch

  • شبکه های عصبی چند لایه (MLP) Multi-layer feedforward neural networks (MLP)

  • رگرسیون خطی با Pytorch Linear regression with PyTorch

  • مقدمه ای برای نزول شیب Introduction to gradient descent

  • مؤلفه های یک الگوریتم یادگیری Components of a learning algorithm

  • Pytorch چیست؟ What is PyTorch?

  • Perceptrons و Neurons Perceptrons and neurons

  • کار با دستگاه ها Working with devices

  • لایه ها و فعال سازی با torch.nn Layers and activations with torch.nn

  • رسیدن به نزول شیب تصادفی (SGD) Getting to stochastic gradient descent (SGD)

  • انتزاع دستگاه Pytorch (یعنی GPU) PyTorch's device abstraction (i.e., GPUs)

  • آشنایی با نمودارهای محاسباتی Introduction to computational graphs

  • موضوعات موضوعاتی Topics

  • Backpropagation فقط قانون زنجیره ای است Backpropagation is just the chain rule

  • کیک لایه Pytorch The PyTorch layer cake

  • واقعاً تانسور چیست؟ What are tensors, really?

  • بازگرداندن بی دردسر با Torch.Autograd Effortless backpropagation with torch.autograd

3. فضای نهفته همه چیز را در اطراف من حاکم می کند 3. Latent Space Rules Everything Around Me

  • نگاه کنید به MA ، بدون ویژگی! Look ma, no features!

  • خودرو فروتن The humble autoencoder

  • کاوش در فضای نهفته Exploring latent space

  • مجموعه داده های مد روز The Fashion-MNIST dataset

  • تنظیم یک حلقه تمرینی Setting up a training loop

  • Desiderata برای دید رایانه Desiderata for computer vision

  • استنباط متنوع: نه فقط برای خودروها Variational inference: Not just for autoencoders

  • اجزای یک مدل متغیر نهفته (LVM) Components of a latent variable model (LVM)

  • درون یابی فضای نهفته و بردارهای ویژگی Latent space interpolation and attribute vectors

  • کار با تصاویر در پایتون Working with images in Python

  • موضوعات موضوعاتی Topics

  • تبدیل یک autoencoder به یک VAE Transforming an autoencoder into a VAE

  • نمایندگی تصاویر به عنوان تنش Representing images as tensors

  • تعریف یک AutoEncoder با Pytorch Defining an autoencoder with PyTorch

  • شبکه های عصبی حلقوی در پیتورچ Convolutional neural networks in PyTorch

  • استنتاج با یک AutoEncoder Inference with an autoencoder

  • اضافه کردن احتمال به AutoEncoders (VAE) Adding probability to autoencoders (VAE)

  • ویژگی های شبکه های عصبی حلقوی Features of convolutional neural networks

  • آموزش VAE با Pytorch Training a VAE with PyTorch

4. انتشار تغییر شکل 4. Demystifying Diffusion

  • مدل های انتشار درون یابی Interpolating diffusion models

  • تولید تصاویر با خطوط لوله Diffuser Generating images with diffusers pipelines

  • نسل به عنوان یک فرایند برگشت پذیر Generation as a reversible process

  • ترجمه تصویر به تصویر با sdedit Image-to-image translation with SDEdit

  • نمونه برداری به عنوان deoising تکرار شونده Sampling as iterative denoising

  • موضوعات موضوعاتی Topics

  • فرآیند رو به جلو به عنوان رمزگذار Forward process as encoder

  • تجزیه فرآیند انتشار Deconstructing the diffusion process

  • فرآیند معکوس به عنوان رمزگشایی Reverse process as decoder

  • ترمیم و تقویت تصویر Image restoration and enhancement

  • دیفیوزرها و اکوسیستم صورت بغل کردن Diffusers and the Hugging Face ecosystem

5. تولید و رمزگذاری متن با ترانسفورماتورها 5. Generating and Encoding Text with Transformers

  • جستجوی معنایی با تعبیه Semantic search with embeddings

  • تولید متن با خطوط لوله ترانسفورماتور Generating text with transformers pipelines

  • موضوعات موضوعاتی Topics

  • تجسم و درک توجه Visualizing and understanding attention

  • ترانسفورماتورها فقط مدل های متغیر نهفته برای توالی هستند Transformers are just latent variable models for sequences

  • استراتژی های رمزگشایی Decoding strategies

  • مدل های تولیدی زبان Generative models of language

  • توالی تعبیه شده با ترانسفورماتورها Embedding sequences with transformers

  • مدل فضایی بردار The vector space model

  • تبدیل کلمات به بردارها Turning words into vectors

  • ساخت مجدد خطوط لوله ترانسفورماتور Deconstructing transformers pipelines

  • تعبیهات متضاد با ترانسفورماتورهای جمله Contrastive embeddings with sentence transformers

  • محاسبه شباهت بین تعبیه Computing the similarity between embeddings

  • خط لوله پردازش زبان طبیعی The natural language processing pipeline

6. اتصال متن و تصاویر 6. Connecting Text and Images

  • نوشتن خط لوله انتشار پایدار خود Writing your own stable diffusion pipeline

  • آشنایی با مدل های انتشار نهفته Introduction to latent diffusion models

  • مدل های تولیدی مشروط Conditional generative models

  • معماری مدل انتشار نهان The latent diffusion model architecture

  • طبقه بندی تصویر صفر با کلیپ Zero-shot image classification with CLIP

  • بهبود نسل با راهنمایی Improving generation with guidance

  • تعبیه متن و تصاویر با کلیپ Embedding text and images with CLIP

  • موضوعات موضوعاتی Topics

  • انتشار پایدار تجزیه شده Stable diffusion deconstructed

  • بازی با اعلان ها Playing with prompts

  • حالت های خرابی و ابزارهای اضافی Failure modes and additional tools

  • اجزای یک مدل چند مدلی Components of a multimodal model

  • درک بینایی زبان Vision-language understanding

  • پیش فرض زبان متضاد Contrastive language-image pretraining

  • جستجوی تصویر معنایی با کلیپ Semantic image search with CLIP

  • رمزگشایی تصاویر از فضای پنهان انتشار پایدار Decoding images from the stable diffusion latent space

7. روشهای پس از آموزش برای مدل های انتشار 7. Post-Training Procedures for Diffusion Models

  • تولید زیرنویس های اتوماتیک با blip-2 Generating automatic captions with BLIP-2

  • ارزیابی دستی انتشار پایدار با Drawbench Manual evaluation of stable diffusion with DrawBench

  • درک و آزمایش با پارامترهای کنترل Understanding and experimenting with ControlNet parameters

  • ایجاد نقشه های لبه و عمق برای تهویه Creating edge and depth maps for conditioning

  • نمای کلی از روش های تنظیم دقیق مدل های انتشار Overview of methods for fine-tuning diffusion models

  • چند مرحله نسل با تقطیر انتشار مخالف (اضافه کردن) Few step generation with adversarial diffusion distillation (ADD)

  • تولید قاب با قاب ویدیویی با SDXL Turbo Video-driven frame-by-frame generation with SDXL Turbo

  • Dreambooth در مقابل تنظیم دقیق لورا DreamBooth versus LoRa fine-tuning

  • استنباط نزدیک به زمان واقعی با بهینه سازی عملکرد Pytorch Near real-time inference with PyTorch performance optimizations

  • افزودن کنترل مشروط به مدل های انتشار متن به تصویر Adding conditional control to text-to-image diffusion models

  • موضوعات موضوعاتی Topics

  • پارامتر تنظیم دقیق با لورا Parameter efficient fine-tuning with LoRa

  • منابع و تهیه مجموعه داده های تصویر برای تنظیم دقیق Sourcing and preparing image datasets for fine-tuning

  • انتشار پایدار عمق و لبه با کنترل با کنترل Depth and edge-guided stable diffusion with ControlNet

  • نمای کلی از وارونگی متنی Conceptual overview of textual inversion

  • دلایل تقطیر Reasons to distill

  • استنباط با رویای رویایی برای ایجاد آواتارهای هوش مصنوعی شخصی Inference with DreamBooth to create personalized AI avatars

  • مقایسه SDXL و SDXL توربو Comparing SDXL and SDXL Turbo

  • شخصی سازی خاص موضوع با Dreambooth Subject-specific personalization with DreamBooth

  • استنتاج با LORAS برای نسل خاص سبک Inference with LoRas for style-specific generation

  • ترجمه تصویر به تصویر با هدایت متن Text-guided image-to-image translation

  • روش ها و معیارهای ارزیابی هوش مصنوعی مولد Methods and metrics for evaluating generative AI

  • بازرسی از نتایج تنظیم دقیق Inspecting the results of fine-tuning

  • جلوه های متن تولیدی با نقشه های عمق قلم Generative text effects with font depth maps

  • ارزیابی کمی از مدل های انتشار با پیش بینی کننده ترجیح انسان Quantitative evaluation of diffusion models with human preference predictors

  • Dreambooth خوب تنظیم با بغل کردن صورت DreamBooth fine-tuning with Hugging Face

پایان Conclusion

  • برنامه نویسی AI: خلاصه Programming generative AI: Summary

نمایش نظرات

آموزش برنامه نویسی AI: از اتوآنمان های متغیر گرفته تا انتشار پایدار با Pytorch و بغل کردن صورت
جزییات دوره
18h 15m
116
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
244
- از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Pearson Pearson

Pearson یک ارائه دهنده آموزش و یادگیری است.

هدف پیرسون این است که به افراد کمک کند تا زندگی خود را از طریق یادگیری درک کنند، با این باور که هر فرصت یادگیری فرصتی برای پیشرفت شخصی است. کارکنان پیرسون متعهد به ایجاد تجربیات یادگیری پر جنب و جوش و غنی هستند که برای تأثیرگذاری در زندگی واقعی طراحی شده اند. آنها در نزدیک به 200 کشور با محتوای دیجیتال، ارزیابی ها، صلاحیت ها و داده ها به مشتریان خدمات ارائه می دهند.

Jonathan Dinu Jonathan Dinu

جاناتان دینو یک مربی ، نویسنده و سخنران اختصاصی است که یادگیری را به خلاق ترین راه های ممکن به اشتراک می گذارد.

جاناتان آکادمی زیپفیان - یک برنامه آموزشی همهجانبه پیشرفته برای دانشمندان داده و مهندسان داده در سانفرانسیسکو - را تأسیس کرد و قبل از خرید توسط گالوانیز به عنوان CAO/CTO خود خدمت کرد. او هنگام مطالعه علوم کامپیوتر و فیزیک در UC برکلی ، عشق خود را به همه چیزها کشف کرد.

جاناتان کارگاه های علوم داده را در اقشار و پیوتاتا اجرا کرده است ، یک دوره تجسم داده را با Udacity ساخته و در هیئت مشاوره علوم داده پسوند UC برکلی خدمت کرده است. او در حال نوشتن کتابی در مورد برنامه های کاربردی علوم داده های عملی با استفاده از پایتون است. هنگامی که او با دانشجویان کار نمی کند ، می توانید وبلاگ نویسی جاناتان را در مورد داده ها ، تجسم و آموزش پیدا کنید.