آموزش اجرای Captioning تصویر با شبکه های عصبی مکرر

Implement Image Captioning with Recurrent Neural Networks

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: این دوره به شما یاد می دهد که چگونه با استفاده از TensorFlow مدل های زیرنویس تصویر را بسازید و آموزش دهید، با کمک مطالعه موردی - ساخت مدلی برای برچسب گذاری تصویر. شما یاد خواهید گرفت که چگونه داده ها را برای آموزش مدل آماده کنید و مدل آموزش دیده را ارزیابی کنید. تفسیر دستی میلیاردها تصویر زمان بر و تقریبا غیرممکن است. اما اگر درک تصاویر را به ماشین ها آموزش دهیم، این کار بسیار کارآمدتر می شود. در این دوره آموزشی، اجرای Captioning Image with Recurrent Neural Networks، شما یاد خواهید گرفت که با استفاده از TensorFlow مدل های زیرنویس تصویر را با RNN بسازید و آموزش دهید. ابتدا، درک گسترده تر از شبکه های عصبی مکرر را به همراه مروری بر شرح تصاویر و اینکه چگونه CNN ها می توانند به ما در درک تصاویر کمک کنند، کاوش خواهید کرد. در مرحله بعد، نحوه تهیه داده های تصویر و متن را خواهید فهمید. سپس، یاد خواهید گرفت که چگونه یک مدل یادگیری عمیق برای نوشتن شرح تصویر، و گزینه های مختلف برای ارزیابی آن مدل با استفاده از TensorFlow ایجاد کنید. در نهایت، اجرای فرآیند علم داده را درک خواهید کرد. وقتی این دوره را به پایان رساندید، مهارت ها و دانش RNN و CNN مورد نیاز برای ساخت مدل های زیرنویس تصویر را خواهید داشت.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

معرفی تصویر زیرنویس Introducing Image Captioning

  • بررسی اجمالی Overview

  • زیرنویس تصویر چیست و چرا مهم است؟ What Is Image Captioning and Why Is It Important?

  • معرفی مطالعه موردی کسب و کار برای شرح تصاویر Introducing the Business Case Study for Image-captioning

  • راه حل های پیشنهادی برای مطالعه موردی شرح تصویر Proposed Solutions for Image Captioning Case Study

  • خلاصه Summary

آماده سازی داده ها برای مدل های زیرنویس تصویر Preparing Data for Image Captioning Models

  • مرور کلی ماژول و پروژه Module and Project Overview

  • نسخه ی نمایشی: مجموعه داده را بارگیری و کاوش کنید Demo: Load and Explore the Dataset

  • نسخه ی نمایشی: پیش پردازش داده های تصاویر Demo: Pre-processing the Images Data

  • نسخه ی نمایشی: پیش پردازش داده های زیرنویس ها Demo: Pre-processing the Captions Data

  • نسخه ی نمایشی: داده های آموزشی را با استفاده از داده های از پیش پردازش شده آماده کنید Demo: Prepare Training Data Using Pre-processed Data

  • خلاصه Summary

ساخت مدل برای شرح تصویر با استفاده از Tensorflow Building the Model for Image Captioning Using Tensorflow

  • بررسی اجمالی Overview

  • نسخه ی نمایشی: با استفاده از TensorFlow، مدل توجه را برای نوشتن شرح تصویر بسازید Demo: Build the Attention Model for Image-captioning Using TensorFlow

  • نسخه ی نمایشی: رمزگذار CNN را در TensorFlow پیاده سازی کنید Demo: Implement CNN Encoder in TensorFlow

  • نسخه ی نمایشی: رمزگشای RNN را با مولد جملات توجه پیاده سازی کنید Demo: Implement RNN Decoder with Attention & Sentence Generator

  • نسخه ی نمایشی: عملکرد ضرر و نقاط بازرسی مدل را تعریف کنید Demo: Define the Loss Function and Model Checkpoints

  • نسخه ی نمایشی: انجام آموزش مدل Demo: Perform Model Training

  • نسخه ی نمایشی: پیش بینی از مدل آموزش دیده Demo: Making Predictions out of the Trained Model

  • خلاصه Summary

ارزیابی مدل‌های یادگیری عمیق برای شرح تصاویر Evaluating Deep Learning Models for Image Captioning

  • بررسی اجمالی Overview

  • ترانسفورماتور حافظه مشبک برای شرح تصویر Meshed Memory Transformer for Image Captioning

  • معیارهای ارزیابی برای عنوان تصویر Evaluation Metrics for Image Captioning

  • توجه از پایین به بالا و از بالا به پایین برای شرح تصویر Bottom-up and Top-down Attention for Image Captioning

  • خلاصه Summary

نمایش نظرات

آموزش اجرای Captioning تصویر با شبکه های عصبی مکرر
جزییات دوره
1h 33m
25
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Abdul Rehman Yousaf Abdul Rehman Yousaf

عبدالرحمان بنیانگذار Pythonist.org ، یک شرکت مشاوره ، آموزش و توسعه نرم افزار نرم افزار است. در حال حاضر ، او به عنوان یک مهندس ارشد یادگیری ماشین در Nexthon Technologies مشغول به کار است که در آنجا چندین پروژه شگفت انگیز ساخته شده با هوش مصنوعی ساخته است. پیش از این ، او به عنوان یک معمار راه حل Cloud کار می کرد ، زیرساخت های قدرتمند ، ایمن و مقیاس پذیر را بر روی فروشندگان مختلف ابر مانند Google Cloud Platform و AWS ایجاد می کرد. در طول هر دو این نقش ها ، او از پایتون به عنوان زبان اصلی پیشرفت خود استفاده کرد. او یک مجری و معلم باتجربه است ، در چندین کنفرانس ، گروه نرم افزاری و مکانهای داخلی شرکت سخنرانی کرده است. عبدالل همچنین عضوی فعال در جامعه متن باز است که به طور منظم در پروژه های مختلف مرتبط با پایتون و یادگیری ماشین شرکت می کند. عبدول دارای مدرک لیسانس فناوری اطلاعات از دانشگاه گوجرات پاکستان است.