آموزش با Gemini یک ابزار زیرنویس تصویر برای کاربران کم بینا بسازید

Build an Image Captioning Tool for Visually Impaired Users with Gemini

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: وقتی برای وب طراحی می‌کنید، ضروری است که طرح‌های شما برای هر چه بیشتر افراد در دسترس باشد، و این شامل کاربران کم بینا نیز می‌شود. در حالی که ابزارهای زیادی برای کمک به شما در این کار طراحی وجود دارد، هوش مصنوعی این کار را آسان‌تر از همیشه می‌کند. در این دوره، توسعه‌دهنده نرم‌افزار Fikayo Adepoju به شما نشان می‌دهد که چگونه از Google's Gemini API برای ساختن یک تولید کننده شرح تصویر استفاده کنید که به کاربران کم بینا کمک می‌کند تا وب را بهتر تجربه کنند. با Gemini API تجربه عملی داشته باشید زیرا Fikayo شما را در ساخت برنامه از ابتدا تا انتها راهنمایی می کند. یاد بگیرید که چگونه رابط را بسازید، بک‌اند را به Gemini وصل کنید و سپس آن را به API متصل کنید. خواه توسعه‌دهنده، دانشمند داده یا فقط به هوش مصنوعی علاقه دارید، به Fikayo بپیوندید تا ببینید چگونه Gemini API می‌تواند زندگی را برای شما و کاربرانتان آسان‌تر کند.

سرفصل ها و درس ها

معرفی Introduction

  • زیرنویس تصویر با هوش مصنوعی Image captioning with AI

  • این دوره برای چه کسانی است Who this course is for

  • آنچه شما باید بدانید What you should know

1. راه اندازی دسترسی به Gemini API 1. Setting Up Access to Gemini API

  • ثبت نام برای یک حساب Google AI Studio Signing up for an Google AI Studio account

  • دریافت کلید API شما Getting your API key

  • قیمت گذاری جوزا Gemini pricing

  • آشنایی با مدل های جمینی Understanding Gemini models

2. ساخت رابط 2. Building the Interface

  • بررسی کد پروژه Project code walkthrough

  • افزودن عملکرد سریع Adding the prompt functionality

  • نوشتن کپشن نمایش Writing the caption display

  • شبیه سازی پروژه بذر Cloning the seed project

  • افزودن قابلیت آپلود تصویر Adding the image upload functionality

3. ساخت Backend: اتصال به Gemini 3. Building the Backend: Connecting to Gemini

  • ساخت API Express.js Building out the Express.js API

  • تنظیم قابلیت آپلود فایل Setting up file upload functionality

  • اضافه کردن مسیرها Adding routes

  • پیکربندی Generative AI SDK Configuring the Generative AI SDK

  • نوشتن درخواست و پاسخ فوری Writing the prompt request and response

4. همه را با هم جمع کنید 4. Bringing It All Together

  • اضافه کردن شاخص پیشرفت Adding a progress indicator

  • اتصال frontend به API Connecting the frontend to the API

  • استفاده از Web Speech API برای خواندن شرح‌ها Using the Web Speech API to read captions

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

Linkedin (لینکدین)

لینکدین: شبکه اجتماعی حرفه‌ای برای ارتباط و کارآفرینی

لینکدین به عنوان یکی از بزرگترین شبکه‌های اجتماعی حرفه‌ای، به میلیون‌ها افراد در سراسر جهان این امکان را می‌دهد تا ارتباط برقرار کنند، اطلاعات حرفه‌ای خود را به اشتراک بگذارند و فرصت‌های شغلی را کشف کنند. این شبکه اجتماعی به کاربران امکان می‌دهد تا رزومه حرفه‌ای خود را آپدیت کنند، با همکاران، دوستان و همکاران آینده ارتباط برقرار کنند، به انجمن‌ها و گروه‌های حرفه‌ای ملحق شوند و از مقالات و مطالب مرتبط با حوزه کاری خود بهره‌مند شوند.

لینکدین همچنین به کارفرمایان امکان می‌دهد تا به دنبال نیروهای با تجربه و مهارت مورد نیاز خود بگردند و ارتباط برقرار کنند. این شبکه حرفه‌ای به عنوان یک پلتفرم کلیدی برای بهبود دسترسی به فرصت‌های شغلی و گسترش شبکه حرفه‌ای خود، نقش مهمی را ایفا می‌کند. از این رو، لینکدین به عنوان یکی از مهمترین ابزارهای کارآفرینی و توسعه حرفه‌ای در دنیای امروز مورد توجه قرار دارد.

آموزش با Gemini یک ابزار زیرنویس تصویر برای کاربران کم بینا بسازید
جزییات دوره
1h 7m
21
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
455
- از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Fikayo Adepoju Fikayo Adepoju

سلام، من فیکایو هستم.