دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش ساخت مدل تشخیص گفتار (Speech Recognition) - آخرین آپدیت

دانلود Build a Speech Recognition Model

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره: امروزه توسعه‌دهندگان و تیم‌های فنی بیش از پیش به ادغام قابلیت تشخیص گفتار در اپلیکیشن‌های خود نیاز دارند. در دوره «ساخت مدل تشخیص گفتار»، شما توانایی توسعه یک سیستم کامل و جامع (End-to-End) برای تبدیل صوت به متن دقیق را کسب خواهید کرد. در ابتدا، نحوه جمع‌آوری، پیش‌پردازش و پاک‌سازی داده‌های صوتی را بررسی می‌کنید و تکنیک‌هایی مانند نرمال‌سازی، کاهش نویز و قطعه‌بندی ضبط‌ها را برای آماده‌سازی ورودی‌های باکیفیت یاد می‌گیرید. سپس، نحوه استخراج ویژگی‌های معنادار از صوت خام و ساختاربندی مجموعه‌داده‌ها برای آموزش مدل‌های یادگیری عمیق را خواهید آموخت. در نهایت، روش‌های آموزش، رمزگشایی (Decoding) و ارزیابی یک مدل سفارشی تبدیل گفتار به متن را با استفاده از معماری‌های مدرن فرا می‌گیرید. پس از اتمام این دوره، شما مهارت و دانش لازم برای ساخت مدل‌های تشخیص گفتار و تصمیم‌گیری آگاهانه در مورد پیاده‌سازی فناوری‌های صوتی مبتنی بر یادگیری عمیق در کاربردهای واقعی را خواهید داشت.

سرفصل ها و درس ها

آماده‌سازی و نمایش داده‌های صوتی Preparing and Representing Audio Data

مقدمه‌ای بر داده‌های صوتی برای ASR Introduction to Audio Data for ASR
جمع‌آوری و پیش‌پردازش صوت Collecting and Preprocessing Audio
استخراج ویژگی: اسپکتروگرام‌ها و MFCCها Feature Extraction: Spectrograms and MFCCs

آموزش مدل یادگیری عمیق ASR Training a Deep Learning ASR Model

ساخت مدل آکوستیک Building an Acoustic Model
استفاده از SpeechBrain برای مدل‌سازی Using SpeechBrain for Modeling
رمزگشایی توالی‌ها با CTC و Attention Decoding Sequences with CTC and Attention
ارزیابی عملکرد مدل Evaluating Model Performance

بهینه‌سازی و بنچ‌مارک مدل‌های ASR Optimizing and Benchmarking ASR Models

تنظیم دقیق و بهینه‌سازی هایپرپارامترها Fine-tuning and Hyperparameter Optimization
مقایسه عملکرد (بنچ‌مارک) با Whisper Benchmarking Against Whisper
ادغام مدل‌ها در خط لوله‌های استنتاج Integrating Models into Inference Pipelines

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش ساخت مدل تشخیص گفتار (Speech Recognition)

جزییات دوره

زمان دوره: 1h 14m

تعداد ویدیو ها: 10

شرکت: Pluralsight (پلورال سایت)

تاریخ انتشار مرجع: (آخرین آپدیت)

بازدید مرجع : 2

امتیاز مرجع: از 5

فایل تمرین: دارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Anthony Alampi

لینک کوتاه این دوره

https://donyad.com/d/c59f88

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Anthony Alampi

من آنتونی آلامپی هستم ، یک طراح و توسعه دهنده تعاملی ساکن آستین ، تگزاس. من یک توسعه دهنده حرفه ای بازی های ویدیویی و صاحب فعلی شرکت طراحی وب با بیش از 15 سال تجربه برنامه نویسی و بیش از 7 سال تجربه طراحی هستم. طراحی کاربر محور علاقه من است و معتقدم وقتی کاربران در اولویت قرار می گیرند ، دوباره برمی گردند! نمونه کارهای شخصی من را می توانید در این آدرس مشاهده کنید: https://www.anthonyalampi.com/درباره شرکت من: مشاوران X Factor یک شرکت طراحی دیجیتال است که در Round Rock ، تگزاس مستقر است. ما در ایجاد وب سایت های تمیز ، کاربر پسند و آرم های چشم نواز ، رسانه های دیجیتال و سایر مواد بازاریابی برای طیف گسترده ای از صنایع تخصص داریم. ما همچنین خدمات اصلی نوشتن محتوای UX دوستانه را برای رسانه های تعاملی و همچنین پشتیبانی وب مستر پس از راه اندازی مشتری آنلاین خود را ارائه می دهیم. درباره کارهایی که X Factor می تواند برای سازمان شما انجام دهد بیشتر بدانید: https://www.xfactorconsultants.com/

بازاریابی

دیگر

علوم داده

هوش مصنوعی

آموزش ساخت مدل تشخیص گفتار (Speech Recognition) - آخرین آپدیت

دانلود Build a Speech Recognition Model

آماده‌سازی و نمایش داده‌های صوتی Preparing and Representing Audio Data

مقدمه‌ای بر داده‌های صوتی برای ASR Introduction to Audio Data for ASR

جمع‌آوری و پیش‌پردازش صوت Collecting and Preprocessing Audio

استخراج ویژگی: اسپکتروگرام‌ها و MFCCها Feature Extraction: Spectrograms and MFCCs

آموزش مدل یادگیری عمیق ASR Training a Deep Learning ASR Model

ساخت مدل آکوستیک Building an Acoustic Model

استفاده از SpeechBrain برای مدل‌سازی Using SpeechBrain for Modeling

رمزگشایی توالی‌ها با CTC و Attention Decoding Sequences with CTC and Attention

ارزیابی عملکرد مدل Evaluating Model Performance