آموزش ساخت مدل تشخیص گفتار (Speech Recognition) - آخرین آپدیت

دانلود Build a Speech Recognition Model

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: امروزه توسعه‌دهندگان و تیم‌های فنی بیش از پیش به ادغام قابلیت تشخیص گفتار در اپلیکیشن‌های خود نیاز دارند. در دوره «ساخت مدل تشخیص گفتار»، شما توانایی توسعه یک سیستم کامل و جامع (End-to-End) برای تبدیل صوت به متن دقیق را کسب خواهید کرد. در ابتدا، نحوه جمع‌آوری، پیش‌پردازش و پاک‌سازی داده‌های صوتی را بررسی می‌کنید و تکنیک‌هایی مانند نرمال‌سازی، کاهش نویز و قطعه‌بندی ضبط‌ها را برای آماده‌سازی ورودی‌های باکیفیت یاد می‌گیرید. سپس، نحوه استخراج ویژگی‌های معنادار از صوت خام و ساختاربندی مجموعه‌داده‌ها برای آموزش مدل‌های یادگیری عمیق را خواهید آموخت. در نهایت، روش‌های آموزش، رمزگشایی (Decoding) و ارزیابی یک مدل سفارشی تبدیل گفتار به متن را با استفاده از معماری‌های مدرن فرا می‌گیرید. پس از اتمام این دوره، شما مهارت و دانش لازم برای ساخت مدل‌های تشخیص گفتار و تصمیم‌گیری آگاهانه در مورد پیاده‌سازی فناوری‌های صوتی مبتنی بر یادگیری عمیق در کاربردهای واقعی را خواهید داشت.

سرفصل ها و درس ها

آماده‌سازی و نمایش داده‌های صوتی Preparing and Representing Audio Data

  • مقدمه‌ای بر داده‌های صوتی برای ASR Introduction to Audio Data for ASR

  • جمع‌آوری و پیش‌پردازش صوت Collecting and Preprocessing Audio

  • استخراج ویژگی: اسپکتروگرام‌ها و MFCCها Feature Extraction: Spectrograms and MFCCs

آموزش مدل یادگیری عمیق ASR Training a Deep Learning ASR Model

  • ساخت مدل آکوستیک Building an Acoustic Model

  • استفاده از SpeechBrain برای مدل‌سازی Using SpeechBrain for Modeling

  • رمزگشایی توالی‌ها با CTC و Attention Decoding Sequences with CTC and Attention

  • ارزیابی عملکرد مدل Evaluating Model Performance

بهینه‌سازی و بنچ‌مارک مدل‌های ASR Optimizing and Benchmarking ASR Models

  • تنظیم دقیق و بهینه‌سازی هایپرپارامترها Fine-tuning and Hyperparameter Optimization

  • مقایسه عملکرد (بنچ‌مارک) با Whisper Benchmarking Against Whisper

  • ادغام مدل‌ها در خط لوله‌های استنتاج Integrating Models into Inference Pipelines

نمایش نظرات

آموزش ساخت مدل تشخیص گفتار (Speech Recognition)
جزییات دوره
1h 14m
10
(آخرین آپدیت)
2
از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Anthony Alampi Anthony Alampi

من آنتونی آلامپی هستم ، یک طراح و توسعه دهنده تعاملی ساکن آستین ، تگزاس. من یک توسعه دهنده حرفه ای بازی های ویدیویی و صاحب فعلی شرکت طراحی وب با بیش از 15 سال تجربه برنامه نویسی و بیش از 7 سال تجربه طراحی هستم. طراحی کاربر محور علاقه من است و معتقدم وقتی کاربران در اولویت قرار می گیرند ، دوباره برمی گردند! نمونه کارهای شخصی من را می توانید در این آدرس مشاهده کنید: https://www.anthonyalampi.com/درباره شرکت من: مشاوران X Factor یک شرکت طراحی دیجیتال است که در Round Rock ، تگزاس مستقر است. ما در ایجاد وب سایت های تمیز ، کاربر پسند و آرم های چشم نواز ، رسانه های دیجیتال و سایر مواد بازاریابی برای طیف گسترده ای از صنایع تخصص داریم. ما همچنین خدمات اصلی نوشتن محتوای UX دوستانه را برای رسانه های تعاملی و همچنین پشتیبانی وب مستر پس از راه اندازی مشتری آنلاین خود را ارائه می دهیم. درباره کارهایی که X Factor می تواند برای سازمان شما انجام دهد بیشتر بدانید: https://www.xfactorconsultants.com/