آموزش ساخت مدل تشخیص گفتار (Speech Recognition) - آخرین آپدیت

دانلود Build a Speech Recognition Model

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: امروزه توسعه‌دهندگان و تیم‌های فنی بیش از پیش به ادغام قابلیت تشخیص گفتار در اپلیکیشن‌های خود نیاز دارند. در دوره «ساخت مدل تشخیص گفتار»، شما توانایی توسعه یک سیستم کامل و جامع (End-to-End) برای تبدیل صوت به متن دقیق را کسب خواهید کرد. در ابتدا، نحوه جمع‌آوری، پیش‌پردازش و پاک‌سازی داده‌های صوتی را بررسی می‌کنید و تکنیک‌هایی مانند نرمال‌سازی، کاهش نویز و قطعه‌بندی ضبط‌ها را برای آماده‌سازی ورودی‌های باکیفیت یاد می‌گیرید. سپس، نحوه استخراج ویژگی‌های معنادار از صوت خام و ساختاربندی مجموعه‌داده‌ها برای آموزش مدل‌های یادگیری عمیق را خواهید آموخت. در نهایت، روش‌های آموزش، رمزگشایی (Decoding) و ارزیابی یک مدل سفارشی تبدیل گفتار به متن را با استفاده از معماری‌های مدرن فرا می‌گیرید. پس از اتمام این دوره، شما مهارت و دانش لازم برای ساخت مدل‌های تشخیص گفتار و تصمیم‌گیری آگاهانه در مورد پیاده‌سازی فناوری‌های صوتی مبتنی بر یادگیری عمیق در کاربردهای واقعی را خواهید داشت.

سرفصل ها و درس ها

آماده‌سازی و نمایش داده‌های صوتی Preparing and Representing Audio Data

  • مقدمه‌ای بر داده‌های صوتی برای ASR Introduction to Audio Data for ASR

  • جمع‌آوری و پیش‌پردازش صوت Collecting and Preprocessing Audio

  • استخراج ویژگی: اسپکتروگرام‌ها و MFCCها Feature Extraction: Spectrograms and MFCCs

آموزش مدل یادگیری عمیق ASR Training a Deep Learning ASR Model

  • ساخت مدل آکوستیک Building an Acoustic Model

  • استفاده از SpeechBrain برای مدل‌سازی Using SpeechBrain for Modeling

  • رمزگشایی توالی‌ها با CTC و Attention Decoding Sequences with CTC and Attention

  • ارزیابی عملکرد مدل Evaluating Model Performance

بهینه‌سازی و بنچ‌مارک مدل‌های ASR Optimizing and Benchmarking ASR Models

  • تنظیم دقیق و بهینه‌سازی هایپرپارامترها Fine-tuning and Hyperparameter Optimization

  • مقایسه عملکرد (بنچ‌مارک) با Whisper Benchmarking Against Whisper

  • ادغام مدل‌ها در خط لوله‌های استنتاج Integrating Models into Inference Pipelines

نمایش نظرات

آموزش ساخت مدل تشخیص گفتار (Speech Recognition)
جزییات دوره
1h 14m
10
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
2
از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Anthony Alampi Anthony Alampi

من آنتونی آلامپی هستم ، یک طراح و توسعه دهنده تعاملی ساکن آستین ، تگزاس. من یک توسعه دهنده حرفه ای بازی های ویدیویی و صاحب فعلی شرکت طراحی وب با بیش از 15 سال تجربه برنامه نویسی و بیش از 7 سال تجربه طراحی هستم. طراحی کاربر محور علاقه من است و معتقدم وقتی کاربران در اولویت قرار می گیرند ، دوباره برمی گردند! نمونه کارهای شخصی من را می توانید در این آدرس مشاهده کنید: https://www.anthonyalampi.com/درباره شرکت من: مشاوران X Factor یک شرکت طراحی دیجیتال است که در Round Rock ، تگزاس مستقر است. ما در ایجاد وب سایت های تمیز ، کاربر پسند و آرم های چشم نواز ، رسانه های دیجیتال و سایر مواد بازاریابی برای طیف گسترده ای از صنایع تخصص داریم. ما همچنین خدمات اصلی نوشتن محتوای UX دوستانه را برای رسانه های تعاملی و همچنین پشتیبانی وب مستر پس از راه اندازی مشتری آنلاین خود را ارائه می دهیم. درباره کارهایی که X Factor می تواند برای سازمان شما انجام دهد بیشتر بدانید: https://www.xfactorconsultants.com/