آموزش تشخیص بلندگو | توسط نویسنده کتاب درسی برنده جایزه

Speaker Recognition | By Award Winning Textbook Author

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: پردازش صدا، استخراج ویژگی، تشخیص بلندگو، یادگیری ماشین و شبکه‌های عصبی با مثال‌های کدگذاری مفاهیم اساسی و الگوریتم‌های اصلی در تشخیص بلندگو پردازش صوتی و آکوستیک اصول یادگیری ماشینی و یادگیری عمیق اصول برنامه‌نویسی تمرین و جعبه ابزار برای صدا و گفتار Python و PyTorch برای یادگیری ماشین ساخت سیستم تشخیص بلندگو از ابتدا پیش نیازها:ریاضیات سطح دانشگاهی تجربه با یادگیری ماشینی یا کدنویسی امتیاز محسوب می شود.

این دوره مقدمه ای بر تکنیک های تشخیص سخنران است.


تشخیص بلندگو در تقاطع پردازش صدا، بیومتریک و یادگیری ماشین قرار دارد و کاربردهای مختلفی دارد. می‌توانید برنامه تشخیص بلندگو را در تلفن‌های هوشمند، دستگاه‌های خانه هوشمند و خدمات تجاری مختلف پیدا کنید.


در این دوره، ما با مقدمه‌ای بر تاریخچه تکنیک‌های تشخیص سخنران شروع می‌کنیم تا ببینیم چگونه از تلاش‌های ساده انسانی به سیستم‌های هوشمند مبتنی بر یادگیری عمیق مدرن تکامل یافته است.


ما اصول آکوستیک، ادراک، پردازش صدا، پردازش سیگنال و استخراج ویژگی را پوشش می‌دهیم، بنابراین نیازی به پیش‌زمینه در این حوزه‌ها ندارید. همچنین مقدمه ای از رویکردهای یادگیری ماشینی محبوب، مانند مدل های مخلوط گاوسی، ماشین های بردار پشتیبان، تحلیل عاملی و شبکه های عصبی خواهیم داشت.


ما بر روی نحوه ساخت سیستم‌های تشخیص بلندگو بر اساس ویژگی‌های صوتی و مدل‌های یادگیری ماشین، با تأکید بر تشخیص مدرن بلندگو با یادگیری عمیق تمرکز خواهیم کرد، مانند گزینه‌های مختلف برای منطق استنتاج، عملکرد از دست دادن و توپولوژی‌های شبکه عصبی.


ما همچنین در مورد تکنیک‌های پردازش داده‌ها مانند پاکسازی داده‌ها، افزایش داده‌ها و ترکیب داده‌ها صحبت خواهیم کرد.


تعداد زیادی از تمرین‌ها و مثال‌های کدنویسی را برای شما قرار داده‌ایم تا واقعاً بر موضوعات معرفی‌شده در این دوره تسلط پیدا کنید، و یک پروژه نهایی برای راهنمایی شما در ساختن سیستم تشخیص بلندگوی خود از ابتدا.


اگر شما یک دانشجوی کالج علاقه مند به هوش مصنوعی یا پردازش سیگنال هستید، یا یک مهندس نرم افزار، معمار سیستم یا مدیر محصول هستید که با فناوری های مرتبط کار می کند، پس این دوره قطعا برای شما مناسب است!


سرفصل ها و درس ها

معرفی این دوره Introduction to this course

  • آیا باید در این دوره شرکت کنم؟ Should I take this course?

  • نتیجه مورد انتظار از این دوره Expected outcome from this course

  • در مورد این دوره About this course

  • چگونه برنده خود را از این دوره به حداکثر برسانید How to max your win from this course

  • برد خود را از این دوره به حداکثر برسانید Max your win from this course

  • سرفصل دروس Syllabus

تاریخچه تکنیک های هویت صوتی The History of Voice Identity Techniques

  • هویت صوتی چیست؟ What is voice identity

  • اولین تکنیک های شناسه صدا The earliest voice-id techniques

  • مفاهیم هویت صوتی و سیستم های اولیه Voice identity concepts and earliest systems

  • با نرم افزار Audacity شروع کنید Get started with the Audacity software

  • توسعه تکنیک های شناسه صدا The development of voice-id techniques

  • عصر جدید تکنیک های شناسه صدا The new age of voice-id techniques

  • توسعه و عصر جدید تکنیک های شناسه صوتی Development and new age of voice-id techniques

  • طوفان فکری در مورد کاربردهای تشخیص سخنران Brainstorm about applications of speaker recognition

اصول پردازش صدا Fundamental of Audio Processing

  • صدا و آکوستیک Audio and acoustics

  • صدا و آکوستیک Audio and acoustics

  • شنوایی و ادراک 1 Hearing and perception 1

  • شنوایی و ادراک 2 Hearing and perception 2

  • ترازو مل Mel scale

  • شنوایی و ادراک Hearing and perception

  • پردازش سیگنال صوتی Audio signal processing

  • کدگذاری و فرمت های صوتی Audio coding and formats

  • سیگنال های صوتی Audio signals

  • یک فایل WAV را تجزیه کنید Parse a WAV file

  • تبدیل فایل SPHERE به WAV Convert SPHERE file to WAV

  • آموزش استفاده از SoX Learning to use SoX

  • تبدیل فایل MP4 به FLAC Convert MP4 file to FLAC

استخراج ویژگی صوتی Acoustic Feature Extraction

  • تحلیل کوتاه مدت Short-time analysis

  • ویژگی های حوزه زمان Time domain features

  • تجزیه و تحلیل کوتاه مدت و ویژگی های حوزه زمانی Short-time analysis and time domain features

  • نرخ متقاطع صفر Zero cross rate

  • ویژگی های دامنه فرکانس Frequency domain features

  • تبدیل فوریه گسسته Discrete Fourier Transform

  • ویژگی های رایج Commonly used features

  • ویژگی های آکوستیک Acoustic features

  • ویژگی های MFCC یک ویدیوی YouTube را تجسم کنید Visualize MFCC features of a YouTube video

مبانی تشخیص گوینده Fundamentals of Speaker Recognition

  • مقدمه ای برای تشخیص بلندگو 1 Intro to speaker recognition 1

  • مقدمه ای برای تشخیص بلندگو 2 Intro to speaker recognition 2

  • مقدمه ای برای تشخیص بلندگو Intro to speaker recognition

  • گردش کار سیستم تشخیص بلندگو System workflow of speaker recognition

  • امتیاز شباهت Similarity scoring

  • شباهت کسینوس در پایتون Cosine similarity in Python

  • گردش کار سیستم و امتیازدهی مشابه System workflow and similarity scoring

  • ارزیابی و معیارها 1 Evaluation and metrics 1

  • ارزیابی و معیارها 2 Evaluation and metrics 2

  • نرخ خطای برابر (EER) در پایتون Equal error rate (EER) in Python

  • نرمال سازی امتیاز Score normalization

  • معیارهای ارزیابی و نرمال سازی امتیازات Evaluation metrics and score normalization

  • T-norm در پایتون T-norm in Python

رویکردهای تشخیص زودهنگام سخنران Early Speaker Recognition Approaches

  • مدل های مخلوط گاوسی 1 Gaussian mixture models 1

  • مدل های مخلوط گاوسی 2 Gaussian mixture models 2

  • مدل های مخلوط گاوسی Gaussian mixture models

  • مدل های مخلوط گاوسی 3 Gaussian mixture models 3

  • یک GMM را برای داده ها تنظیم کنید Fit a GMM to data

  • مدل پس زمینه جهانی Universal background model

  • ماشین های بردار پشتیبانی 1 Support vector machines 1

  • ماشین های بردار پشتیبانی 2 Support vector machines 2

  • GMM-UBM و GMM-SVM GMM-UBM and GMM-SVM

  • تحلیل عاملی Factor analysis

  • تحلیل عاملی مشترک Joint factor analysis

  • i-وکتور i-vector

  • تحلیل عاملی، JFA و i-vector Factor analysis, JFA, and i-vector

اصول یادگیری عمیق Deep Learning Basics

  • مقدمه ای بر یادگیری عمیق 1 Intro to deep learning 1

  • مقدمه ای بر یادگیری عمیق 2 Intro to deep learning 2

  • مقدمه ای بر یادگیری عمیق Intro to deep learning

  • شبکه های عصبی پیشخور Feed-forward neural networks

  • شبکه های عصبی کانولوشنال Convolutional neural networks

  • فید فوروارد و CNN Feed-forward and CNN

  • پیچیدگی های یک بعدی 1-dimensional convolutions

  • شبکه های عصبی مکرر Recurrent neural networks

  • RNN RNN

  • توجه و ترانسفورماتور Attention and transformer

  • توجه Attention

  • یادگیری عمیق با PyTorch Deep learning with PyTorch

  • طبقه بندی توالی با PyTorch Sequence classification with PyTorch

تشخیص بلندگو با یادگیری عمیق Speaker Recognition with Deep Learning

  • استفاده غیر مستقیم از شبکه های عصبی Indirect use of neural networks

  • استفاده مستقیم از شبکه های عصبی Direct use of neural networks

  • استفاده غیرمستقیم و مستقیم از شبکه های عصبی Indirect and direct use of neural networks

  • استنباط 1 Inference 1

  • استنباط 2 Inference 2

  • استنتاج Inference

  • عملکرد از دست دادن 1 Loss function 1

  • تابع سافت مکس Softmax function

  • از دست دادن آنتروپی متقاطع Cross entropy loss

  • عملکرد از دست دادن 2 Loss function 2

  • از دست دادن سه قلو Triplet loss

  • عملکرد از دست دادن 3 Loss function 3

  • عملکرد از دست دادن Loss function

پردازش داده در تشخیص بلندگو Data Processing in Speaker Recognition

  • نیاز به داده Data requirement

  • نیاز به داده Data requirement

  • پیش پردازش داده ها Data preprocessing

  • پیش پردازش داده ها Data preprocessing

  • افزایش داده ها 1 Data augmentation 1

  • افزایش داده ها 2 Data augmentation 2

  • افزایش داده ها 3 Data augmentation 3

  • افزایش داده ها Data augmentation

  • افزایش داده ها با پایتون Data augmentation with Python

  • همجوشی داده ها Data fusion

  • مجموعه داده های رایج Common datasets

  • لیست آزمایشی ارزیابی Evaluation trial list

پروژه نهایی Final Project

  • یک سیستم تشخیص بلندگو از ابتدا بسازید Build a speaker recognition system from scratch

  • کد پروژه الگو توضیح داده شده است Template project code explained

  • موازی سازی Parallelism

  • هر مجموعه داده را با CSV نشان دهید Represent any dataset with CSV

  • بعدش چی؟ What's next?

نمایش نظرات

Udemy (یودمی)

یودمی یکی از بزرگ‌ترین پلتفرم‌های آموزشی آنلاین است که به میلیون‌ها کاربر در سراسر جهان امکان دسترسی به دوره‌های متنوع و کاربردی را فراهم می‌کند. این پلتفرم امکان آموزش در زمینه‌های مختلف از فناوری اطلاعات و برنامه‌نویسی گرفته تا زبان‌های خارجی، مدیریت، و هنر را به کاربران ارائه می‌دهد. با استفاده از یودمی، کاربران می‌توانند به صورت انعطاف‌پذیر و بهینه، مهارت‌های جدیدی را یاد بگیرند و خود را برای بازار کار آماده کنند.

یکی از ویژگی‌های برجسته یودمی، کیفیت بالای دوره‌ها و حضور استادان مجرب و با تجربه در هر حوزه است. این امر به کاربران اعتماد می‌دهد که در حال دریافت آموزش از منابع قابل اعتماد و معتبر هستند و می‌توانند به بهترین شکل ممکن از آموزش‌ها بهره ببرند. به طور خلاصه، یودمی به عنوان یکی از معتبرترین و موثرترین پلتفرم‌های آموزشی آنلاین، به افراد امکان می‌دهد تا به راحتی و با کیفیت، مهارت‌های مورد نیاز خود را ارتقا دهند و به دنبال رشد و پیشرفت شغلی خود باشند.

آموزش تشخیص بلندگو | توسط نویسنده کتاب درسی برنده جایزه
جزییات دوره
8 hours
60
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
952
4.7 از 5
دارد
دارد
دارد
Quan Wang
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Quan Wang Quan Wang

کارشناس گفتار در گوگل