لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش آمادهسازی دادههای چندوجهی: خط لولههای بینایی، صوتی و پردازش زبان طبیعی (NLP)
- آخرین آپدیت
دانلود Preparing Multimodal Data: Vision, Audio, and NLP Pipelines
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
تصاویر خام، کلیپهای صوتی و متون تنها زمانی ارزشمند هستند که به فرمتهایی تبدیل شوند که مدلهای هوش مصنوعی بتوانند از آنها استفاده کنند. این دوره سطح متوسط، شما را با مهارتهای عملی برای ساخت خط لولههای پردازش دادههای چندوجهی در سه نوع داده اصلی یعنی بصری، صوتی و زبانی آشنا کرده و روشهای ارزیابی مدلهای هوش مصنوعی آموزشدیده بر روی آنها را میآموزد.
شما یاد خواهید گرفت که دادههای تصویری را با استفاده از تکنیکهای نرمالسازی، تبدیل فضای رنگی و تصحیح کیفیت، پیشپردازش کرده و بهبود ببخشید. همچنین استخراج ویژگیهای حرکتی از ویدئو را با استفاده از جریان نوری (Optical Flow) و تفاضل فریمها خواهید آموخت. در بخش صوتی، استخراج ویژگیهای طیفی و کپسترال را به کار گرفته و خط لولههای افزونگی (Augmentation) برای بهبود استحکام مدل میسازید. برای زبان، مدلهای ترنسفورمر را روی مجموعهدادههای تخصصی تنظیم دقیق (Fine-tune) کرده و خط لولههای پیشپردازش متن سرتاسری را با استفاده از ابزارهای استاندارد صنعتی طراحی خواهید کرد.
این دوره که بر اساس وظایف شغلی واقعی در نقشهای یادگیری ماشین و هوش مصنوعی طراحی شده است، شما را آماده میکند تا دادههای خام و بدون ساختار را به ورودیهای آماده برای آموزش تبدیل کنید؛ مهارتی که در تیمهای هوش مصنوعی، بینایی ماشین، پردازش گفتار و NLP بسیار مورد تقاضاست.
سرفصل ها و درس ها
پیشپردازش و نرمالسازی تصاویر
Image Preprocessing and Normalization
تکنیکهای نرمالسازی و مبانی فضای رنگی
Normalization Techniques and Color-Space Fundamentals
تشخیص حرکت و جریان نوری
Motion Detection and Optical Flow
الگوریتمهای جریان نوری و ریاضیات تفاضل فریمها
Optical Flow Algorithms and Frame Differencing Mathematics
نمایش نظرات