در این دوره، ما بر روی تکنیک های پیش پردازش برای یادگیری ماشین تمرکز می کنیم.
پیش پردازش مجموعه ای از دستکاری ها است که یک مجموعه داده خام را تبدیل می کند تا آن را توسط یک مدل یادگیری ماشین استفاده کند. برای مناسب ساختن داده های ما برای برخی از مدل های یادگیری ماشین، کاهش ابعاد، شناسایی بهتر داده های مربوطه و افزایش عملکرد مدل ضروری است. این مهم ترین بخش خط لوله یادگیری ماشین است و به شدت می تواند بر موفقیت یک پروژه تأثیر بگذارد. در واقع، اگر یک مدل یادگیری ماشینی را با دادههای شکلدهی صحیح تغذیه نکنیم، اصلاً کار نخواهد کرد.
گاهی اوقات، دانشمندان مشتاق داده شروع به مطالعه شبکه های عصبی و سایر مدل های پیچیده می کنند و فراموش می کنند که چگونه یک مجموعه داده را دستکاری کنند تا آن را توسط الگوریتم های خود مورد استفاده قرار دهند. بنابراین، آنها در ایجاد مدل های خوب شکست می خورند و فقط در پایان متوجه می شوند که پیش پردازش خوب باعث می شود تا زمان زیادی صرفه جویی کنند و عملکرد الگوریتم هایشان را افزایش دهند. بنابراین، دست زدن به تکنیک های پیش پردازش یک مهارت بسیار مهم است. به همین دلیل است که من یک دوره کامل ایجاد کرده ام که فقط بر پیش پردازش داده ها تمرکز دارد.
با این دوره، می خواهید یاد بگیرید:
پاکسازی داده ها
رمزگذاری متغیرهای طبقه بندی شده
تغییر ویژگی های عددی
اشیاء Pipeline و ColumnTransformer با یادگیری Scikit
مقیاسسازی ویژگیهای عددی
تجزیه و تحلیل مؤلفه اصلی
انتخاب ویژگی مبتنی بر فیلتر
نمونه برداری بیش از حد با استفاده از SMOTE
همه مثال ها با استفاده از زبان برنامه نویسی Python و کتابخانه قدرتمند Sicit-Learn آن ارائه خواهند شد. محیطی که مورد استفاده قرار خواهد گرفت Jupyter است که یک استاندارد در صنعت علم داده است. تمام بخشهای این دوره با چند تمرین عملی به پایان میرسد و دفترچههای Jupyter همگی قابل دانلود هستند.
نظری ارسال نشده است.
معلم داده شما نام من Gianluca Malato است، من ایتالیایی هستم و دارای مدرک کارشناسی ارشد در فیزیک نظری سیستم های بی نظم در "La Sapienza" رم هستم. من یک دانشمند داده هستم که سال ها در بخش بانکداری و بیمه کار کرده ام. من تجربه زیادی در برنامه نویسی نرم افزار و مدیریت پروژه دارم و چندین سال است که با تجزیه و تحلیل داده ها و یادگیری ماشین در محیط شرکت سر و کار دارم. من همچنین در تجزیه و تحلیل داده ها (مانند پایگاه های داده رابطه ای و زبان SQL)، الگوریتم های عددی (به عنوان مثال ادغام ODE، الگوریتم های بهینه سازی) و شبیه سازی (مانند تکنیک های مونت کارلو) مهارت دارم. من مقالات زیادی در مورد یادگیری ماشینی، R و Python نوشتهام و نویسنده برتر رسانه در رده هوش مصنوعی بودهام.
یودمی یکی از بزرگترین پلتفرمهای آموزشی آنلاین است که به میلیونها کاربر در سراسر جهان امکان دسترسی به دورههای متنوع و کاربردی را فراهم میکند. این پلتفرم امکان آموزش در زمینههای مختلف از فناوری اطلاعات و برنامهنویسی گرفته تا زبانهای خارجی، مدیریت، و هنر را به کاربران ارائه میدهد. با استفاده از یودمی، کاربران میتوانند به صورت انعطافپذیر و بهینه، مهارتهای جدیدی را یاد بگیرند و خود را برای بازار کار آماده کنند.
یکی از ویژگیهای برجسته یودمی، کیفیت بالای دورهها و حضور استادان مجرب و با تجربه در هر حوزه است. این امر به کاربران اعتماد میدهد که در حال دریافت آموزش از منابع قابل اعتماد و معتبر هستند و میتوانند به بهترین شکل ممکن از آموزشها بهره ببرند. به طور خلاصه، یودمی به عنوان یکی از معتبرترین و موثرترین پلتفرمهای آموزشی آنلاین، به افراد امکان میدهد تا به راحتی و با کیفیت، مهارتهای مورد نیاز خود را ارتقا دهند و به دنبال رشد و پیشرفت شغلی خود باشند.