همه تصمیمات ما بر اساس داده ها است. اندامهای حسی ما دادهها را جمعآوری میکنند، خاطرات ما دادهها هستند و غریزههای درونی ما دادهها هستند. اگر میخواهید تصمیمهای خوبی بگیرید، باید دادههایی با کیفیت بالا داشته باشید.
این دوره در مورد کیفیت داده است: معنی آن چیست، چرا مهم است و چگونه می توانید کیفیت داده های خود را افزایش دهید.
در این دوره، یاد خواهید گرفت:
استراتژیهای سطح بالا برای اطمینان از کیفیت بالای دادهها، از جمله اصطلاحات، مستندسازی دادهها و مدیریت، و مراحل مختلف تحقیقاتی که در آن میتوانید کیفیت دادهها را بررسی و افزایش دهید.
روشهای کمی و کیفی برای ارزیابی کیفیت دادهها، از جمله بازرسی بصری، نرخ خطا، و مقادیر پرت. کد پایتون برای مشاهده نحوه پیادهسازی این تجسمها و روشهای امتیازدهی با استفاده از pandas، numpy، seaborn و matplotlib ارائه شده است.
روشها و الگوریتمهای داده خاص برای پاک کردن دادهها و رد دادههای بد یا غیرعادی. همانطور که در بالا ذکر شد، کد پایتون برای مشاهده نحوه پیاده سازی این رویه ها با استفاده از pandas، numpy، seaborn و matplotlib ارائه شده است.
این دوره برای
استمتخصصان داده که میخواهند هم استراتژیهای سطح بالا و هم رویههای سطح پایین برای ارزیابی و بهبود کیفیت داده را درک کنند.
مدیران، مشتریان و همکارانی که میخواهند اهمیت کیفیت داده را درک کنند، حتی اگر مستقیماً با دادهها کار نکنند.
من دانشیار علوم اعصاب در دانشگاه رادبود (هلند) هستم. آزمایشگاه تحقیقاتی من از روش های علوم اعصاب پیشرفته برای اندازه گیری فعالیت الکتریکی مغز استفاده می کند و ما برای درک همه داده ها از روش های پیشرفته پردازش سیگنال چند متغیره و روش یادگیری ماشین یادگیری استفاده می کنیم! من چندین کتاب درسی درباره برنامه نویسی علمی در MATLAB ، پردازش سیگنال و آمار نوشته ام. من همچنین معتقد به اهمیت ادامه تحصیل در سطح حرفه ای هستم. تمرکز آموزش Pluralsight من تجزیه و تحلیل داده های عملی در MATLAB است. آموزش مباحث فنی می تواند یک چالش برای دوره های آنلاین باشد که تعاملات رو در رو در زمان واقعی ندارند. من تمام تلاشم را می کنم تا تعادل درستی بین درک و دقت ریاضی و بین تئوری و اجرا پیدا کنم. امیدوارم موافقت کنید و مشتاقانه منتظر دیدن شما در کلاس هستم!
نمایش نظرات