🔔 با توجه به بهبود نسبی اینترنت، آمادهسازی دورهها آغاز شده است. به دلیل تداوم برخی اختلالات، بارگذاری دورهها ممکن است با کمی تأخیر انجام شود. مدت اشتراکهای تهیهشده محفوظ است.
لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش پیش پردازش داده برای تجزیه و تحلیل داده ها و علم داده
- آخرین آپدیت
Data Pre-Processing for Data Analytics and Data Science
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
پیش پردازش برای تجزیه و تحلیل دادهها و دانشآموزان علوم داده دانش عمیقی در مورد تجزیه و تحلیل دادههای اکتشافی و پیش پردازش دادهها کسب خواهند کرد. ما در مورد نحوه رسیدگی به داده های تکراری و گمشده یاد خواهیم گرفت. در نهایت، ما انواع درمان تجزیه و تحلیل Outlier را یاد خواهیم گرفت. با تکنیکهای مقیاسبندی و تبدیل ویژگیها آشنا میشویم. پیش نیازها: شناخت نقش برنامهنویسی پایتون در EDA. روش های باقی مانده در بخش آماده سازی داده های CRISP-ML(Q) را درک کنید. توصیه می شود که فراگیران از روش CRISP-ML(Q) آگاهی قبلی داشته باشند.
دوره پیش پردازش داده ها برای تجزیه و تحلیل داده ها و علم داده، درک جامعی از مراحل حیاتی آماده سازی داده های خام برای تجزیه و تحلیل به دانش آموزان ارائه می دهد. پیش پردازش داده یک مرحله اساسی در گردش کار علم داده است، زیرا شامل تبدیل، تمیز کردن و یکپارچه سازی داده ها برای اطمینان از کیفیت و قابلیت استفاده برای تجزیه و تحلیل بعدی است.
در طول این دوره، دانشآموزان تکنیکها و استراتژیهای مختلفی را برای مدیریت دادههای دنیای واقعی، که اغلب آشفته، ناسازگار و ناقص هستند، یاد میگیرند. آنها تجربه عملی را با ابزارها و کتابخانه های محبوبی که برای پیش پردازش داده ها استفاده می شوند، مانند پایتون و کتابخانه های دستکاری داده های آن (مانند پانداها) به دست خواهند آورد و نمونه های عملی را برای تقویت یادگیری خود کاوش خواهند کرد.
موضوعات کلیدی تحت پوشش این دوره عبارتند از:
مقدمه ای بر پیش پردازش داده ها:
- درک اهمیت پیش پردازش داده ها در تجزیه و تحلیل داده ها و علم داده
- نمای کلی خط لوله پیش پردازش داده
- تکنیک های پاکسازی داده ها:
شناسایی و مدیریت مقادیر از دست رفته:
- برخورد با داده های پرت و پر سر و صدا
- رفع ناسازگاری ها و خطاها در داده ها
- تبدیل داده:
مقیاسسازی و عادیسازی ویژگی:
- مدیریت متغیرهای طبقه بندی شده از طریق تکنیک های رمزگذاری
- روشهای کاهش ابعاد (به عنوان مثال، تجزیه و تحلیل مؤلفه اصلی)
نمایش نظرات