با نحوه استفاده از Numpy و Pandas برای تجزیه و تحلیل داده ها آشنا شوید. این همه مفاهیم اولیه Numpy و Pandas را که در تجزیه و تحلیل داده ها مفید هستند، پوشش می دهد.
با استفاده از Matplotlib و Seaborn، تجسمهای تاثیرگذار ایجاد کنید. ایجاد تجسم های تاثیرگذار یک گام مهم در ایجاد درک بهتر در مورد داده های شما است.
این دوره تمام مراحل پیش پردازش داده مانند کار با مقادیر از دست رفته، رمزگذاری ویژگی و مقیاس بندی ویژگی را پوشش می دهد.
درباره مدلهای مختلف یادگیری ماشین مانند جنگل تصادفی، درختهای تصمیم، KNN، SVM، رگرسیون خطی، رگرسیون لجستیک و غیره بیاموزید... تمام جلسات ویدیویی ابتدا مفهوم تئوری اساسی در پشت این الگوریتمها را مورد بحث قرار میدهند و سپس به پیادهسازی عملی میپردازند.
با نحوه انتخاب بهترین پارامترهای فوق برای مدل یادگیری ماشین خود با استفاده از GridSearch CV آشنا شوید. انتخاب بهترین پارامترهای فوق یک گام مهم در افزایش دقت مدل یادگیری ماشین شما است.
شما یاد خواهید گرفت که یک خط لوله یادگیری ماشین کامل از جمع آوری داده ها تا پیش پردازش داده ها تا ساختمان مدل بسازید. خط لوله ML یک مفهوم مهم است که به طور گسترده در ساخت پروژه های ML در مقیاس بزرگ استفاده می شود.
این دوره دارای دو پروژه در پایان است که با استفاده از تمامی مفاهیم آموزش داده شده در این دوره ساخته خواهد شد. پروژه اول درباره پیشبینی دیابت با استفاده از الگوریتم یادگیری ماشینی طبقهبندی است و دومی درباره پیشبینی حق بیمه با استفاده از الگوریتم یادگیری ماشینی رگرسیون است.
مهندس علوم کامپیوتر با تخصص DataScience
نمایش نظرات