به مهندسی ویژگی برای پیشبینی سریهای زمانی، جامعترین دوره آموزشی مهندسی ویژگی برای پیشبینی که بهصورت آنلاین در دسترس است، خوش آمدید. در این دوره آموزشی، نحوه ایجاد و استخراج ویژگی ها از داده های سری زمانی برای استفاده در پیش بینی را خواهید آموخت.
به هنر مهندسی ویژگی برای پیشبینی سریهای زمانی مسلط شوید
در این دوره، روشهای مهندسی ویژگیهای متعددی را برای استخراج و ایجاد ویژگیهایی از دادههای سری زمانی که برای پیشبینی با مدلهای رگرسیون خارج از صفحه مانند رگرسیون خطی، جنگلهای تصادفی، و ماشینهای تقویتشده گرادیان مناسب هستند، یاد خواهید گرفت./p>
به طور خاص، یاد خواهید گرفت:
نحوه ایجاد ویژگیهای تاخیر؛
نحوه ایجاد ویژگی های پنجره؛
نحوه ایجاد ویژگی هایی که فصلی و روندها را به تصویر می کشد؛
نحوه تجزیه سری های زمانی با چند فصلی؛
نحوه استخراج ویژگی ها از تاریخ و زمان؛
نحوه نسبت دادن داده های از دست رفته در سری های زمانی؛
نحوه رمزگذاری متغیرهای طبقه بندی شده در سری های زمانی؛
نحوه شناسایی و حذف نقاط پرت در سری های زمانی؛
نحوه جلوگیری از نشت داده ها و سوگیری آینده نگری در ایجاد ویژگی های پیش بینی؛
نحوه تبدیل ویژگیها و موارد دیگر.
چالش های مهندسی ویژگی در پیش بینی
پیشبینی فرآیند پیشبینی آینده بر اساس دادههای گذشته است. در سنتی ترین سناریو، ما یک سری زمانی داریم و می خواهیم مقادیر آینده آن را پیش بینی کنیم. در ایجاد ویژگی های پیش بینی چالش هایی وجود دارد:
ما باید دادههای سری زمانی را با مجموعهای از ویژگیها و متغیر هدف به خوبی طراحی شده به دادههای جدولی تبدیل کنیم؛
هنگام ایجاد ویژگیهای پیشبینی، باید مراقب باشیم تا از نشت دادهها از طریق سوگیری نگاه به آینده جلوگیری کنیم؛
داده های سری زمانی، همانطور که انتظار می رود، در طول زمان تغییر می کند. ما باید این را در هنگام ساختن ویژگی های پیش بینی در نظر بگیریم؛
پیشبینی مقدار هدف چند مرحلهای در آینده، مستلزم این است که به دقت در مورد چگونگی تعمیم ویژگیهای خود از گذشته به آینده فکر کنیم.
ما میتوانیم مقادیر آینده سریهای زمانی را با استفاده از مدلهای رگرسیون خارج از قفسه مانند رگرسیون خطی، مدلهای مبتنی بر درخت، ماشینهای بردار پشتیبان و غیره پیشبینی کنیم. با این حال، این مدل ها به داده های جدولی به عنوان ورودی نیاز دارند. برای پیشبینی، ما با جدولی از ویژگیها و یک متغیر هدف شروع نمیکنیم، بلکه مجموعهای از سریهای زمانی، شاید فقط یک مورد را شروع میکنیم. ما باید سری های زمانی را به داده های جدولی با یک متغیر هدف و مجموعه ای از ویژگی ها تبدیل کنیم که می تواند توسط مدل های یادگیری نظارت شده استفاده شود. بنابراین، چالش اصلی در مورد ایجاد یک متغیر هدف با طراحی خوب و ویژگیهایی با طراحی خاص است که به ما امکان میدهد ارزش آینده یک سری زمانی را پیشبینی کنیم.
ایجاد متغیر و ویژگی های هدف برای پیش بینی سری های زمانی مشکلات خاص خود را دارد. یک نگرانی عمده نوعی نشت داده است که به عنوان سوگیری نگاه به آینده شناخته می شود. اینجاست که شما به طور تصادفی از اطلاعاتی استفاده می کنید که فقط در آینده شناخته می شوند، نه در زمان پیش بینی، برای پیش بینی. این می تواند به شما این توهم را بدهد که یک مدل پیش بینی عالی دارید، با این حال، در عمل آن را اجرا نمی کند. معرفی سوگیری نگاه به آینده در طول مهندسی ویژگی بسیار آسان است و ما نشان می دهیم که چگونه می توانید از آن اجتناب کنید.
دادههای سری زمانی در طول زمان تغییر میکنند، یعنی دادههای آینده ممکن است همان توزیع و الگوهایی را داشته باشند که در دادههای گذشته داریم، این با فرضیاتی که در مورد دادههای جدولی سنتی ایجاد میشود متفاوت است. این تغییر در توزیع و الگوها در طول زمان را غیر ایستایی می گویند. در داده های سری زمانی، حضور ساده روند و فصلی می تواند باعث عدم ایستایی شود. بنابراین، ایجاد ویژگی هایی که این پویایی را به تصویر می کشد، یک چالش در پیش بینی سری های زمانی است.
ما اغلب می خواهیم چندین مرحله زمانی را در آینده پیش بینی کنیم. راه های متعددی برای انجام این کار وجود دارد، مانند 1) استفاده بازگشتی از مدلی که برای پیش بینی یک قدم جلوتر ساخته شده است، و 2) ساخت مدلی که مستقیماً هدف را در دوره زمانی بعدی در آینده پیش بینی می کند. یک چالش این است که مهندسی ویژگی مورد نیاز برای این دو روش متفاوت است. ما در مورد این تفاوت ها در دوره صحبت می کنیم.
چگونه میتوانیم مجموعهای از ویژگیها ایجاد کنیم که به ما امکان میدهد مقادیر آینده یک سری زمانی را بر اساس مقادیر گذشته آن پیشبینی کنیم؟ و چگونه می توانیم اطلاعات اضافی برای ایجاد مجموعه داده غنی تر برای پیش بینی های خود اضافه کنیم؟ در این دوره، همه این موارد و موارد دیگر را خواهید آموخت.
دوره جامع مهندسی ویژگی برای پیش بینی
ایجاد ویژگیهای مفید برای پیشبینی معمولاً مستلزم مطالعه دقیق سریهای زمانی شما برای یافتن الگوهای پیشبینیکننده، مانند روند و فصلی بودن، و ادغام آن با دانش دامنه است. اخیراً، روند رو به رشدی برای تلاش برای خودکارسازی ایجاد ویژگیها از سریهای زمانی وجود داشته است.
در این دوره آموزشی، نحوه ایجاد ویژگیهایی از سریهای زمانی را خواهید آموخت که به شما امکان میدهد مدلهای یادگیری ماشینی را برای پیشبینی مقادیر آینده سریهای زمانی آموزش دهید. ابتدا یاد خواهید گرفت که سری های زمانی را تجزیه و تحلیل کنید و ویژگی هایی را که می توانید برای ایجاد ویژگی های پیش بینی استفاده کنید، شناسایی کنید. به عنوان مثال، نحوه شناسایی و استخراج خودکار روند و فصلی بودن با استفاده از الگوریتمهای مختلف و همچنین نحوه تبدیل سریهای زمانی خود به منظور تسهیل تجزیه و پیشبینی آن را خواهید آموخت. ما نشان می دهیم که چگونه می توانید از ابزارهایی مانند همبستگی متقابل، همبستگی خودکار و نمودارهای همبستگی جزئی برای ایجاد ویژگی های تاخیر مناسب استفاده کنید. نکات، ترفندها و هکهایی را برای ایجاد ویژگیهایی کشف خواهید کرد که روندها، نقاط تغییر، فصلی بودن، جلوههای تقویم، موارد پرت و موارد دیگر را مدلسازی میکنند! بر اساس تجزیه و تحلیل داده ها و دانش دامنه، می توانید ویژگی های خود را با دقت ایجاد کنید.
سپس، یاد خواهید گرفت که چگونه فرآیند مهندسی ویژگیها را خودکار کنید تا تعداد زیادی ویژگی برای پیشبینی سریهای زمانی ایجاد کنید، و متعاقباً مواردی را انتخاب کنید که پیشبینیتر هستند. در اینجا، ما از کتابخانه های منبع باز استفاده خواهیم کرد که به ما امکان می دهد چندین ویژگی را به صورت خودکار یا نیمه خودکار ایجاد کنیم و سپس با ارزش ترین آنها را انتخاب کنیم. ما کتابخانه Python Feature-engine و بعداً tsfresh و featuretools را پوشش خواهیم داد.
ما شما را گام به گام از طریق آموزشهای ویدیویی جذاب راهنمایی میکنیم و همه چیزهایی را که برای ایجاد ویژگیهای معنادار برای پیشبینی سریهای زمانی باید بدانید، به شما آموزش میدهیم. در طول این دوره جامع، عملاً تمام روشهای ممکن برای ویژگیهای مهندسی برای پیشبینی سریهای زمانی را مرور خواهیم کرد. ما در مورد منطق آنها، پیاده سازی Python، مزایا و معایب، و مواردی که هنگام استفاده از این روش ها باید در نظر داشته باشید صحبت می کنیم.
به طور خاص، شما یاد خواهید گرفت که:
اجزای یک سری زمانی، از جمله سری های زمانی چند فصلی را شناسایی و جدا کنید.
ویژگی هایی ایجاد کنید که روندها، نقاط تغییر و فصلی بودن را به تصویر می کشد.
ویژگیهای تاخیر و پنجره مناسب را از سریهای زمانی هدف و پیشبینیکنندههای متغیر کمکی شناسایی و ایجاد کنید.
ویژگیها را از تاریخ و زمان خود ایجاد کنید.
متغیرهای طبقه بندی را برای پیش بینی رمزگذاری کنید.
ویژگی هایی را برای ثبت تعطیلات و سایر رویدادهای خاص ایجاد کنید.
دادههای از دست رفته را در سریهای زمانی با روشهای پر کردن و درونیابی به عقب و جلو وارد کنید.
تشخیص، حذف، یا درک اهمیت موارد پرت در پیش بینی.
ایجاد ویژگی را با کتابخانه های منبع باز Python به صورت خودکار انجام دهید.
در پایان دوره، میتوانید تصمیم بگیرید که کدام تکنیک برای چالش مجموعه داده و پیشبینی شما مناسبتر است. شما میتوانید تمام تکنیکها را در پایتون اعمال کنید و نحوه بهبود پیشبینیهای خود را کشف کنید.
شغل علم داده خود را ارتقا دهید
شما اولین قدمهای خود را در علم داده برداشتهاید. شما از متداول ترین مدل های پیش بینی استفاده می کنید. احتمالاً برخی از الگوریتمهای سنتی مانند ARIMA یا هموارسازی نمایی را برای انجام پیشبینیهای خود امتحان کردهاید. در این مرحله، احتمالاً دارید متوجه میشوید که این مدلها مفروضات زیادی در مورد دادههایی ایجاد میکنند که به سادگی رخ نمیدهند. شما به آزمایش شبکه های عصبی فکر کردید، اما آنها مدل های بسیار پیچیده ای را برای یک مشکل ساده ارائه می دهند.
ممکن است از خود بپرسید که آیا این چنین است یا راه حل های مناسب، همه کاره و ساده تری وجود دارد. همچنین ممکن است تعجب کنید که آیا کد شما کارآمد و کارآمد است یا راه بهتری برای برنامه ریزی آن وجود دارد. شما به صورت آنلاین جستجو می کنید، اما نمی توانید منابع تلفیقی را در زمینه مهندسی ویژگی برای پیش بینی پیدا کنید. شاید فقط وبلاگ ها؟ بنابراین ممکن است شروع به فکر کردن کنید: واقعاً کارها در صنعت چگونه انجام می شود؟
در این دوره آموزشی، پاسخ این سوالات را خواهید یافت. در طول دوره، راههای متعددی را برای ایجاد ویژگیهایی برای پیشبینی با مدلهای رگرسیون سنتی و نحوه پیادهسازی آنها با استفاده از Python به زیبایی یاد خواهید گرفت.
شما از قدرت اکوسیستم منبع باز پایتون، از جمله کتابخانههای Pandas، Scipy، Statsmodels، Scikit-learn و بستههای ویژه برای مهندسی ویژگیها مانند Feature-engine و Category encoder استفاده خواهید کرد. در نهایت، ما به شما نشان خواهیم داد که چگونه می توانید این فرآیند را با کتابخانه هایی مانند tsfresh و featuretools به طور خودکار شروع کنید.
در پایان دوره، میتوانید تمام مراحل مهندسی ویژگیهای خود را در یک خط لوله ساده ترکیب کنید و به شما این امکان را میدهد که مدلهای پیشبینی خود را با حداکثر کارایی وارد تولید کنید.
چرا این دوره را بگذرانید
هیچ مکان واحدی برای یادگیری در مورد مهندسی ویژگی برای پیش بینی وجود ندارد. حتی پس از ساعتها جستجو در وب، یافتن روشها و بهترین روشهای تلفیقی دشوار است.
به همین دلیل است که ما این دوره را ایجاد کردیم. این دوره بسیاری از تکنیکهای مورد استفاده در سراسر جهان برای مهندسی ویژگیها را از کتابهای معتبر پیشبینی، مسابقات دادهای مانند Kaggle و مقالات علمی KDD، و از تجربه مدرسان بهعنوان دانشمندان داده جمعآوری میکند. بنابراین این دوره مرجعی است که در آن میتوانید با روشهای جدید آشنا شوید و به همراه پیادهسازی آنها در کد، مجدداً از آنها بازدید کنید. بنابراین همیشه می توانید ویژگی های مورد نیاز خود را ایجاد کنید.
این دوره توسط دانشمندان پیشرو داده با تجربه در استفاده از یادگیری ماشین در امور مالی، بیمه، سلامت و تجارت الکترونیک تدریس میشود. سول همچنین یک نویسنده کتاب و توسعه دهنده اصلی یک کتابخانه منبع باز پایتون برای مهندسی ویژگی است. کیشان یک پیش بینی باتجربه با مدرک دکترای فیزیک در تجزیه و تحلیل سری های زمانی در مقیاس بزرگ و مدل سازی آریتمی های قلبی است.
این دوره جامع مهندسی ویژگی شامل بیش از 100 سخنرانی است که در حدود 10 ساعت ویدیو پخش شده است و همه موضوعات شامل نمونههای عملی کد پایتون است که میتوانید برای مرجع، تمرین و استفاده مجدد در پروژههای خود استفاده کنید.
و موارد دیگر وجود دارد:
این دوره به طور مداوم به روز می شود تا شامل روش های جدید مهندسی ویژگی باشد.
نوتبوکها مرتباً بهروزرسانی میشوند تا اطمینان حاصل شود که همه روشها با جدیدترین نسخههای کتابخانههای Python انجام میشوند، بنابراین کد شما هرگز خراب نمیشود.
این دوره ویدئوها، ارائهها و نوتبوکهای Jupyter را برای توضیح روشها و نشان دادن اجرای آنها در پایتون ترکیب میکند.
برنامه درسی در یک دوره دو ساله با تحقیقات مستمر در زمینه پیشبینی توسعه داده شد تا آخرین فناوریها، ابزارها و گرایشها را به شما ارائه دهد.
آیا می خواهید بیشتر بدانید؟ ادامه مطلب...
این دوره با 30 روز ضمانت بازگشت وجه ارائه می شود، بنابراین می توانید امروز بدون هیچ خطری ثبت نام کنید.
پس منتظر چه چیزی هستید؟ همین امروز ثبت نام کنید و به جامع ترین دوره مهندسی ویژگی های جهان برای پیش بینی سری های زمانی بپیوندید.
دانشمند داده | مربی | توسعه دهنده نرم افزار
Kishan Mananiیادگیری ماشین و علم داده پیشرو هستند
نمایش نظرات