درختهای طبقهبندی و رگرسیون یا به اختصار CART اصطلاحی است که به الگوریتمهای درخت تصمیم اشاره میکند که میتواند برای مشکلات مدلسازی پیشبینی طبقهبندی یا رگرسیون استفاده شود. CART یک الگوریتم پیشبینی است که در یادگیری ماشینی استفاده میشود و توضیح میدهد که چگونه میتوان مقادیر متغیر هدف را بر اساس موارد دیگر پیشبینی کرد. این یک درخت تصمیم است که در آن هر فورک به یک متغیر پیش بینی تقسیم می شود و هر گره یک پیش بینی برای متغیر هدف در پایان دارد. به طور کلاسیک، این الگوریتم به عنوان درخت تصمیم نامیده می شود، اما در برخی از پلتفرم ها مانند R با اصطلاح مدرن تر CART به آن ها اشاره می شود. الگوریتم CART پایهای برای الگوریتمهای مهمی مانند درختان تصمیمگیری بستهشده، جنگلهای تصادفی و درختهای تصمیم تقویتشده فراهم میکند.
همانطور که از نام آن پیداست، CART (درخت طبقه بندی و رگرسیون) را می توان برای مشکلات طبقه بندی و رگرسیون استفاده کرد. تفاوت در متغیر هدف نهفته است. یعنی با طبقه بندی، سعی می کنیم یک برچسب کلاس را پیش بینی کنیم. به عبارت دیگر، طبقهبندی برای مسائلی استفاده میشود که در آن خروجی (متغیر هدف) مجموعهای محدود از مقادیر را میگیرد، به عنوان مثال، آیا فردا باران خواهد بارید یا خیر. در همین حال، رگرسیون برای پیش بینی یک برچسب عددی استفاده می شود. این بدان معناست که خروجی شما میتواند مجموعهای از مقادیر بینهایت را داشته باشد، به عنوان مثال، قیمت خانه.
درخت تصمیم نوع مهمی از الگوریتم برای مدلسازی پیشبینیکننده یادگیری ماشین هستند. الگوریتمهای درخت تصمیم کلاسیک برای دههها وجود داشتهاند و تغییرات مدرن مانند جنگل تصادفی یکی از قویترین تکنیکهای موجود است. در این پست، الگوریتم درخت تصمیم فروتن را که با نام مدرن تر CART شناخته می شود، کشف خواهید کرد که مخفف درختان طبقه بندی و رگرسیون است. وب پر از برنامه هایی است که توسط داده ها هدایت می شوند. تمام اپلیکیشنها و وبسایتهای تجارت الکترونیک بر اساس دادهها به معنای کامل هستند. پایگاه داده ای در پشت یک وب پیشانی و میان افزاری وجود دارد که با تعدادی دیگر از پایگاه های داده و خدمات داده صحبت می کند. اما استفاده صرف از داده ها چیزی نیست که علم داده را شامل شود. یک برنامه داده ارزش خود را از داده ها می گیرد و در این فرآیند برای خود ارزش ایجاد می کند. این بدان معناست که علم داده امکان ایجاد محصولاتی را فراهم می کند که بر اساس داده ها هستند. این دوره شامل مدل سازی درخت تصمیم یادگیری است که توسط دانشمندان داده یا افرادی که الهام می گیرند دانشمند داده باشند استفاده می شود.
الگوریتم درخت تصمیم یکی از الگوریتمهای معروف یادگیری ماشینی نوع نظارت شده است که برای طبقهبندی استفاده میشود. این الگوریتم نتیجه را به عنوان نتیجه بهینه شده بر اساس ساختار درختی با شرایط یا قوانین تولید می کند. الگوریتم درخت تصمیم با سه جزء اصلی به عنوان گره های تصمیم، پیوندهای طراحی و برگ های تصمیم مرتبط است. این با فرآیند تقسیم، هرس، و انتخاب درخت عمل می کند. از داده های عددی و مقوله ای برای ساخت درخت تصمیم پشتیبانی می کند. الگوریتم های درخت تصمیم برای مجموعه داده های بزرگ با پیچیدگی زمانی کمتر کارآمد هستند. این الگوریتم بیشتر در بخش بندی مشتری و اجرای استراتژی بازاریابی در کسب و کار استفاده می شود.
مهارت های دنیای واقعی را بصورت آنلاین بیاموزید EDUCBA یک ارائه دهنده جهانی آموزش مبتنی بر مهارت است که نیازهای اعضا را در بیش از 100 کشور برطرف می کند. ما بزرگترین شرکت فناوری پیشرفته در آسیا با نمونه کارهای 5498+ دوره آنلاین ، 205+ مسیر یادگیری ، 150+ برنامه شغل محور (JOPs) و 50+ بسته دوره حرفه ای شغلی هستیم که توسط متخصصان برجسته صنعت آماده شده است. برنامه های آموزشی ما برنامه های مبتنی بر مهارت شغلی است که توسط صنعت در سراسر امور مالی ، فناوری ، تجارت ، طراحی ، داده و فناوری جدید و آینده مورد نیاز صنعت است.
نمایش نظرات