آموزش تجزیه و تحلیل داده های اکتشافی | ساخت اپلیکیشن EDA (Streamlit)

Exploratory Data Analysis | Build EDA App (Streamlit)

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: تسلط بر تکنیک های تحلیل و تبدیل انجام شده قبل از پروژه ML | اطمینان از حداکثر مقدار برای داده های خود EDA چیست چرا EDA مورد نیاز است چند خطی چیست چگونه می توان نقاط پرت را شناسایی کرد چگونه رابطه بین متغیرها را تشخیص دهیم تست مربع Chi و تست های دیگر چگونه داده های پیوسته را تبدیل کنیم نحوه تبدیل dara طبقه بندی گرایش مرکزی در مقابل پراکندگی نحوه رسیدگی مقادیر گم شده در مجموعه داده شما نحوه اعمال EDA (از طریق انتساب) نحوه استخراج حداکثر مقدار برای داده های خود پیش نیازها: دانش پایتون و یادگیری ماشین

به روز رسانی های اخیر

  • ژانویه 2023: کتابخانه‌های EDA (Klib، Sweetviz) که تمام فعالیت‌های EDA را با چند خط کد تکمیل می‌کنند، اضافه شده‌اند

  • جولای 2022: یک ویدیوی توضیحی درباره تفاوت‌های بین تجزیه و تحلیل داده‌ها و تجزیه و تحلیل داده‌های اکتشافی اضافه شده است.

  • ژانویه 2022: نمودارهای Scatter شرطی برای کمک به تجزیه و تحلیل دو متغیره اضافه شده است

  • نوامبر 2021: یک تمرین جامع که تمام احتمالات EDA را پوشش می دهد اضافه شده است.


    توصیه ها در مورد دوره

  • "این دوره برای من جالب و مفید بود. آقای گوویند سعی کرده است تمام مفاهیم مهم را به شیوه ای موثر پوشش دهد. این دوره می تواند به عنوان یک دوره ابتدایی برای همه علاقه مندان به یادگیری ماشین در نظر گرفته شود. از اینکه دانش خود را به اشتراک می گذارید متشکریم. با ما." دکتر راج گاوراو M.

  • "او بسیار واضح است. این یک دوره عالی برای افرادی است که ML بر اساس تجزیه و تحلیل داده ها انجام می دهند." داسیکا سری بووانا وی.

  • "این دوره به شما توصیه های خوبی در مورد نحوه درک داده های خود، قبل از شروع استفاده می دهد. از ایجاد یک مدل بد جلوگیری می کند، فقط به این دلیل که داده ها پاک نشده اند." ریکاردو V


تنظیم زمینه

قبل از شروع پروژه یادگیری ماشینی، اطمینان از آماده بودن داده ها برای کار مدل سازی مهم است. تجزیه و تحلیل داده های اکتشافی (EDA) آمادگی داده ها را برای یادگیری ماشین تضمین می کند. در واقع، EDA تضمین می کند که داده ها قابل استفاده تر هستند. بدون یک EDA مناسب، کار یادگیری ماشینی از مشکلات دقت رنج می‌برد و بسیاری از اوقات، الگوریتم‌ها کار نمی‌کنند.

تجزیه و تحلیل داده های اکتشافی چیست؟

تحلیل داده های اکتشافی (EDA) توسط دانشمندان داده برای تجزیه و تحلیل و بررسی مجموعه داده ها و خلاصه کردن ویژگی های اصلی آنها استفاده می شود که اغلب از روش های تجسم داده ها استفاده می کنند. این به تعیین بهترین روش دستکاری منابع داده برای دریافت پاسخ های مورد نیاز کمک می کند و کشف الگوها، تشخیص ناهنجاری ها، آزمایش یک فرضیه یا بررسی فرضیات را برای دانشمندان داده آسان تر می کند.

EDA اساساً برای دیدن آنچه که داده‌ها می‌توانند فراتر از مدل‌سازی رسمی یا آزمایش فرضیه آشکار کنند استفاده می‌شود و درک بهتری از متغیرهای مجموعه داده و روابط بین آنها ارائه می‌دهد. همچنین می تواند به تعیین مناسب بودن تکنیک های آماری که برای تجزیه و تحلیل داده ها در نظر گرفته اید کمک کند. تکنیک های EDA که در ابتدا توسط ریاضیدان آمریکایی جان توکی در دهه 1970 توسعه یافت، همچنان به عنوان روشی پرکاربرد در فرآیند کشف داده ها امروزی است.

چرا تجزیه و تحلیل داده های اکتشافی در علم داده مهم است؟

هدف اصلی EDA کمک به بررسی داده ها قبل از هر گونه فرضیه است. می‌تواند به شناسایی خطاهای آشکار، و همچنین درک بهتر الگوهای درون داده‌ها، شناسایی موارد پرت یا رویدادهای غیرعادی، یافتن روابط جالب بین متغیرها کمک کند.

دانشمندان داده می‌توانند از تجزیه و تحلیل اکتشافی برای اطمینان از معتبر بودن نتایجی که تولید می‌کنند و برای هر گونه نتایج و اهداف کسب‌وکار دلخواه استفاده می‌کنند، استفاده کنند. EDA همچنین با تأیید اینکه آنها سؤالات درستی می پرسند به ذینفعان کمک می کند. EDA می تواند به سوالات مربوط به انحرافات استاندارد، متغیرهای طبقه بندی شده و فواصل اطمینان پاسخ دهد. هنگامی که EDA کامل شد و بینش ها ترسیم شد، می توان از ویژگی های آن برای تحلیل یا مدل سازی داده های پیچیده تر، از جمله یادگیری ماشین استفاده کرد.


زبان برنامه نویسی استفاده شده

پایتون: یک زبان برنامه نویسی تفسیر شده و شی گرا با معناشناسی پویا. ساختارهای داده داخلی و سطح بالا آن، همراه با تایپ پویا و اتصال پویا، آن را برای توسعه سریع برنامه کاربردی و همچنین برای استفاده به عنوان یک زبان برنامه نویسی یا چسب برای اتصال اجزای موجود به یکدیگر بسیار جذاب می کند. Python و EDA را می توان با هم برای شناسایی مقادیر از دست رفته در یک مجموعه داده استفاده کرد، که بسیار مهم است تا بتوانید تصمیم بگیرید که چگونه مقادیر از دست رفته را برای یادگیری ماشین مدیریت کنید.


چه مواردی در این دوره پوشش داده می شود؟

این دوره تکنیک ها و رویکردهای تجزیه و تحلیل داده های اکتشافی را به شما آموزش می دهد که به شما کمک می کند حداکثر ارزش را از داده ها بدست آورید. اگر بدون انجام این EDA وارد یادگیری ماشینی شوید، علاوه بر اینکه با دقت پایین‌تری پایان می‌دهید، خود را برای شکست آماده می‌کنید. این دوره توسط یک پیشکسوت هوش مصنوعی و فناوری طراحی شده است و مستقیماً از فر به شما می رسد!




سرفصل ها و درس ها

مقدمه ای بر EDA (تحلیل داده های اکتشافی) Introduction to EDA (Exploratory Data Analysis)

  • مقدمه ای بر EDA Introduction to EDA

شفاف سازی بین تجزیه و تحلیل داده ها و EDA Clarification between data analysis and EDA

  • شفاف سازی بین تجزیه و تحلیل داده ها و EDA Clarification between data analysis and EDA

درک EDA Understanding EDA

  • متغیرهای وابسته و مستقل و نوع داده Dependent and Independent Variables & Data Type

  • مقادیر پوچ و رمزگذاری Null Values and Encoding

  • نقاط پرت و تبدیل داده ها Outliers and Data Transformation

  • چند خطی Multi Collinearity

  • مجموعه داده نامتعادل Imbalanced Dataset

  • مقیاس بندی داده ها Data Scaling

تجزیه و تحلیل داده ها با استفاده از پانداها Data Analysis Using Pandas

  • شروع کار با پانداها Getting Started with Pandas

  • تجزیه و تحلیل داده ها با استفاده از پانداها Data Analysis Using Pandas

مرور کد برای EDA Code Walkthrough for EDA

  • مرور کد Code Walkthrough

وظیفه Assignment

  • تکلیف EDA EDA Assignment

فرو رفتن عمیق در تجزیه و تحلیل دو متغیره Deep Dive into Bivariate Analysis

  • تجزیه و تحلیل دو متغیره - پیوسته و پیوسته Bivariate Analysis - Continuous & Continuous

  • تجسم داده های پیشرفته برای تجزیه و تحلیل دو متغیره Advanced Data Visualization for bivariate analysis

  • تجزیه و تحلیل دو متغیره - مقوله ای و پیوسته Bivariate Analysis - Categorical and Continuous

  • تجزیه و تحلیل دو متغیره - طبقه بندی و طبقه بندی Bivariate Analysis - Categorical and Categorical

پرداختن به یک مجموعه داده نامتعادل Addressing an imbalanced dataset

  • پرداختن به یک مجموعه داده نامتعادل Addressing an imbalanced dataset

برنامه ها/کتابخانه های EDA - Klib، Sweetviz EDA Apps/Libraries - Klib, Sweetviz

  • برنامه ها/کتابخانه های EDA - Klib، Sweetviz EDA Apps/Libraries - Klib, Sweetviz

با استفاده از Streamlit برنامه EDA ایجاد کنید Create EDA App Using Streamlit

  • تنظیمات زمینه Context Setting

  • زیرساخت برای Streamlit Infrastructure for Streamlit

  • ایجاد یک برنامه وب بسیار ساده و شروع به کار با streamlit Creating a very simple web app and Getting started with streamlit

  • هدر و زیر سربرگ Header and Sub Header

  • خواندن و نمایش محتویات یک فایل Reading and displaying contents of a file

  • در حال آپلود یک فایل Uploading a file

  • برنامه EDA EDA app

امتحان Quiz

  • امتحان Quiz

سخنرانی پاداش Bonus Lecture

  • سخنرانی پاداش Bonus Lecture

نمایش نظرات

آموزش تجزیه و تحلیل داده های اکتشافی | ساخت اپلیکیشن EDA (Streamlit)
جزییات دوره
2.5 hours
25
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
16,916
4 از 5
دارد
دارد
دارد
Govind Kumar
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Govind Kumar Govind Kumar

کارشناس هوش مصنوعی و تحول تجاری خلاصه: بیش از 2 دهه تجربه در MNC ها و استارت آپ های برتر. ایفای نقش رهبری و مدیریت مشاغل در سراسر آسیا و اقیانوسیه و منطقه ژاپن تخصص: هوش مصنوعی ، شش سیگما و نوآوری تجربیات کلیدی: با موفقیت در مراکز تعالی برای جلوگیری از کلاهبرداری و تجزیه و تحلیل خدمات انکوبه شد. تجربه قابل توجهی در توسعه و مدیریت محصول مبتنی بر تفکر طراحی. نقشی اساسی در توسعه محصولات برای بازارهای نوظهور ایفا کرد. آموزش و گواهینامه: B. فنی و MBA تمام وقت از موسسات برتر هند گواهینامه ها در شش سیگما و مدیریت پروژه.