در این دوره، ما 8 پروژه تجزیه و تحلیل دادهها را آپلود کردهایم که با پایتون حل شدهاند.
اگر بهدنبال شغلی در سطح اولیه بهعنوان تحلیلگر داده هستید، میتوانید از این پروژهها استفاده کنید.
اگر دانشجو هستید، میتوانید از این پروژهها برای ارسال در کالج/موسسه استفاده کنید.
کدهای منبع و فایلهای مجموعه داده برای دانلود در دسترس هستند.
همه پروژه ها با یک توضیح بسیار آسان ایجاد شده اند.
ما عمدتاً از کتابخانه محبوب Python Pandas، همراه با Matplotlib برای حل این پروژه ها استفاده کرده ایم.
لطفاً مشترک "دوستداران علم داده" در YouTube شوید و حمایت خود را نشان دهید.
برای خرید مطالب مطالعه تحلیلگر داده ما، می توانید به آدرس datasciencelovers@gmail.com به ما ایمیل بزنید
پروژه ها عبارتند از:
پروژه 1 - تجزیه و تحلیل داده های آب و هوا
Project 2 - Cars Data Analysis
پروژه 3 - تجزیه و تحلیل داده های پلیس
پروژه 4 - تجزیه و تحلیل داده های کووید
پروژه 5 - تجزیه و تحلیل داده های مسکن لندن
پروژه 6 - تجزیه و تحلیل داده های سرشماری
پروژه 7 - تجزیه و تحلیل داده های Udemy
پروژه 8 - تجزیه و تحلیل داده های Netflix
برخی از نمونه های اساسی از دستورات مورد استفاده در این پروژه ها عبارتند از:
* head() - N ردیف اول در داده ها را نشان می دهد (به طور پیش فرض N=5).
* شکل - تعداد کل را نشان می دهد. از ردیف و نه. از ستون های چارچوب داده
* index - این ویژگی نمایه چارچوب داده را ارائه می دهد
* ستونها - نام هر ستون را نشان می دهد
* dtypes - نوع داده هر ستون را نشان می دهد
* unique() - در یک ستون، تمام مقادیر منحصر به فرد را نشان می دهد. می توان آن را فقط روی یک ستون اعمال کرد، نه در کل دیتافریم.
* nunique() - شماره کل را نشان می دهد. مقادیر منحصر به فرد در هر ستون می توان آن را روی یک ستون و همچنین در کل دیتافریم اعمال کرد.
* شمارش - تعداد کل را نشان می دهد. مقادیر غیر تهی در هر ستون. می توان آن را روی یک ستون و همچنین در کل دیتافریم اعمال کرد.
* value_counts - در یک ستون، تمام مقادیر منحصر به فرد را با تعداد آنها نشان می دهد. می توان آن را فقط روی یک ستون اعمال کرد.
* info() - اطلاعات اولیه را در مورد چارچوب داده ارائه می دهد.* اندازه - برای نمایش تعداد کل مقادیر(عناصر) در مجموعه داده.
* duplicate( ) - برای بررسی ردیفها و شناسایی ردیفهای تکراری.
* isnull( ) - برای نشان دادن محل وجود مقدار Null.
* dropna( ) - سطرهایی را که حاوی تمام مقادیر از دست رفته هستند حذف می کند.
* isin( ) - برای نمایش تمام رکوردها از جمله عناصر خاص.
* str.contains( ) - برای دریافت تمام رکوردهایی که دارای یک رشته معین هستند.
* str.split( ) - رشته ستون را به ستون های مختلف تقسیم می کند.
* to_datetime( ) - نوع داده ستون Date-Time را به datatime[ns] تبدیل می کند.
* dt.year.value_counts( ) - وقوع همه سالهای فردی را در ستون Time شمارش می کند.
* groupby( ) - Groupby برای تقسیم داده ها به گروه ها بر اساس برخی معیارها استفاده می شود.
* sns.countplot(df['Col_name']) - برای نمایش تعداد تمام مقادیر منحصر به فرد هر ستون به شکل نمودار میله ای.
* max( ), min( ) - حداکثر/حداقل مقدار سری را نشان می دهد.
* mean( ) - مقدار میانگین سری را نشان می دهد.
روهیت گروال
نمایش نظرات