در این دوره، ما 8 پروژه تجزیه و تحلیل دادهها را آپلود کردهایم که با پایتون حل شدهاند.
اگر بهعنوان تحلیلگر داده بهدنبال شغلی در سطح اولیه هستید، این پروژهها مفید هستند.
این پروژه ها برای انتقال شغلی به حوزه تجزیه و تحلیل داده مفید هستند.
اگر دانشجو هستید، میتوانید از این پروژهها برای ارسال در کالج/موسسه استفاده کنید.
کد منبع و فایلهای مجموعه داده برای دانلود در دسترس هستند.
همه پروژه ها با یک توضیح بسیار آسان ایجاد شده اند.
ما عمدتاً از کتابخانه محبوب پاندای پایتون برای حل این پروژهها استفاده کردهایم.
لطفاً برای جزئیات بیشتر، توضیحات هر سخنرانی ویدیویی را مرور کنید.
پروژه ها عبارتند از:
پروژه 1 - تجزیه و تحلیل داده های آب و هوا
پروژه 2 - تجزیه و تحلیل داده خودروها
پروژه 3 - تجزیه و تحلیل داده های پلیس
پروژه 4 - تجزیه و تحلیل داده های کووید
پروژه 5 - تجزیه و تحلیل داده های مسکن لندن
پروژه 6 - تجزیه و تحلیل داده های سرشماری
پروژه 7 - تجزیه و تحلیل داده های Udemy
پروژه 8 - تجزیه و تحلیل داده های Netflix
چند نمونه از دستورات مورد استفاده در این پروژه ها عبارتند از:
دستوراتی که در این پروژه استفاده کردیم:
* head() - N ردیف اول در داده ها را نشان می دهد (به طور پیش فرض N=5).
* شکل - تعداد کل را نشان می دهد. از ردیف و نه. از ستون های چارچوب داده
* index - این ویژگی نمایه چارچوب داده را ارائه می دهد
* ستونها - نام هر ستون را نشان می دهد
* dtypes - نوع داده هر ستون را نشان می دهد
* unique() - در یک ستون، تمام مقادیر منحصر به فرد را نشان می دهد. می توان آن را فقط روی یک ستون اعمال کرد، نه در کل دیتافریم.
* nunique() - شماره کل را نشان می دهد. مقادیر منحصر به فرد در هر ستون می توان آن را روی یک ستون و همچنین در کل دیتافریم اعمال کرد.
* شمارش - تعداد کل را نشان می دهد. مقادیر غیر تهی در هر ستون. می توان آن را روی یک ستون و همچنین در کل دیتافریم اعمال کرد.
* value_counts - در یک ستون، تمام مقادیر منحصر به فرد را با تعداد آنها نشان می دهد. می توان آن را فقط روی یک ستون اعمال کرد.
* info() - اطلاعات اولیه را در مورد چارچوب داده ارائه می دهد.* اندازه - برای نمایش تعداد کل مقادیر(عناصر) در مجموعه داده.
* duplicate( ) - برای بررسی ردیفها و شناسایی ردیفهای تکراری.
* isnull( ) - برای نشان دادن محل وجود مقدار Null.
* dropna( ) - سطرهایی را که حاوی تمام مقادیر از دست رفته هستند حذف می کند.
* isin( ) - برای نمایش تمام رکوردها از جمله عناصر خاص.
* str.contains( ) - برای دریافت تمام رکوردهایی که دارای یک رشته معین هستند.
* str.split( ) - رشته ستون را به ستون های مختلف تقسیم می کند.
* to_datetime( ) - نوع داده ستون Date-Time را به datatime[ns] تبدیل می کند.
* dt.year.value_counts( ) - وقوع همه سالهای فردی را در ستون Time شمارش می کند.
* groupby( ) - Groupby برای تقسیم داده ها به گروه ها بر اساس برخی معیارها استفاده می شود.
* sns.countplot(df['Col_name']) - برای نمایش تعداد تمام مقادیر منحصر به فرد هر ستون به شکل نمودار میله ای.
* max( ), min( ) - حداکثر/حداقل مقدار سری را نشان می دهد.
* mean( ) - مقدار میانگین سری را نشان می دهد.
تحلیلگر ارشد داده
نمایش نظرات