آیا تا به حال یک ساعت وقت صرف کرده اید تا کد بنویسید تا داده های خود را پاک کنید و متوجه شوید که اجرای آن سه ساعت طول می کشد؟ گاهی اوقات خوب است در حالی که منتظر اجرای کد خود هستید، به کار دیگری بروید. با این حال، هنگام انتقال به محیطهای تولید، اغلب نیاز به refactoring است. در این دوره آموزشی، نحوه سرعت بخشیدن به یک کار را که بهعنوان یک دانشمند داده یا تحلیلگر داده انجام میدهید، یاد میگیرید. از طریق Pandas DataFrames و تبدیل دادههای شما.
لیا یک دانشمند داده در یک موسسه مالی بزرگ است و کشف کرد که شکاف جدی بین مهارتها و تکنیکهایی که دانشآموزان در مدرسه یاد میگیرند در مقابل آنچه که در دنیای واقعی در محل کار به آن نیاز دارند وجود دارد. نوشتن پایتون کارآمد در برنامه کارشناسی لیا اصلاً مورد تاکید قرار نگرفت. او به شما کمک میکند از اشتباهاتی که در اولین کارش مرتکب شد، اجتناب کنید و به شما یاد میدهد که چگونه به سرعت از DataFrames استفاده کنید.
این دوره برای دانشمندان داده و برنامه نویسان مشتاقی است که به دنبال گسترش دانش خود در زمینه نوشتن پایتون کارآمد هستند.
در این دوره شما تکنیک های زیر را برای حلقه زدن از طریق Pandas DataFrames یاد خواهید گرفت:
لیا دو نمونه واقعی از کدهای آهسته را طی میکند و به شما نشان میدهد که چگونه آن را دوباره سازی کنید.
برای این دوره هیچ دانش قبلی در مورد پانداها لازم نیست. با این حال، درک اولیه پایتون 3 مفید خواهد بود (اما لازم نیست).
موسیقی توسط از Pixabay
استفاده از تصاویر در این دوره -
اکنون که یاد گرفتید چگونه به طور مؤثر از طریق Pandas DataFrame حلقه بزنید، پروژههایی را که در گذشته روی آنها کار کردهاید، مرور کنید. کد خود را با استفاده از هر یک از روش های این دوره اصلاح کنید و سرعت اجرای کد شما را محاسبه کنید.
اگر در پروژههای گذشتهتان از پاندا برای چرخش دادهها استفاده نکردهاید، یک حساب در آن ایجاد کنید، بخش پروژه موجود را مرور کنید (کد را بررسی کنید)، و کد شخص دیگری را اصلاح کنید.
با آپلود کردن در بخش «پروژه شما»، کد خود را قبل و بعد از بازسازی مجدد با کلاس به اشتراک بگذارید.
دانشمندان داده
لی سیمپسون و ری مکلندون دانشمندان داده در یک موسسه مالی بزرگ هستند و بیش از 15 سال تجربه ترکیبی دارند. آنها علاقه زیادی به دیدن رشد مردم و تبدیل شدن به بهترین نسخه از خود دارند. هنگامی که لی و ری از دانشگاه فارغ التحصیل شدند، در اولین شغل خود در زمینه دانشمند داده با مشکل مواجه شدند و به سرعت متوجه شدند که دانشگاه فقط نیمی از داستان را بیان می کند.
در حالی که برنامههای تحصیلی آنها تأکید زیادی بر الگوریتمهای یادگیری ماشینی با مجموعه دادههای کاملاً تمیز و متعادل داشت، آنها عکس این موضوع را در صنعت مشاهده کردند. هر مشکلی که با آن مواجه میشد نیاز داشت 90 درصد از زمان خود را بر روی مجموعه دادههای نامرتب و نامتعادل و همچنین افرادی که این مجموعه دادهها را تولید میکنند، صرف کنند.
لی و ری، Data Science Rebalanced را ایجاد کردند تا به دانشمندان دادهای که تازه وارد نیروی کار شدهاند کمک کنند تا مهارتهای خود را پس از تکمیل یک برنامه تحصیلی، بوت کمپ یا آموزشهای مختلف «تعادل مجدد» انجام دهند. آنها تلاش می کنند تا شکاف بین دانشگاه و صنعت را پر کنند.
نمایش نظرات