اگر تا به حال می خواهید یاد بگیرید که چگونه داده های متنی را با پایتون تجزیه و تحلیل کنید، این دوره برای شما مناسب است!
لیا یک دانشمند داده در یک موسسه مالی بزرگ است و کشف کرد که شکاف جدی بین مهارتها و تکنیکهایی که دانشآموزان در مدرسه یاد میگیرند در مقابل آنچه که در دنیای واقعی در محل کار به آن نیاز دارند وجود دارد. او از تخصص خود برای آموزش مبانی پردازش زبان طبیعی (NLP) به شما استفاده خواهد کرد.
این دوره برای دانشمندان داده و برنامه نویسان مشتاقی است که به دنبال گسترش دانش خود در مورد NLP هستند.
در این دوره آموزشی خواهید آموخت:
با تجزیه و تحلیل 500 مفهوم، تجربه عملی در مورد هر مفهوم به دست خواهید آورد.
در طول دوره، نمونههای کد در پایتون را با استفاده از یک نوت بوک Jupyter خواهید دید. شما همچنین از کتابخانه های محبوبی مانند پانداها، spaCy و scikit-learn استفاده خواهید کرد. هیچ دانش قبلی در مورد NLP برای این دوره مورد نیاز نیست. با این حال، دانش کاری مفاهیم اولیه برنامه نویسی (توابع، برای حلقه ها، و غیره) و مهارت های پایتون متوسط توصیه می شود.
موسیقی از Pixabay
اکنون که 500 بررسی محصول خانه و آشپزخانه آمازون را تجزیه و تحلیل کردهاید، وظیفه شما این است که خلاصههای مرور را تجزیه و تحلیل کنید (یعنی فیلد خلاصه در مجموعه دادهها) و ببینید که چگونه با نظرات محصول مقایسه میشوند. شما باید خلاصهها را از قبل پردازش کنید (نکته: ممکن است مراحل با آنچه در دوره استفاده شده متفاوت باشد)، فرکانسهای اصطلاح را جمعآوری کنید، شناسایی موجودیت نامگذاری شده را اعمال کنید، و برچسبگذاری بخشی از گفتار/تجزیه وابستگی را انجام دهید.
با آپلود کردن در بخش «پروژه شما»، کد نهایی خود را با کلاس به اشتراک بگذارید.
دانشمندان داده
لی سیمپسون و ری مکلندون دانشمندان داده در یک موسسه مالی بزرگ هستند و بیش از 15 سال تجربه ترکیبی دارند. آنها علاقه زیادی به دیدن رشد مردم و تبدیل شدن به بهترین نسخه از خود دارند. هنگامی که لی و ری از دانشگاه فارغ التحصیل شدند، در اولین شغل خود در زمینه دانشمند داده با مشکل مواجه شدند و به سرعت متوجه شدند که دانشگاه فقط نیمی از داستان را بیان می کند.
در حالی که برنامههای تحصیلی آنها تأکید زیادی بر الگوریتمهای یادگیری ماشینی با مجموعه دادههای کاملاً تمیز و متعادل داشت، آنها عکس این موضوع را در صنعت مشاهده کردند. هر مشکلی که با آن مواجه میشد نیاز داشت 90 درصد از زمان خود را بر روی مجموعه دادههای نامرتب و نامتعادل و همچنین افرادی که این مجموعه دادهها را تولید میکنند، صرف کنند.
لی و ری، Data Science Rebalanced را ایجاد کردند تا به دانشمندان دادهای که تازه وارد نیروی کار شدهاند کمک کنند تا مهارتهای خود را پس از تکمیل یک برنامه تحصیلی، بوت کمپ یا آموزشهای مختلف «تعادل مجدد» انجام دهند. آنها تلاش می کنند تا شکاف بین دانشگاه و صنعت را پر کنند.
نمایش نظرات