لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش متن کاوی با یادگیری ماشین و پایتون [ویدئو]
Text Mining with Machine Learning and Python [Video]
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
متن یکی از فعالترین و گستردهترین انواع دادهها در زمینه علم داده امروزی است. پیشرفتهای جدید در تکنیکهای یادگیری ماشین و یادگیری عمیق اکنون امکان ساخت محصولات داده فوقالعاده بر روی منابع متنی را فراهم میکند. منابع داده متنی جدید و هیجان انگیز همیشه ظاهر می شوند. شما جعبه ابزار خود را از دانش، بسته ها و تکه کدهای کاری می سازید تا بتوانید تجزیه و تحلیل متن کاوی خود را انجام دهید.
شما با درک اصول متن کاوی مدرن شروع کرده و به سراغ برخی از فرآیندهای هیجان انگیز درگیر در آن خواهید رفت. شما یاد خواهید گرفت که چگونه از یادگیری ماشین برای استخراج اطلاعات معنی دار از متن و فرآیندهای مختلف درگیر در آن استفاده می شود. شما یاد خواهید گرفت که ویژگی های متن را بخوانید و پردازش کنید. سپس یاد خواهید گرفت که چگونه اطلاعات را از متن استخراج کنید و بر روی مدل های از پیش آموزش دیده کار کنید، در حالی که در طبقه بندی متن و استخراج و طبقه بندی موجودیت نیز تحقیق کنید. با کار بر روی Skip-grams، CBOW و X2Vec با برخی از فرآیندهای اضافی و مهم متن کاوی، فرآیند جاسازی کلمه را بررسی خواهید کرد. در پایان دوره، شما جنبه های مختلف متن کاوی با ML و فرآیندهای مهم درگیر در آن را آموخته و درک خواهید کرد و به عنوان یک متن کاوی موثر سفر خود را آغاز خواهید کرد.
بسته کد این دوره ویدیویی در https://github.com/PacktPublishing/Text-Mining-with-Machine-Learning-and-Python 1 موجود است. متن خود را اصلاح و پاک کنید.
2. استخراج داده های مهم از متن
3. طبقه بندی متن به انواع
4. تکنیک های مدرن ML و DL را روی متن اعمال کنید
5. روی مدل های از پیش آموزش دیده کار کنید
6. فرآیندهای متن کاوی مهم
7. تجزیه و تحلیل متن به بهترین و موثرترین روش این دوره دانشمندان داده را هدف قرار می دهد که نیاز به کسب مجموعه ای از مهارت های اولیه در زمینه تجزیه و تحلیل متن دارند، یا دانشمند داده شهروندی که می خواهد با متن کاوی راه بیفتد. از آنجایی که این یک دوره تخصصی محسوب می شود، دانش پایه پایتون، یادگیری ماشین و علم داده مورد نیاز است. ?رویکرد عملی با مثال های کاری * ?کار با داده های واقعی * ?کار با ابزارهای مدرن و آماده تولید * ?مرتبط ترین موضوعات را برای شروع کار پوشش دهید *
سرفصل ها و درس ها
شروع کار با متن کاوی
Getting Started with Text Mining
بررسی اجمالی دوره
The Course Overview
درک متن کاوی مدرن
Understanding Modern-Day Text Mining
کاوش در جعبه ابزار متن کاوی
Exploring Your Text Mining Toolbox
تنظیم محیط کاری
Setting Up Your Working Environment
خلاصه ای کوتاه از موضوعاتی که به آنها خواهیم پرداخت
A Short Rundown of the Topics We Will Cover
ویژگی های خواندن و پردازش متن
Reading and Processing Text Features
درک منابع داده متنی
Understanding Text Data Sources
پاک کردن متن کثیف
Cleaning Messy Text
Tokenization، POS Tagging و Lemmatization
Tokenization, POS Tagging, and Lemmatization
برخورد با N-Gram
Dealing with N-Grams
استخراج از متن
Extracting from Text
جستجوی کلمه در مقابل استخراج موجودیت
Word Search Versus Entity Extraction
شناسایی نهاد نامگذاری شده (NER)
Named Entity Recognition (NER)
استفاده از مدل های از پیش آموزش دیده
Using Pre-Trained Models
آموزش NER خودتان
Training Your Own NER
رویکرد یادگیری عمیق به NER
Deep Learning Approach to NER
طبقه بندی متن
Classification of Text
نمایش ویژگی
Feature Representation
الگوریتم های یادگیری ماشین برای طبقه بندی متن
Machine Learning Algorithms for Text Classification
راه اندازی یک طبقه بندی متن اصلی
Setting Up a Basic Text Classifier
مشکلات و قوانین سرانگشتی
Pitfalls and Rules of Thumb
قرار دادن طبقه بندی کننده ها در تولید
Putting Classifiers into Production
رویکرد یادگیری عمیق به طبقه بندی متن
Deep Learning Approach to Text Classification
جاسازی های کلمه
Word Embeddings
جاسازی کلمه چیست؟
What Are Word Embeddings?
تکنیک های اصلی
Main Techniques
آموزش مدل Word2Vec
Training a Word2Vec Model
تجسم یک مدل جاسازی کلمه آموزش دیده
Visualizing a Trained Word Embedding Model
X2Vec
X2Vec
سایر موضوعات ML با متن
Other ML Topics with Text
دوخت این همه با هم
Stitching It All Together
مدل سازی موضوع
Topic Modelling
تولید متن
Text Generation
ترجمه ماشینی
Machine Translation
بیشتر خواندن
Further Reading
بسته شدن
Closing
نمایش نظرات
Packtpub یک ناشر دیجیتالی کتابها و منابع آموزشی در زمینه فناوری اطلاعات و توسعه نرمافزار است. این شرکت از سال 2004 فعالیت خود را آغاز کرده و به تولید و انتشار کتابها، ویدیوها و دورههای آموزشی میپردازد که به توسعهدهندگان و متخصصان فناوری اطلاعات کمک میکند تا مهارتهای خود را ارتقا دهند. منابع آموزشی Packtpub موضوعات متنوعی از جمله برنامهنویسی، توسعه وب، دادهکاوی، امنیت سایبری و هوش مصنوعی را پوشش میدهد. محتوای این منابع به صورت کاربردی و بهروز ارائه میشود تا کاربران بتوانند دانش و تواناییهای لازم برای موفقیت در پروژههای عملی و حرفهای خود را کسب کنند.
Thomas Dehaene دانشمند داده در FoodPairing است، یک مقیاس فناوری غذایی در بلژیک که از مفاهیم پیشرفته در یادگیری ماشین، پردازش زبان طبیعی و به طور کلی هوش مصنوعی برای دریافت معنا و روندها از رسانه های مرتبط با غذا استفاده می کند. او مدرک کارشناسی ارشد خود را در رشته مهندسی صنایع و تحقیقات عملیاتی در دانشگاه گنت دریافت کرد، قبل از اینکه شغل خود را به سمت تجزیه و تحلیل داده ها و علوم داده که در 5 سال گذشته در آن فعال بوده است، ادامه دهد. علاوه بر شغل روزانهاش، توماس در بسیاری از فعالیتهای مرتبط با علم داده مانند هکاتونها، مسابقات Kaggle، Meetups و پروژههای Science Data Science نیز فعال است.
نمایش نظرات