نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره:
این دوره جنبه های ساخت ویژگی های متن برای یادگیری ماشین با استفاده از ماشین های مجازی Azure Machine Learning Service را شامل می شود ، از جمله توکن سازی ، حذف Stopword ، بردار سازی ویژگی ها و موارد دیگر از پردازش زبان طبیعی. استفاده از داده های متنی برای تصمیم گیری در ایجاد ویژگی های متن برای یادگیری ماشین مهم است. مدل ها. در این دوره ، ساخت ویژگی ها از متن داده در Microsoft Azure ، شما توانایی ساخت داده های خود را به چندین روش قابل استفاده در مدل های یادگیری ماشین با استفاده از ماشین های مجازی Microsoft Azure Machine Learning Service به دست می آورید. در ابتدا ، چگونگی استفاده از پردازش زبان طبیعی برای تهیه داده های متنی و چگونگی استفاده از چندین فناوری پردازش زبان طبیعی ، مانند علامت گذاری اسناد ، حذف کلمات متوقف ، فیلتر کردن فرکانس ، ساقه و لماتیزه کردن ، برچسب گذاری قسمت های گفتار و n-gram شناسایی. سپس ، اسناد را به عنوان ویژگی های متنی کاوش می کنید ، در آنجا یاد می گیرید که اسناد را به عنوان بردار ویژگی با استفاده از تکنیک هایی از جمله رمزگذاری برداری داغ و شمارش ، رمزگذاری مبتنی بر فرکانس ، جاسازی کلمه ، هش و هش حساس به مکان نشان دهید. سرانجام ، شما در استفاده از BERT برای ایجاد تعبیه کلمات تعجب خواهید کرد. با پایان این دوره ، شما مهارت و دانش استفاده از داده های متنی و Microsoft Azure را به روش های کاملاً مفهومی برای ایجاد ویژگی های متن برای مدل های یادگیری ماشین خواهید داشت.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
-
بررسی اجمالی دوره
Course Overview
پردازش و ساده سازی متن برای ساده سازی ویژگی ایجاد
Processing and Simplifying Text to Simplify Feature Creation
-
بررسی اجمالی ماژول
Module Overview
-
پیش نیازها
Prerequisites
-
نسخه ی نمایشی: AMLS را پیکربندی کنید
Demo: Configure AMLS
-
پیش پردازش و NLP
Preprocessing and NLP
-
تمیز کردن و تمیز کردن
Tokenization and Cleaning
-
نسخه ی نمایشی: جمله و رمزگذاری کلمه
Demo: Sentence and Word Tokenization
-
نسخه ی نمایشی: NLTK Tokenizers
Demo: NLTK Tokenizers
-
نسخه ی نمایشی: تمیز کردن Token
Demo: Token Cleaning
-
حذف کلید واژه
Stopword Removal
-
نسخه ی نمایشی: حذف Stopword
Demo: Stopword Removal
-
فیلتر فرکانس
Frequency Filtering
-
نسخه ی نمایشی: فیلتر فرکانس
Demo: Frequency Filtering
-
ساقه زدن
Stemming
-
نسخه ی نمایشی: ساقه دار
Demo: Stemming
-
برچسب گذاری قسمتهای سخنرانی
Parts-of-speech Tagging
-
نسخه ی نمایشی: بخشهایی از گفتار
Demo: Parts-of-speech
-
لیمیت سازی
Lemmatization
-
نسخه ی نمایشی: لمسی سازی
Demo: Lemmatization
-
N گرم
N-grams
-
نسخه ی نمایشی: گرم N
Demo: N-grams
-
خلاصه ماژول
Module Summary
ویژگی های ساختمان در اطراف داده های متنی برای استفاده در مدل های یادگیری ماشین
Building Features Around Text Data for Use in Machine Learning Models
-
بررسی اجمالی ماژول
Module Overview
-
رمزگذاری متن به عنوان شماره
Encoding Text as Numbers
-
رمزگذاری برداری داغ و تعداد
One-hot and Count Vector Encoding
-
نسخه ی نمایشی: کیسه های کلمات
Demo: Bag-of-words
-
نسخه ی نمایشی: کیسه n گرم
Demo: Bag-of-n-grams
-
رمزگذاری TF-IDF
TF-IDF Encoding
-
نسخه ی نمایشی: رمزگذاری TF-IDF
Demo: TF-IDF Encoding
-
جاسازی کلمه
Word Embeddings
-
نسخه ی نمایشی: جاسازی کلمات با استفاده از Word2Vec
Demo: Word Embeddings Using Word2Vec
-
ویژگی هاشینگ
Feature Hashing
-
نسخه ی نمایشی: ترفند هش کردن
Demo: The Hashing Trick
-
حساس بودن به منطقه
Locality-sensitive Hashing
-
نسخه ی نمایشی: هشینگ حساس به مکان
Demo: Locality-sensitive Hashing
-
BERT
BERT
-
نسخه ی نمایشی: Word Embeddings با BERT در AMLS
Demo: Word Embeddings with BERT on AMLS
-
خلاصه
Summary
نمایش نظرات