آموزش ویژگی های ساختمان از داده های متنی

Building Features from Text Data

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره: این دوره جنبه های استخراج اطلاعات از اسناد متنی و ساخت مدل های طبقه بندی از جمله بردارسازی ویژگی ها ، هش حساس به مکان ، حذف کلمات متغیر ، لمسی سازی و موارد دیگر از پردازش زبان طبیعی را شامل می شود. این دوره بخشی از این است: مسیر مهندسی ویژگی همه را بزرگ کنید بررسی اجمالی دوره 1m 49s نمایش متن به عنوان ویژگی های یادگیری ماشین 37 متر 7 ثانیه بازنمایی ویژگی های متن از متن 27m 42s ساده سازی پردازش متن با استفاده از پردازش زبان طبیعی 33 متر 54s کاهش ابعاد در متن با استفاده از هش کردن 27m 39s استفاده از تکنیک های استخراج ویژگی متن برای یادگیری ماشین 27m 54s علائم تجاری و نام تجاری اشخاص ثالث ذکر شده در این دوره متعلق به صاحبان مربوطه می باشند و Pluralsight وابسته یا تأیید شده توسط این احزاب نیست.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

نمایش متن به عنوان ویژگی های یادگیری ماشین Representing Text as Features for Machine Learning

  • بررسی اجمالی ماژول Module Overview

  • پیش نیازها و طرح کلی دوره Prerequisites and Course Outline

  • رمزگذاری داغ One-hot Encoding

  • بردارها را بشمارید Count Vectors

  • برداران Tf-Idf Tf-Idf Vectors

  • بردارهای همزمانی Co-occurence Vectors

  • جاسازی کلمه Word Embeddings

  • نصب بسته ها و تنظیم محیط Installing Packages and Setting Up the Environment

  • جمله و رمزگذاری کلمه Sentence and Word Tokenization

  • رسم توزیع فرکانس کلمه Plotting Word Frequency Distributions

  • خلاصه ماژول Module Summary

بازنمایی ویژگی های متن از متن Building Feature Vector Representations of Text

  • بررسی اجمالی ماژول Module Overview

  • کیسه کلمات و کیسه ای از گرم Bag-of-words and Bag-of-n-grams

  • کیسه های کلمات با استفاده از شمارشگر Bag-of-words Using the Count Vectorizer

  • تبدیل معکوس با استفاده از شمارشگر Inverse Transform Using the Count Vectorizer

  • کیسه گرم از گرم با استفاده از شمارشگر Bag-of-n-grams Using the Count Vectorizer

  • تولید N-گرم با استفاده از NLTK Generating N-grams Using NLTK

  • کیف کلمات با استفاده از Tf-Idf Vectorizer Bag-of-words Using the Tf-Idf Vectorizer

  • خلاصه ماژول Module Summary

ساده سازی پردازش متن با استفاده از پردازش زبان طبیعی Simplifying Text Processing Using Natural Language Processing

  • بررسی اجمالی ماژول Module Overview

  • عملیات پردازش زبان طبیعی Natural Language Processing Operations

  • حذف Stopword با استفاده از NLTK و یادگیری دقیق Stopword Removal Using NLTK and scikit-learn

  • فیلتر کردن فرکانس با استفاده از scikit-learn Frequency Filtering Using scikit-learn

  • ساقه زدن Stemming

  • لیمیت سازی Lemmatization

  • برچسب گذاری قسمتهای سخنرانی Parts-of-speech Tagging

  • خلاصه ماژول Module Summary

کاهش ابعاد در متن با استفاده از هش کردن Reducing Dimensions in Text Using Hashing

  • بررسی اجمالی ماژول Module Overview

  • ویژگی هاشینگ Feature Hashing

  • کاهش ابعاد با استفاده از ویژگی هش Reducing Dimensions Using the Feature Hasher

  • کاهش ابعاد در مقیاس با استفاده از هشدار دهنده Reducing Dimensions at Scale Using the Hashing Vectorizer

  • حساس بودن به منطقه Locality-sensitive Hashing

  • اسناد مشابه با استفاده از شاخص Jaccard و حساسیت به مکان Hashing Similar Documents Using Jaccard Index and Locality-sensitive Hashing

  • خلاصه ماژول Module Summary

استفاده از تکنیک های استخراج ویژگی متن برای یادگیری ماشین Applying Text Feature Extraction Techniques to Machine Learning

  • بررسی اجمالی ماژول Module Overview

  • Naive Bayes برای طبقه بندی Naive Bayes for Classification

  • طبقه بندی با استفاده از Hashing Vectorizer Classification Using the Hashing Vectorizer

  • متن را قبل از پردازش با استفاده از Stemmer ، ویژگی ها را با استفاده از Hashing Vectorizer بسازید Pre-process Text Using a Stemmer, Build Features Using the Hashing Vectorizer

  • ویژگی های ساختمان با استفاده از شمارشگر Building Features Using the Count Vectorizer

  • پیش پردازش با حذف Stopword ، ویژگی های ساختمان با استفاده از Count Vectorizer Pre-processing with Stopword Removal, Building Features Using Count Vectorizer

  • پیش پردازش با حذف Stopword ، فیلتر فرکانس ، ویژگی های ساختمان با استفاده از Count Vectorizer Pre-processing with Stopword Removal, Frequency Filtering, Building Features Using Count Vectorizer

  • ویژگی های ساختمان با استفاده از Tf-Idf Vectorizer Building Features Using the Tf-Idf Vectorizer

  • ویژگی های ساختمان با استفاده از مدل Bag-of-n-gram Building Features Using Bag-of-n-grams Model

  • خلاصه و مطالعه بیشتر Summary and Further Study

نمایش نظرات

آموزش ویژگی های ساختمان از داده های متنی
جزییات دوره
2h 36m
45
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
15
4.7 از 5
دارد
دارد
دارد
Janani Ravi
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Janani Ravi Janani Ravi

معمار و مهندس داده خبره Google Cloud

Janani Ravi یک معمار و مهندس داده خبره Google cloud است.

جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.