آموزش استخراج داده ها از متن

Mining Data from Text

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره: این دوره بردارهای ویژگی متن و سند را که می تواند به مدل های یادگیری ماشین منتقل شود ، مدل سازی موضوع با استفاده از تجزیه و تحلیل معنای نهفته ، تخصیص پنهان دیریشله ، ضریب ماتریس غیر منفی و استخراج کلمات کلیدی با استفاده از RAKE بحث می کند. بخش بزرگی از جذابیت مدل های یادگیری عمیق توانایی آنها در کار با انواع داده های غیر ساختاری مانند متن ، عکس و فیلم است. با این حال چنین مدل هایی فقط به خوبی بردارهای مشخصه ای هستند که روی آنها کار می کنند. در این دوره ، استخراج داده از متن ، شما توانایی ساخت بردارهای ویژگی بسیار بهینه و کارآمد از داده های متنی و اسنادی را خواهید داشت. ابتدا یاد خواهید گرفت که چگونه اسناد را به عنوان داده های عددی با استفاده از شناسه های عددی ساده برای کلمات منفرد و همچنین روش های ظریف تری مانند فرکانس اصطلاح و فرکانس سند معکوس نشان دهید. در مرحله بعدی ، شما نحوه انجام مدل سازی موضوع را با استفاده از تکنیک هایی مانند تحلیل معنایی نهفته ، تخصیص پنهان دیریشله و فاکتوراسیون ماتریس غیر منفی کشف خواهید کرد. سرانجام ، شما نحوه اجرای استخراج کلمات کلیدی را با استفاده از یک الگوریتم محبوب - RAKE کشف خواهید کرد. پس از اتمام این دوره ، مهارت و دانش لازم را برای ساخت بردارهای ویژگی کارآمد و بهینه شده از یک مجموعه بزرگ سند و استفاده از بردارهای ویژگی در ساخت مدل های قدرتمند یادگیری ماشین خواهید داشت.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

مدل سازی متن با استفاده از پردازش زبان طبیعی Modeling Text Using Natural Language Processing

  • بررسی اجمالی ماژول Module Overview

  • پیش نیازها و طرح کلی دوره Prerequisites and Course Outline

  • استخراج داده ها از متن Mining Data from Text

  • نمایش عددی متن: یک رمزگذاری داغ Numeric Representations of Text: One Hot Encoding

  • نمایش عددی متن: رمزگذاری های مبتنی بر فرکانس Numeric Representations of Text: Frequency Based Encodings

  • نمایش عددی متن: پیش بینی های تعبیه شده بر اساس Numeric Representations of Text: Prediction Based Embeddings

  • ویژگی هاشینگ Feature Hashing

  • Bag of Words: کیسه N گرم Bag of Words: Bag of N Grams

  • نصب و راه اندازی Install and Setup

  • نمایش مبتنی بر فرکانس با استفاده از کیسه کلمات و کیسه مدل N گرم Frequency Based Representation Using Bag of Words and Bag of N Grams Model

  • ارائه اسناد با استفاده از امتیازات TFIDF و ویژگی های هش Representing Documents Using TFIDF Scores and Feature Hashes

  • خلاصه ماژول Module Summary

مدل های طبقه بندی ساختمان با استفاده از داده های متنی Building Classification Models Using Text Data

  • بررسی اجمالی ماژول Module Overview

  • طبقه بندی کننده Naive Bayes Naive Bayes Classifier

  • تجزیه و تحلیل احساسات با استفاده از طبقه بندی Naive Bayes Sentiment Analysis Using the Naive Bayes Classifier

  • خطوط لوله را برای ساخت ویژگی ها یاد بگیرید scikit-learn Pipelines to Build Features

  • طبقه بندی چند کلاسه Multiclass Classification

  • خلاصه ماژول Module Summary

درک مدل سازی موضوع Understanding Topic Modeling

  • بررسی اجمالی ماژول Module Overview

  • مدل سازی موضوع Topic Modeling

  • الگوریتم های مدل سازی موضوع Topic Modeling Algorithms

  • خلاصه ماژول Module Summary

پیاده سازی مدل سازی موضوع Implementing Topic Modeling

  • بررسی اجمالی ماژول Module Overview

  • تخصیص پنهان دیریکلت: مدلسازی مبحث با مجموعه عناوین روزنامه Latent Dirichlet Allocation: Topic Modeling with the Newspaper Headlines Dataset

  • تجسم تکالیف مبحث با استفاده از آموزش چند منظوره برای کاهش ابعاد Visualizing Topic Assignments Using Manifold Learning to Reduce Dimensions

  • تخصیص پنهان دیریکلت: مدل سازی مبحث با مجموعه داده DBPedia Latent Dirichlet Allocation: Topic Modeling with the DBPedia Dataset

  • تجسم مباحث با استفاده از آموزش چند منظوره برای کاهش ابعاد Visualizing Topics Using Manifold Learning to Reduce Dimensions

  • تجسم مدل مبحث تعاملی با استفاده از PyLDAVis Interactive Topic Model Visualization Using PyLDAVis

  • ضریب ماتریس غیر منفی: مدلسازی مبحث با مجموعه داده DBPedia Non-negative Matrix Factorization: Topic Modeling with the DBPedia Dataset

  • تجسم مبحث تعاملی با استفاده از بوکه Interactive Topic Visualization Using Bokeh

  • نمایه سازی معنایی نهفته: متن پیش پردازش Latent Semantic Indexing: Preprocessing Text

  • مدل سازی مفهوم با استفاده از LSI Concept Modeling Using LSI

  • خلاصه ماژول Module Summary

درک و اجرای استخراج کلمه کلیدی Understanding and Implementing Keyword Extraction

  • بررسی اجمالی ماژول Module Overview

  • درک RAKE برای استخراج کلمه کلیدی Understanding RAKE for Keyword Extraction

  • استخراج کلمه کلیدی با استفاده از RAKE Keyword Extraction Using RAKE

  • خلاصه و مطالعه بیشتر Summary and Further Study

نمایش نظرات

آموزش استخراج داده ها از متن
جزییات دوره
2h 21m
38
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
14
4.9 از 5
دارد
دارد
دارد
Janani Ravi
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Janani Ravi Janani Ravi

معمار و مهندس داده خبره Google Cloud

Janani Ravi یک معمار و مهندس داده خبره Google cloud است.

جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.