آموزش ساخت ویژگی ها از داده های متنی در Microsoft Azure

Building Features from Text Data in Microsoft Azure

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره: این دوره جنبه های ساخت ویژگی های متن برای یادگیری ماشین با استفاده از ماشین های مجازی Azure Machine Learning Service را شامل می شود ، از جمله توکن سازی ، حذف Stopword ، بردار سازی ویژگی ها و موارد دیگر از پردازش زبان طبیعی. استفاده از داده های متنی برای تصمیم گیری در ایجاد ویژگی های متن برای یادگیری ماشین مهم است. مدل ها. در این دوره ، ساخت ویژگی ها از متن داده در Microsoft Azure ، شما توانایی ساخت داده های خود را به چندین روش قابل استفاده در مدل های یادگیری ماشین با استفاده از ماشین های مجازی Microsoft Azure Machine Learning Service به دست می آورید. در ابتدا ، چگونگی استفاده از پردازش زبان طبیعی برای تهیه داده های متنی و چگونگی استفاده از چندین فناوری پردازش زبان طبیعی ، مانند علامت گذاری اسناد ، حذف کلمات متوقف ، فیلتر کردن فرکانس ، ساقه و لماتیزه کردن ، برچسب گذاری قسمت های گفتار و n-gram شناسایی. سپس ، اسناد را به عنوان ویژگی های متنی کاوش می کنید ، در آنجا یاد می گیرید که اسناد را به عنوان بردار ویژگی با استفاده از تکنیک هایی از جمله رمزگذاری برداری داغ و شمارش ، رمزگذاری مبتنی بر فرکانس ، جاسازی کلمه ، هش و هش حساس به مکان نشان دهید. سرانجام ، شما در استفاده از BERT برای ایجاد تعبیه کلمات تعجب خواهید کرد. با پایان این دوره ، شما مهارت و دانش استفاده از داده های متنی و Microsoft Azure را به روش های کاملاً مفهومی برای ایجاد ویژگی های متن برای مدل های یادگیری ماشین خواهید داشت.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

پردازش و ساده سازی متن برای ساده سازی ویژگی ایجاد Processing and Simplifying Text to Simplify Feature Creation

  • بررسی اجمالی ماژول Module Overview

  • پیش نیازها Prerequisites

  • نسخه ی نمایشی: AMLS را پیکربندی کنید Demo: Configure AMLS

  • پیش پردازش و NLP Preprocessing and NLP

  • تمیز کردن و تمیز کردن Tokenization and Cleaning

  • نسخه ی نمایشی: جمله و رمزگذاری کلمه Demo: Sentence and Word Tokenization

  • نسخه ی نمایشی: NLTK Tokenizers Demo: NLTK Tokenizers

  • نسخه ی نمایشی: تمیز کردن Token Demo: Token Cleaning

  • حذف کلید واژه Stopword Removal

  • نسخه ی نمایشی: حذف Stopword Demo: Stopword Removal

  • فیلتر فرکانس Frequency Filtering

  • نسخه ی نمایشی: فیلتر فرکانس Demo: Frequency Filtering

  • ساقه زدن Stemming

  • نسخه ی نمایشی: ساقه دار Demo: Stemming

  • برچسب گذاری قسمتهای سخنرانی Parts-of-speech Tagging

  • نسخه ی نمایشی: بخشهایی از گفتار Demo: Parts-of-speech

  • لیمیت سازی Lemmatization

  • نسخه ی نمایشی: لمسی سازی Demo: Lemmatization

  • N گرم N-grams

  • نسخه ی نمایشی: گرم N Demo: N-grams

  • خلاصه ماژول Module Summary

ویژگی های ساختمان در اطراف داده های متنی برای استفاده در مدل های یادگیری ماشین Building Features Around Text Data for Use in Machine Learning Models

  • بررسی اجمالی ماژول Module Overview

  • رمزگذاری متن به عنوان شماره Encoding Text as Numbers

  • رمزگذاری برداری داغ و تعداد One-hot and Count Vector Encoding

  • نسخه ی نمایشی: کیسه های کلمات Demo: Bag-of-words

  • نسخه ی نمایشی: کیسه n گرم Demo: Bag-of-n-grams

  • رمزگذاری TF-IDF TF-IDF Encoding

  • نسخه ی نمایشی: رمزگذاری TF-IDF Demo: TF-IDF Encoding

  • جاسازی کلمه Word Embeddings

  • نسخه ی نمایشی: جاسازی کلمات با استفاده از Word2Vec Demo: Word Embeddings Using Word2Vec

  • ویژگی هاشینگ Feature Hashing

  • نسخه ی نمایشی: ترفند هش کردن Demo: The Hashing Trick

  • حساس بودن به منطقه Locality-sensitive Hashing

  • نسخه ی نمایشی: هشینگ حساس به مکان Demo: Locality-sensitive Hashing

  • BERT BERT

  • نسخه ی نمایشی: Word Embeddings با BERT در AMLS Demo: Word Embeddings with BERT on AMLS

  • خلاصه Summary

نمایش نظرات

آموزش ساخت ویژگی ها از داده های متنی در Microsoft Azure
جزییات دوره
1h 54m
38
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
10
4.8 از 5
دارد
دارد
دارد
Michael Heydt
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Michael Heydt Michael Heydt

مایک یک توسعه دهنده فصلی نرم افزار ، مرد IT ، معمار ابر ، متعصب اینترنت اشیا و به طور کلی اسباب بازی است. او در حال حاضر یک توسعه دهنده مستقل ، مهندس DevOps ، نویسنده ، مربی و سخنران است. مایک در بسیاری از صنایع از جمله سیستم های مالی/بازرگانی ، تلویزیون کابلی/تلویزیون تعاملی ، GIS ، مراقبت های بهداشتی ، رسانه های اجتماعی و ژنومیک کار کرده است. سابقه مایک در طول تاریخ در راه حل های مایکروسافت بوده است ، زیرا این سیستم ها را از روزهای DOS تاکنون از طریق NET و Azure ساخته است. وی دارای بیش از 17 گواهینامه فعال مایکروسافت در Azure ، C # ، توسعه ، و همچنین چندین گواهینامه AWS در حال توسعه است. مایک همچنین طرفدار لینوکس است و تقریباً در 5 سال گذشته همه چیز را با استفاده از C # یا Python در Linux ساخته است. هنگامی که از رایانه استفاده نمی کند ، مایک وقت خود را صرف کمک به پسرش در درجه نجوم (و انجام نجوم آماتور) ، تشویق همسر خود که برای مدرک رسانه خود کار می کند ، و با Braque D'Auvergn خود در مناطق وحشی مونتانا گشت و گذار می کند " بلو ”