NLP با Python برای آموزش یادگیری ماشین

NLP with Python for Machine Learning Essential Training

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: با افزایش مقدار داده در دسترس عموم و تمرکز بیشتر بر داده های متنی بدون ساختار ، درک نحوه پاک کردن ، پردازش و تجزیه و تحلیل داده های متنی بسیار ارزشمند است. اگر شما با پایتون تجربه دارید و به پردازش زبان طبیعی (NLP) علاقه دارید ، این دوره می تواند دانش لازم برای حل مشکلات پیچیده با استفاده از یادگیری ماشین را به شما ارائه دهد. مربی درک جدامسکی خلاصه ای سریع از مفاهیم اساسی پردازش زبان طبیعی (NLP) را ارائه می دهد ، تکنیک های پیشرفته تمیز کردن داده ها و بردار سازی را پوشش می دهد و سپس به ساخت طبقه بندی های یادگیری ماشین می پردازد. در طی این آخرین مرحله ، درک نحوه ساخت دو نوع مختلف از مدلهای یادگیری ماشین و همچنین نحوه ارزیابی و آزمایش تغییرات این مدلها را نشان می دهد.
موضوعات شامل:
  • تعریف NLP را توضیح دهید.
  • روند توکن سازی را توصیف کنید.
  • هدف از تصویربرداری را مشخص کنید.
  • نتایج لماتیزه کردن را تشخیص دهید.
  • مشخصات TF-IDF را خلاصه کنید.
  • دقت را از نظر معیارهای ارزیابی تعریف کنید.
  • سه مزیت استفاده از روشهای گروه را بخاطر بسپارید.

سرفصل ها و درس ها

مقدمه Introduction

  • خوش آمدی Welcome

  • آنچه باید بدانید What you should know

  • چه ابزاری نیاز دارید؟ What tools do you need?

  • با استفاده از پرونده های تمرینی Using the exercise files

1. مبانی NLP 1. NLP Basics

  • NLP و NLTK چیست؟ What are NLP and NLTK?

  • NLTK و نمای کلی NLTK setup and overview

  • خواندن داده های متنی Reading in text data

  • کاوش در مجموعه داده Exploring the dataset

  • عبارات منظم چیست؟ What are regular expressions?

  • یادگیری نحوه استفاده از عبارات منظم Learning how to use regular expressions

  • جایگزینی بیان منظم Regular expression replacements

  • خط لوله یادگیری ماشین Machine learning pipeline

  • اجرای: حذف نگارشی Implementation: Removing punctuation

  • اجرای: توکن سازی Implementation: Tokenization

  • اجرای: حذف کلمات متوقف Implementation: Removing stop words

2. تمیز کردن اطلاعات تکمیلی 2. Supplemental Data Cleaning

  • معرفی اشتعال Introducing stemming

  • با استفاده از ساقه Using stemming

  • معرفی لمینت Introducing lemmatizing

  • با استفاده از lemmatizing Using lemmatizing

3. وکتورسازی داده های خام 3. Vectorizing Raw Data

  • معرفی وکتورسازی Introducing vectorizing

  • بردار سازی را بشمارید Count vectorization

  • وکتور سازی N-گرم N-gram vectorizing

  • فرکانس سند معکوس Inverse document frequency weighting

4. مهندسی ویژگی 4. Feature Engineering

  • معرفی مهندسی ویژگی Introducing feature engineering

  • ایجاد ویژگی Feature creation

  • ارزیابی ویژگی Feature evaluation

  • شناسایی ویژگی های تحول Identifying features for transformation

  • تبدیل قدرت جعبه کاکس Box-Cox power transformation

5- طبقه بندی کننده های یادگیری ماشین سازی 5. Building Machine Learning Classifiers

  • یادگیری ماشین چیست؟ What is machine learning?

  • معیارهای اعتبار سنجی و ارزیابی متقابل Cross-validation and evaluation metrics

  • معرفی جنگل تصادفی Introducing random forest

  • ساختن یک مدل جنگلی تصادفی Building a random forest model

  • جنگل تصادفی با مجموعه آزمایشات نگهدارنده Random forest with holdout test set

  • مدل جنگلی تصادفی با جستجوی شبکه Random forest model with grid search

  • عملکرد مدل جنگلی تصادفی را ارزیابی کنید Evaluate random forest model performance

  • معرفی تقویت شیب Introducing gradient boosting

  • جستجوی شبکه گرادیان Gradient-boosting grid search

  • عملکرد مدل شیب تقویت را ارزیابی کنید Evaluate gradient-boosting model performance

  • انتخاب مدل: آمادگی داده ها Model selection: Data prep

  • انتخاب مدل: نتایج Model selection: Results

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

NLP با Python برای آموزش یادگیری ماشین
جزییات دوره
4h 14m
41
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
166,567
- از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Derek Jedamski Derek Jedamski

دانشمند داده های ماهر متخصص در یادگیری ماشین

derek jedamski یک دانشمند داده ماهر است که متخصص در یادگیری ماشین است.

Derek دارای تجربه با مدلسازی رگرسیون و طبقه بندی، پردازش زبان طبیعی، تجزیه و تحلیل آماری، کنترل کیفیت، تجزیه و تحلیل کسب و کار، و برقراری ارتباط نتایج فنی به مخاطبان است زمینه های مختلف او همچنین دارای درک کامل از پایتون، R، SQL، Apache Spark و سایر چارچوب های محاسباتی و زبان ها است. در حال حاضر، Derek در Github به عنوان یک دانشمند داده کار می کند.