آموزش علم داده: پردازش زبان طبیعی (NLP) در پایتون - آخرین آپدیت

دانلود Data Science: Natural Language Processing (NLP) in Python

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:

آیا تا به حال فکر کرده‌اید که فناوری‌های هوش مصنوعی مانند OpenAI ChatGPT، GPT-4، DALL-E، Midjourney و Stable Diffusion واقعاً چگونه کار می‌کنند؟ در این دوره، شما مبانی این کاربردهای پیشگامانه را خواهید آموخت.

در این دوره، شما چندین سیستم کاربردی را با استفاده از پردازش زبان طبیعی (NLP) – شاخه‌ای از یادگیری ماشین و علم داده که با متن و گفتار سروکار دارد – خواهید ساخت. این دوره بخشی از مجموعه دوره‌های یادگیری عمیق من نیست، بنابراین شامل هیچ ریاضیات پیچیده‌ای نمی‌شود؛ فقط کدنویسی مستقیم در پایتون. تمام مواد آموزشی این دوره رایگان هستند.

پس از بحث مختصری درباره اینکه NLP چیست و چه کارهایی می‌تواند انجام دهد، شروع به ساخت ابزارهای بسیار مفید خواهیم کرد. اولین چیزی که خواهیم ساخت، یک الگوریتم رمزگشایی رمز (Cipher Decryption) است. این الگوریتم‌ها در جنگ و جاسوسی کاربرد دارند. در این بخش، نحوه ساخت و به‌کارگیری چندین ابزار مفید NLP را خواهیم آموخت، به ویژه: مدل‌های زبانی سطح کاراکتر (با استفاده از اصل مارکوف) و الگوریتم‌های ژنتیک.

پروژه دوم، که در آن شروع به استفاده از "یادگیری ماشین" سنتی‌تر می‌کنیم، ساخت یک تشخیص‌دهنده هرزنامه (Spam Detector) است. احتمالاً امروزه در مقایسه با اوایل دهه 2000، هرزنامه بسیار کمی دریافت می‌کنید، که دلیل آن وجود سیستم‌هایی مانند همین است.

در مرحله بعد، ما یک مدل برای تحلیل احساسات (Sentiment Analysis) در پایتون خواهیم ساخت. این ابزار به ما اجازه می‌دهد تا یک امتیاز به یک قطعه متن اختصاص دهیم که نشان می‌دهد چقدر مثبت یا منفی است. افراد از تحلیل احساسات در توییتر برای پیش‌بینی بازار سهام استفاده کرده‌اند.

ما به برخی ابزارها و تکنیک‌های کاربردی مانند کتابخانه NLTK (Natural Language Toolkit) و تحلیل معنایی پنهان (Latent Semantic Analysis - LSA) خواهیم پرداخت.

در نهایت، دوره را با ساخت یک بازنویسنده خودکار مقاله (Article Spinner) به پایان می‌رسانیم. این یک مسئله بسیار دشوار است و حتی محبوب‌ترین محصولات موجود در حال حاضر نیز آن را به درستی انجام نمی‌دهند. این درس‌ها طوری طراحی شده‌اند که شما را تنها به شروع کار هدایت کنند و ایده‌هایی برای بهبود آن‌ها توسط خودتان ارائه دهند. پس از تسلط، می‌توانید از آن به عنوان ابزاری برای سئو (SEO) یا بهینه‌سازی موتور جستجو استفاده کنید. بازاریابان اینترنتی در سراسر جهان عاشق شما خواهند شد اگر بتوانید این کار را برایشان انجام دهید!

این دوره بر "چگونگی ساخت و درک" تمرکز دارد، نه صرفاً "چگونگی استفاده". هر کسی می‌تواند پس از خواندن مستندات، در 15 دقیقه استفاده از یک API را یاد بگیرد. مسئله "به خاطر سپردن حقایق" نیست، بلکه "مشاهده مستقیم از طریق آزمایش" است. این دوره به شما می‌آموزد که چگونه آنچه در درون مدل اتفاق می‌افتد را بصری‌سازی کنید. اگر به دنبال درکی عمیق‌تر از مدل‌های یادگیری ماشین هستید و نمی‌خواهید صرفاً نگاهی سطحی داشته باشید، این دوره برای شماست.

"اگر نمی‌توانید چیزی را پیاده‌سازی کنید، آن را نمی‌فهمید."

  • یا همانطور که ریچارد فاینمن، فیزیکدان بزرگ، گفت: "آنچه را نتوانم بسازم، درک نمی‌کنم."

  • دوره‌های من تنها دوره‌هایی هستند که در آن‌ها یاد می‌گیرید چگونه الگوریتم‌های یادگیری ماشین را از صفر پیاده‌سازی کنید.

  • دوره‌های دیگر به شما آموزش می‌دهند که چگونه داده‌های خود را به یک کتابخانه متصل کنید، اما آیا واقعاً برای 3 خط کد به کمک نیاز دارید؟

  • پس از انجام همین کار با 10 مجموعه داده، متوجه می‌شوید که 10 چیز یاد نگرفته‌اید. شما 1 چیز یاد گرفتید و فقط همان 3 خط کد را 10 بار تکرار کردید...

کاربردها

  • رمزگشایی رمزها
  • تشخیص هرزنامه (Spam Detection)
  • تحلیل احساسات (Sentiment Analysis)
  • بازنویسی خودکار مقالات (Article Spinning)
  • تحلیل معنایی پنهان (Latent Semantic Analysis - LSA)

آنچه در این دوره یاد می‌گیرید و می‌سازید:

  • توسعه الگوریتم رمزگشایی رمز با استفاده از الگوریتم‌های ژنتیک و مدل‌سازی زبان با مدل‌های مارکوف
  • نوشتن کد تشخیص هرزنامه (Spam Detection) در پایتون
  • نوشتن کد تحلیل احساسات (Sentiment Analysis) در پایتون
  • انجام تحلیل معنایی پنهان (Latent Semantic Analysis - LSA) یا نمایه سازی معنایی پنهان (Latent Semantic Indexing) در پایتون
  • کسب درک و ایده برای نوشتن بازنویسنده خودکار مقاله (Article Spinner) در پایتون
  • درک مبانی مهم برای فناوری‌هایی مانند OpenAI ChatGPT، GPT-4، DALL-E، Midjourney و Stable Diffusion

پیش‌نیازها

  • پایتون را نصب کنید؛ رایگان است!
  • باید حداقل تا حدودی با کدنویسی پایتون راحت باشید.
  • نحوه نصب کتابخانه‌های عددی پایتون مانند Numpy، Scipy، Scikit-learn، Matplotlib و BeautifulSoup را بدانید.
  • دوره رایگان پیش‌نیازهای Numpy من را بگذرانید (رایگان است، هیچ بهانه‌ای پذیرفته نیست!) تا درباره Numpy، Matplotlib، Pandas و Scikit-Learn، و همچنین اصول یادگیری ماشین (Machine Learning) بیاموزید.
  • اختیاری: اگر می‌خواهید بخش‌های ریاضی را درک کنید، آشنایی با جبر خطی و احتمال مفید خواهد بود.

سرفصل ها و درس ها

پردازش زبان طبیعی: کاربردهای آن چیست؟ Natural Language Processing - What is it used for?

  • مقدمه و سرفصل‌ها Introduction and Outline

  • چرا NLP را یاد بگیریم؟ Why Learn NLP?

  • پیام اصلی این دوره (دیدگاه کلی) The Central Message of this Course (Big Picture Perspective)

آمادگی برای دوره Course Preparation

  • چگونه در این دوره موفق شویم؟ How to Succeed in this Course

  • کد و داده‌ها را از کجا دریافت کنیم؟ Where to get the code and data

  • نحوه باز کردن فایل‌ها برای کاربران ویندوز How to Open Files for Windows Users

مرور مبانی یادگیری ماشین Machine Learning Basics Review

  • یادگیری ماشین: مقدمه بخش Machine Learning: Section Introduction

  • طبقه‌بندی چیست؟ What is Classification?

  • طبقه‌بندی در کدنویسی Classification in Code

  • رگرسیون چیست؟ What is Regression?

  • رگرسیون در کدنویسی Regression in Code

  • بردار ویژگی چیست؟ What is a Feature Vector?

  • یادگیری ماشین چیزی جز هندسه نیست Machine Learning is Nothing but Geometry

  • تمام داده‌ها یکسان هستند All Data is the Same

  • مقایسه مدل‌های مختلف یادگیری ماشین Comparing Different Machine Learning Models

  • یادگیری ماشین و یادگیری عمیق: مباحث آینده Machine Learning and Deep Learning: Future Topics

  • خلاصه بخش Section Summary

مدل‌های مارکوف Markov Models

  • مدل‌های مارکوف: مقدمه بخش Markov Models Section Introduction

  • خاصیت مارکوف The Markov Property

  • مدل مارکوف The Markov Model

  • هموارسازی احتمالات و لگاریتم احتمال Probability Smoothing and Log-Probabilities

  • ساخت طبقه‌بند متنی (تئوری) Building a Text Classifier (Theory)

  • ساخت طبقه‌بند متنی (تمرین) Building a Text Classifier (Exercise Prompt)

  • ساخت طبقه‌بند متنی (کد - بخش ۱) Building a Text Classifier (Code pt 1)

  • ساخت طبقه‌بند متنی (کد - بخش ۲) Building a Text Classifier (Code pt 2)

  • مدل زبان (تئوری) Language Model (Theory)

  • مدل زبان (تمرین) Language Model (Exercise Prompt)

  • مدل زبان (کد - بخش ۱) Language Model (Code pt 1)

  • مدل زبان (کد - بخش ۲) Language Model (Code pt 2)

  • مدل‌های مارکوف: خلاصه بخش Markov Models Section Summary

رمزگشایی رمزها Decrypting Ciphers

  • مقدمه بخش Section Introduction

  • رمزها Ciphers

  • مدل‌های زبان Language Models

  • الگوریتم‌های ژنتیک Genetic Algorithms

  • آماده‌سازی کد Code Preparation

  • کد - بخش ۱ Code pt 1

  • کد - بخش ۲ Code pt 2

  • کد - بخش ۳ Code pt 3

  • کد - بخش ۴ Code pt 4

  • کد - بخش ۵ Code pt 5

  • کد - بخش ۶ Code pt 6

  • کاربرد واقعی: کی‌لاگر صوتی Real-World Application: Acoustic Keylogger

  • نتیجه‌گیری بخش Section Conclusion

ساخت آشکارساز هرزنامه خودتان Build your own spam detector

  • ساخت آشکارساز هرزنامه خودتان - توصیف داده‌ها Build your own spam detector - description of data

  • ساخت آشکارساز هرزنامه با بیز ساده و AdaBoost - کدنویسی Build your own spam detector using Naive Bayes and AdaBoost - the code

  • نکات کلیدی از تمرین تشخیص هرزنامه Key Takeaway from Spam Detection Exercise

  • مفاهیم بیز ساده Naive Bayes Concepts

  • مفاهیم AdaBoost AdaBoost Concepts

  • انواع دیگر ویژگی‌ها Other types of features

  • پرسش و پاسخ تشخیص هرزنامه (رفع اشکال ۱) Spam Detection FAQ (Remedial #1)

  • بردار چیست؟ (رفع اشکال ۲) What is a Vector? (Remedial #2)

  • مثال هرزنامه پیامکی SMS Spam Example

  • هرزنامه پیامکی در کدنویسی SMS Spam in Code

  • جعبه پیشنهادات Suggestion Box

ساخت تحلیلگر احساسات خودتان Build your own sentiment analyzer

  • توصیف تحلیلگر احساسات Description of Sentiment Analyzer

  • مرور رگرسیون لجستیک Logistic Regression Review

  • پیش‌پردازش: توکن‌سازی Preprocessing: Tokenization

  • پیش‌پردازش: تبدیل توکن‌ها به بردارها Preprocessing: Tokens to Vectors

  • تحلیل احساسات در پایتون با استفاده از رگرسیون لجستیک Sentiment Analysis in Python using Logistic Regression

  • توسعه تحلیل احساسات Sentiment Analysis Extension

  • چگونه تحلیل احساسات را بهبود ببخشیم و پرسش و پاسخ How to Improve Sentiment Analysis & FAQ

کاوش NLTK NLTK Exploration

  • کاوش NLTK: برچسب‌گذاری نقش کلمات NLTK Exploration: POS Tagging

  • کاوش NLTK: ریشه‌یابی و لماتیزاسیون NLTK Exploration: Stemming and Lemmatization

  • کاوش NLTK: تشخیص موجودیت نامگذاری شده NLTK Exploration: Named Entity Recognition

  • NLTK بیشتر می‌خواهید؟ Want more NLTK?

تحلیل معنایی پنهان Latent Semantic Analysis

  • تحلیل معنایی پنهان - چه کاری انجام می‌دهد؟ Latent Semantic Analysis - What does it do?

  • SVD - ریاضیات نهفته در LSA SVD - The underlying math behind LSA

  • تحلیل معنایی پنهان در پایتون Latent Semantic Analysis in Python

  • تحلیل معنایی پنهان برای چه استفاده می‌شود؟ What is Latent Semantic Analysis Used For?

  • توسعه LSA Extending LSA

نوشتن بازنویس مقاله خودتان Write your own article spinner

  • مقدمه بازنویسی مقاله و مدل‌های مارکوف Article Spinning Introduction and Markov Models

  • مدل تری‌گرام Trigram Model

  • بیشتر درباره مدل‌های زبان More about Language Models

  • تمرینات پیش از کدنویسی Precode Exercises

  • نوشتن بازنویس مقاله در پایتون Writing an article spinner in Python

  • تمرینات توسعه بازنویس مقاله Article Spinner Extension Exercises

چگونه درباره NLP بیشتر یاد بگیریم؟ How to learn more about NLP

  • آنچه درباره‌اش صحبت نکردیم What we didn't talk about

ضمیمه / مقدمه پرسش‌های متداول Appendix / FAQ Intro

  • ضمیمه چیست؟ What is the Appendix?

تنظیم محیط شما (پرسش‌های متداول به درخواست دانشجو) Setting Up Your Environment (FAQ by Student Request)

  • بررسی پیش از نصب Pre-Installation Check

  • تنظیم محیط آناکوندا Anaconda Environment Setup

  • نحوه نصب Numpy, Scipy, Matplotlib, Pandas, IPython, Theano و TensorFlow How to install Numpy, Scipy, Matplotlib, Pandas, IPython, Theano, and TensorFlow

کمک اضافی با کدنویسی پایتون برای مبتدیان (پرسش‌های متداول به درخواست دانشجو) Extra Help With Python Coding for Beginners (FAQ by Student Request)

  • چگونه خودتان کدنویسی کنید (بخش ۱) How to Code by Yourself (part 1)

  • چگونه خودتان کدنویسی کنید (بخش ۲) How to Code by Yourself (part 2)

  • اثبات اینکه استفاده از Jupyter Notebook تفاوتی با عدم استفاده از آن ندارد Proof that using Jupyter Notebook is the same as not using it

  • پایتون ۲ در برابر پایتون ۳ Python 2 vs Python 3

راهبردهای یادگیری موثر برای یادگیری ماشین (پرسش‌های متداول به درخواست دانشجو) Effective Learning Strategies for Machine Learning (FAQ by Student Request)

  • چگونه در این دوره موفق شویم (نسخه طولانی) How to Succeed in this Course (Long Version)

  • آیا این برای مبتدیان است یا متخصصان؟ آکادمیک یا عملی؟ سریع یا با سرعت آهسته؟ Is this for Beginners or Experts? Academic or Practical? Fast or slow-paced?

  • نقشه راه پیش‌نیازهای یادگیری ماشین و هوش مصنوعی (بخش ۱) Machine Learning and AI Prerequisite Roadmap (pt 1)

  • نقشه راه پیش‌نیازهای یادگیری ماشین و هوش مصنوعی (بخش ۲) Machine Learning and AI Prerequisite Roadmap (pt 2)

ضمیمه / پایان پرسش‌های متداول Appendix / FAQ Finale

  • بونوس BONUS

نمایش نظرات

آموزش علم داده: پردازش زبان طبیعی (NLP) در پایتون
جزییات دوره
12 hours
90
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
51,214
4.6 از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Lazy Programmer Inc. Lazy Programmer Inc.

امروز ، بیشتر وقتم را به عنوان یک مهندس هوش مصنوعی و یادگیری ماشین با تمرکز بر یادگیری عمیق می گذرانم ، اگرچه همچنین به عنوان دانشمند داده ، مهندس داده های بزرگ و مهندس نرم افزار کامل پشته نیز شناخته شده ام. من مدرک کارشناسی ارشد خود را در رشته مهندسی کامپیوتر با گرایش یادگیری ماشین و تشخیص الگو دریافت کردم. این تجربه شامل تبلیغات آنلاین و رسانه های دیجیتالی به عنوان دانشمند داده (بهینه سازی نرخ کلیک و تبدیل) و مهندس داده های بزرگ (ساخت خطوط لوله پردازش داده) است. برخی از فناوری های کلان داده ای که من مرتباً استفاده می کنم ، Hadoop ، Pig ، Hive ، MapReduce و Spark هستند. من مدل های یادگیری عمیق را برای پیش بینی میزان کلیک و رفتار کاربر و همچنین برای پردازش تصویر و سیگنال و مدل سازی متن ایجاد کرده ام. کار من در سیستم های پیشنهادی از آموزش تقویت و فیلتر کردن مشارکتی استفاده کرده است و ما نتایج را با استفاده از تست A / B معتبر کردیم.

Lazy Programmer Team Lazy Programmer Team

مهندس هوش مصنوعی و آموزش ماشین من فوق لیسانس خود را در رشته مهندسی کامپیوتر با تخصص یادگیری ماشین و تشخیص الگو دریافت کردم. تجربه شامل تبلیغات آنلاین و رسانه های دیجیتال به عنوان یک دانشمند داده (بهینه سازی نرخ کلیک و تبدیل) و مهندس کلان داده (ساخت خطوط پردازش داده). برخی از فناوری های داده بزرگ که من اغلب استفاده می کنم Hadoop ، Pig ، Hive ، MapReduce و Spark هستند. من مدلهای یادگیری عمیقی برای پیش بینی نرخ کلیک و رفتار کاربر و همچنین پردازش تصویر و سیگنال و مدل سازی متن ایجاد کرده ام. کار من در سیستم های توصیه از یادگیری تقویتی و فیلترینگ مشارکتی استفاده کرده است و ما نتایج را با استفاده از آزمایش A/B معتبر کرده ایم.