دسترسی سریع:

مسیر:

صفحه اصلی

لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در کانال تلگرام عضو شوید.

آموزش علم داده: پردازش زبان طبیعی (NLP) در پایتون - آخرین آپدیت

دانلود Data Science: Natural Language Processing (NLP) in Python

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.

نمونه ویدیوها: (صرفا برای مشاهده نمونه ویدیو، ممکن هست نیاز به شکن داشته باشید.)

توضیحات دوره:

آیا تا به حال فکر کرده‌اید که فناوری‌های هوش مصنوعی مانند OpenAI ChatGPT، GPT-4، DALL-E، Midjourney و Stable Diffusion واقعاً چگونه کار می‌کنند؟ در این دوره، شما مبانی این کاربردهای پیشگامانه را خواهید آموخت.

در این دوره، شما چندین سیستم کاربردی را با استفاده از پردازش زبان طبیعی (NLP) – شاخه‌ای از یادگیری ماشین و علم داده که با متن و گفتار سروکار دارد – خواهید ساخت. این دوره بخشی از مجموعه دوره‌های یادگیری عمیق من نیست، بنابراین شامل هیچ ریاضیات پیچیده‌ای نمی‌شود؛ فقط کدنویسی مستقیم در پایتون. تمام مواد آموزشی این دوره رایگان هستند.

پس از بحث مختصری درباره اینکه NLP چیست و چه کارهایی می‌تواند انجام دهد، شروع به ساخت ابزارهای بسیار مفید خواهیم کرد. اولین چیزی که خواهیم ساخت، یک الگوریتم رمزگشایی رمز (Cipher Decryption) است. این الگوریتم‌ها در جنگ و جاسوسی کاربرد دارند. در این بخش، نحوه ساخت و به‌کارگیری چندین ابزار مفید NLP را خواهیم آموخت، به ویژه: مدل‌های زبانی سطح کاراکتر (با استفاده از اصل مارکوف) و الگوریتم‌های ژنتیک.

پروژه دوم، که در آن شروع به استفاده از "یادگیری ماشین" سنتی‌تر می‌کنیم، ساخت یک تشخیص‌دهنده هرزنامه (Spam Detector) است. احتمالاً امروزه در مقایسه با اوایل دهه 2000، هرزنامه بسیار کمی دریافت می‌کنید، که دلیل آن وجود سیستم‌هایی مانند همین است.

در مرحله بعد، ما یک مدل برای تحلیل احساسات (Sentiment Analysis) در پایتون خواهیم ساخت. این ابزار به ما اجازه می‌دهد تا یک امتیاز به یک قطعه متن اختصاص دهیم که نشان می‌دهد چقدر مثبت یا منفی است. افراد از تحلیل احساسات در توییتر برای پیش‌بینی بازار سهام استفاده کرده‌اند.

ما به برخی ابزارها و تکنیک‌های کاربردی مانند کتابخانه NLTK (Natural Language Toolkit) و تحلیل معنایی پنهان (Latent Semantic Analysis - LSA) خواهیم پرداخت.

در نهایت، دوره را با ساخت یک بازنویسنده خودکار مقاله (Article Spinner) به پایان می‌رسانیم. این یک مسئله بسیار دشوار است و حتی محبوب‌ترین محصولات موجود در حال حاضر نیز آن را به درستی انجام نمی‌دهند. این درس‌ها طوری طراحی شده‌اند که شما را تنها به شروع کار هدایت کنند و ایده‌هایی برای بهبود آن‌ها توسط خودتان ارائه دهند. پس از تسلط، می‌توانید از آن به عنوان ابزاری برای سئو (SEO) یا بهینه‌سازی موتور جستجو استفاده کنید. بازاریابان اینترنتی در سراسر جهان عاشق شما خواهند شد اگر بتوانید این کار را برایشان انجام دهید!

این دوره بر "چگونگی ساخت و درک" تمرکز دارد، نه صرفاً "چگونگی استفاده". هر کسی می‌تواند پس از خواندن مستندات، در 15 دقیقه استفاده از یک API را یاد بگیرد. مسئله "به خاطر سپردن حقایق" نیست، بلکه "مشاهده مستقیم از طریق آزمایش" است. این دوره به شما می‌آموزد که چگونه آنچه در درون مدل اتفاق می‌افتد را بصری‌سازی کنید. اگر به دنبال درکی عمیق‌تر از مدل‌های یادگیری ماشین هستید و نمی‌خواهید صرفاً نگاهی سطحی داشته باشید، این دوره برای شماست.

"اگر نمی‌توانید چیزی را پیاده‌سازی کنید، آن را نمی‌فهمید."

یا همانطور که ریچارد فاینمن، فیزیکدان بزرگ، گفت: "آنچه را نتوانم بسازم، درک نمی‌کنم."
دوره‌های من تنها دوره‌هایی هستند که در آن‌ها یاد می‌گیرید چگونه الگوریتم‌های یادگیری ماشین را از صفر پیاده‌سازی کنید.
دوره‌های دیگر به شما آموزش می‌دهند که چگونه داده‌های خود را به یک کتابخانه متصل کنید، اما آیا واقعاً برای 3 خط کد به کمک نیاز دارید؟
پس از انجام همین کار با 10 مجموعه داده، متوجه می‌شوید که 10 چیز یاد نگرفته‌اید. شما 1 چیز یاد گرفتید و فقط همان 3 خط کد را 10 بار تکرار کردید...

کاربردها

رمزگشایی رمزها
تشخیص هرزنامه (Spam Detection)
تحلیل احساسات (Sentiment Analysis)
بازنویسی خودکار مقالات (Article Spinning)
تحلیل معنایی پنهان (Latent Semantic Analysis - LSA)

آنچه در این دوره یاد می‌گیرید و می‌سازید:

توسعه الگوریتم رمزگشایی رمز با استفاده از الگوریتم‌های ژنتیک و مدل‌سازی زبان با مدل‌های مارکوف
نوشتن کد تشخیص هرزنامه (Spam Detection) در پایتون
نوشتن کد تحلیل احساسات (Sentiment Analysis) در پایتون
انجام تحلیل معنایی پنهان (Latent Semantic Analysis - LSA) یا نمایه سازی معنایی پنهان (Latent Semantic Indexing) در پایتون
کسب درک و ایده برای نوشتن بازنویسنده خودکار مقاله (Article Spinner) در پایتون
درک مبانی مهم برای فناوری‌هایی مانند OpenAI ChatGPT، GPT-4، DALL-E، Midjourney و Stable Diffusion

پیش‌نیازها

پایتون را نصب کنید؛ رایگان است!
باید حداقل تا حدودی با کدنویسی پایتون راحت باشید.
نحوه نصب کتابخانه‌های عددی پایتون مانند Numpy، Scipy، Scikit-learn، Matplotlib و BeautifulSoup را بدانید.
دوره رایگان پیش‌نیازهای Numpy من را بگذرانید (رایگان است، هیچ بهانه‌ای پذیرفته نیست!) تا درباره Numpy، Matplotlib، Pandas و Scikit-Learn، و همچنین اصول یادگیری ماشین (Machine Learning) بیاموزید.
اختیاری: اگر می‌خواهید بخش‌های ریاضی را درک کنید، آشنایی با جبر خطی و احتمال مفید خواهد بود.

سرفصل ها و درس ها

پردازش زبان طبیعی: کاربردهای آن چیست؟ Natural Language Processing - What is it used for?

مقدمه و سرفصل‌ها Introduction and Outline
چرا NLP را یاد بگیریم؟ Why Learn NLP?
پیام اصلی این دوره (دیدگاه کلی) The Central Message of this Course (Big Picture Perspective)

آمادگی برای دوره Course Preparation

چگونه در این دوره موفق شویم؟ How to Succeed in this Course
کد و داده‌ها را از کجا دریافت کنیم؟ Where to get the code and data
نحوه باز کردن فایل‌ها برای کاربران ویندوز How to Open Files for Windows Users

مرور مبانی یادگیری ماشین Machine Learning Basics Review

یادگیری ماشین: مقدمه بخش Machine Learning: Section Introduction
طبقه‌بندی چیست؟ What is Classification?
طبقه‌بندی در کدنویسی Classification in Code
رگرسیون چیست؟ What is Regression?
رگرسیون در کدنویسی Regression in Code
بردار ویژگی چیست؟ What is a Feature Vector?
یادگیری ماشین چیزی جز هندسه نیست Machine Learning is Nothing but Geometry
تمام داده‌ها یکسان هستند All Data is the Same
مقایسه مدل‌های مختلف یادگیری ماشین Comparing Different Machine Learning Models
یادگیری ماشین و یادگیری عمیق: مباحث آینده Machine Learning and Deep Learning: Future Topics
خلاصه بخش Section Summary

مدل‌های مارکوف Markov Models

مدل‌های مارکوف: مقدمه بخش Markov Models Section Introduction
خاصیت مارکوف The Markov Property
مدل مارکوف The Markov Model
هموارسازی احتمالات و لگاریتم احتمال Probability Smoothing and Log-Probabilities
ساخت طبقه‌بند متنی (تئوری) Building a Text Classifier (Theory)
ساخت طبقه‌بند متنی (تمرین) Building a Text Classifier (Exercise Prompt)
ساخت طبقه‌بند متنی (کد - بخش ۱) Building a Text Classifier (Code pt 1)
ساخت طبقه‌بند متنی (کد - بخش ۲) Building a Text Classifier (Code pt 2)
مدل زبان (تئوری) Language Model (Theory)
مدل زبان (تمرین) Language Model (Exercise Prompt)
مدل زبان (کد - بخش ۱) Language Model (Code pt 1)
مدل زبان (کد - بخش ۲) Language Model (Code pt 2)
مدل‌های مارکوف: خلاصه بخش Markov Models Section Summary

رمزگشایی رمزها Decrypting Ciphers

مقدمه بخش Section Introduction
رمزها Ciphers
مدل‌های زبان Language Models
الگوریتم‌های ژنتیک Genetic Algorithms
آماده‌سازی کد Code Preparation
کد - بخش ۱ Code pt 1
کد - بخش ۲ Code pt 2
کد - بخش ۳ Code pt 3
کد - بخش ۴ Code pt 4
کد - بخش ۵ Code pt 5
کد - بخش ۶ Code pt 6
کاربرد واقعی: کی‌لاگر صوتی Real-World Application: Acoustic Keylogger
نتیجه‌گیری بخش Section Conclusion

ساخت آشکارساز هرزنامه خودتان Build your own spam detector

ساخت آشکارساز هرزنامه خودتان - توصیف داده‌ها Build your own spam detector - description of data
ساخت آشکارساز هرزنامه با بیز ساده و AdaBoost - کدنویسی Build your own spam detector using Naive Bayes and AdaBoost - the code
نکات کلیدی از تمرین تشخیص هرزنامه Key Takeaway from Spam Detection Exercise
مفاهیم بیز ساده Naive Bayes Concepts
مفاهیم AdaBoost AdaBoost Concepts
انواع دیگر ویژگی‌ها Other types of features
پرسش و پاسخ تشخیص هرزنامه (رفع اشکال ۱) Spam Detection FAQ (Remedial #1)
بردار چیست؟ (رفع اشکال ۲) What is a Vector? (Remedial #2)
مثال هرزنامه پیامکی SMS Spam Example
هرزنامه پیامکی در کدنویسی SMS Spam in Code
جعبه پیشنهادات Suggestion Box

ساخت تحلیلگر احساسات خودتان Build your own sentiment analyzer

توصیف تحلیلگر احساسات Description of Sentiment Analyzer
مرور رگرسیون لجستیک Logistic Regression Review
پیش‌پردازش: توکن‌سازی Preprocessing: Tokenization
پیش‌پردازش: تبدیل توکن‌ها به بردارها Preprocessing: Tokens to Vectors
تحلیل احساسات در پایتون با استفاده از رگرسیون لجستیک Sentiment Analysis in Python using Logistic Regression
توسعه تحلیل احساسات Sentiment Analysis Extension
چگونه تحلیل احساسات را بهبود ببخشیم و پرسش و پاسخ How to Improve Sentiment Analysis & FAQ

کاوش NLTK NLTK Exploration

کاوش NLTK: برچسب‌گذاری نقش کلمات NLTK Exploration: POS Tagging
کاوش NLTK: ریشه‌یابی و لماتیزاسیون NLTK Exploration: Stemming and Lemmatization
کاوش NLTK: تشخیص موجودیت نامگذاری شده NLTK Exploration: Named Entity Recognition
NLTK بیشتر می‌خواهید؟ Want more NLTK?

تحلیل معنایی پنهان Latent Semantic Analysis

تحلیل معنایی پنهان - چه کاری انجام می‌دهد؟ Latent Semantic Analysis - What does it do?
SVD - ریاضیات نهفته در LSA SVD - The underlying math behind LSA
تحلیل معنایی پنهان در پایتون Latent Semantic Analysis in Python
تحلیل معنایی پنهان برای چه استفاده می‌شود؟ What is Latent Semantic Analysis Used For?
توسعه LSA Extending LSA

نوشتن بازنویس مقاله خودتان Write your own article spinner

مقدمه بازنویسی مقاله و مدل‌های مارکوف Article Spinning Introduction and Markov Models
مدل تری‌گرام Trigram Model
بیشتر درباره مدل‌های زبان More about Language Models
تمرینات پیش از کدنویسی Precode Exercises
نوشتن بازنویس مقاله در پایتون Writing an article spinner in Python
تمرینات توسعه بازنویس مقاله Article Spinner Extension Exercises

چگونه درباره NLP بیشتر یاد بگیریم؟ How to learn more about NLP

آنچه درباره‌اش صحبت نکردیم What we didn't talk about

ضمیمه / مقدمه پرسش‌های متداول Appendix / FAQ Intro

ضمیمه چیست؟ What is the Appendix?

تنظیم محیط شما (پرسش‌های متداول به درخواست دانشجو) Setting Up Your Environment (FAQ by Student Request)

بررسی پیش از نصب Pre-Installation Check
تنظیم محیط آناکوندا Anaconda Environment Setup
نحوه نصب Numpy, Scipy, Matplotlib, Pandas, IPython, Theano و TensorFlow How to install Numpy, Scipy, Matplotlib, Pandas, IPython, Theano, and TensorFlow

کمک اضافی با کدنویسی پایتون برای مبتدیان (پرسش‌های متداول به درخواست دانشجو) Extra Help With Python Coding for Beginners (FAQ by Student Request)

چگونه خودتان کدنویسی کنید (بخش ۱) How to Code by Yourself (part 1)
چگونه خودتان کدنویسی کنید (بخش ۲) How to Code by Yourself (part 2)
اثبات اینکه استفاده از Jupyter Notebook تفاوتی با عدم استفاده از آن ندارد Proof that using Jupyter Notebook is the same as not using it
پایتون ۲ در برابر پایتون ۳ Python 2 vs Python 3

راهبردهای یادگیری موثر برای یادگیری ماشین (پرسش‌های متداول به درخواست دانشجو) Effective Learning Strategies for Machine Learning (FAQ by Student Request)

چگونه در این دوره موفق شویم (نسخه طولانی) How to Succeed in this Course (Long Version)
آیا این برای مبتدیان است یا متخصصان؟ آکادمیک یا عملی؟ سریع یا با سرعت آهسته؟ Is this for Beginners or Experts? Academic or Practical? Fast or slow-paced?
نقشه راه پیش‌نیازهای یادگیری ماشین و هوش مصنوعی (بخش ۱) Machine Learning and AI Prerequisite Roadmap (pt 1)
نقشه راه پیش‌نیازهای یادگیری ماشین و هوش مصنوعی (بخش ۲) Machine Learning and AI Prerequisite Roadmap (pt 2)

ضمیمه / پایان پرسش‌های متداول Appendix / FAQ Finale

بونوس BONUS

برای ارسال نظر ثبت نام کنید.

نمایش نظرات

آموزش علم داده: پردازش زبان طبیعی (NLP) در پایتون

جزییات دوره

زمان دوره: 12 hours

تعداد ویدیو ها: 90

شرکت: Udemy (یودمی)

تاریخ انتشار مرجع: (آخرین آپدیت)

ثبت نام مرجع : 51,214

امتیاز مرجع: 4.6 از 5

فایل تمرین: ندارد

زیرنویس زبان اصلی: دارد

زیرنویس فارسی: (توسط هوش مصنوعی) دارد

مدرس: Lazy Programmer Inc. Lazy Programmer Team

لینک کوتاه این دوره

https://donyad.com/d/1a5092

جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

نرم افزارهای مورد نیاز

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Lazy Programmer Inc.

امروز ، بیشتر وقتم را به عنوان یک مهندس هوش مصنوعی و یادگیری ماشین با تمرکز بر یادگیری عمیق می گذرانم ، اگرچه همچنین به عنوان دانشمند داده ، مهندس داده های بزرگ و مهندس نرم افزار کامل پشته نیز شناخته شده ام. من مدرک کارشناسی ارشد خود را در رشته مهندسی کامپیوتر با گرایش یادگیری ماشین و تشخیص الگو دریافت کردم. این تجربه شامل تبلیغات آنلاین و رسانه های دیجیتالی به عنوان دانشمند داده (بهینه سازی نرخ کلیک و تبدیل) و مهندس داده های بزرگ (ساخت خطوط لوله پردازش داده) است. برخی از فناوری های کلان داده ای که من مرتباً استفاده می کنم ، Hadoop ، Pig ، Hive ، MapReduce و Spark هستند. من مدل های یادگیری عمیق را برای پیش بینی میزان کلیک و رفتار کاربر و همچنین برای پردازش تصویر و سیگنال و مدل سازی متن ایجاد کرده ام. کار من در سیستم های پیشنهادی از آموزش تقویت و فیلتر کردن مشارکتی استفاده کرده است و ما نتایج را با استفاده از تست A / B معتبر کردیم.

Lazy Programmer Team

مهندس هوش مصنوعی و آموزش ماشین من فوق لیسانس خود را در رشته مهندسی کامپیوتر با تخصص یادگیری ماشین و تشخیص الگو دریافت کردم. تجربه شامل تبلیغات آنلاین و رسانه های دیجیتال به عنوان یک دانشمند داده (بهینه سازی نرخ کلیک و تبدیل) و مهندس کلان داده (ساخت خطوط پردازش داده). برخی از فناوری های داده بزرگ که من اغلب استفاده می کنم Hadoop ، Pig ، Hive ، MapReduce و Spark هستند. من مدلهای یادگیری عمیقی برای پیش بینی نرخ کلیک و رفتار کاربر و همچنین پردازش تصویر و سیگنال و مدل سازی متن ایجاد کرده ام. کار من در سیستم های توصیه از یادگیری تقویتی و فیلترینگ مشارکتی استفاده کرده است و ما نتایج را با استفاده از آزمایش A/B معتبر کرده ایم.

آموزش علم داده: پردازش زبان طبیعی (NLP) در پایتون - آخرین آپدیت

دانلود Data Science: Natural Language Processing (NLP) in Python

کاربردها

آنچه در این دوره یاد می‌گیرید و می‌سازید:

پیش‌نیازها

پردازش زبان طبیعی: کاربردهای آن چیست؟ Natural Language Processing - What is it used for?

مقدمه و سرفصل‌ها Introduction and Outline

چرا NLP را یاد بگیریم؟ Why Learn NLP?

پیام اصلی این دوره (دیدگاه کلی) The Central Message of this Course (Big Picture Perspective)

آمادگی برای دوره Course Preparation

چگونه در این دوره موفق شویم؟ How to Succeed in this Course

کد و داده‌ها را از کجا دریافت کنیم؟ Where to get the code and data

نحوه باز کردن فایل‌ها برای کاربران ویندوز How to Open Files for Windows Users

مرور مبانی یادگیری ماشین Machine Learning Basics Review

یادگیری ماشین: مقدمه بخش Machine Learning: Section Introduction

طبقه‌بندی چیست؟ What is Classification?

طبقه‌بندی در کدنویسی Classification in Code

رگرسیون چیست؟ What is Regression?

رگرسیون در کدنویسی Regression in Code

بردار ویژگی چیست؟ What is a Feature Vector?

یادگیری ماشین چیزی جز هندسه نیست Machine Learning is Nothing but Geometry

تمام داده‌ها یکسان هستند All Data is the Same

مقایسه مدل‌های مختلف یادگیری ماشین Comparing Different Machine Learning Models

یادگیری ماشین و یادگیری عمیق: مباحث آینده Machine Learning and Deep Learning: Future Topics

خلاصه بخش Section Summary

مدل‌های مارکوف Markov Models

مدل‌های مارکوف: مقدمه بخش Markov Models Section Introduction

خاصیت مارکوف The Markov Property

مدل مارکوف The Markov Model

هموارسازی احتمالات و لگاریتم احتمال Probability Smoothing and Log-Probabilities

ساخت طبقه‌بند متنی (تئوری) Building a Text Classifier (Theory)

ساخت طبقه‌بند متنی (تمرین) Building a Text Classifier (Exercise Prompt)

ساخت طبقه‌بند متنی (کد - بخش ۱) Building a Text Classifier (Code pt 1)

ساخت طبقه‌بند متنی (کد - بخش ۲) Building a Text Classifier (Code pt 2)

مدل زبان (تئوری) Language Model (Theory)

مدل زبان (تمرین) Language Model (Exercise Prompt)

مدل زبان (کد - بخش ۱) Language Model (Code pt 1)

مدل زبان (کد - بخش ۲) Language Model (Code pt 2)

مدل‌های مارکوف: خلاصه بخش Markov Models Section Summary

رمزگشایی رمزها Decrypting Ciphers

مقدمه بخش Section Introduction

رمزها Ciphers

مدل‌های زبان Language Models

الگوریتم‌های ژنتیک Genetic Algorithms

آماده‌سازی کد Code Preparation

کد - بخش ۱ Code pt 1

کد - بخش ۲ Code pt 2

کد - بخش ۳ Code pt 3

کد - بخش ۴ Code pt 4

کد - بخش ۵ Code pt 5

کد - بخش ۶ Code pt 6

کاربرد واقعی: کی‌لاگر صوتی Real-World Application: Acoustic Keylogger

نتیجه‌گیری بخش Section Conclusion

ساخت آشکارساز هرزنامه خودتان Build your own spam detector

ساخت آشکارساز هرزنامه خودتان - توصیف داده‌ها Build your own spam detector - description of data

ساخت آشکارساز هرزنامه با بیز ساده و AdaBoost - کدنویسی Build your own spam detector using Naive Bayes and AdaBoost - the code

نکات کلیدی از تمرین تشخیص هرزنامه Key Takeaway from Spam Detection Exercise

مفاهیم بیز ساده Naive Bayes Concepts

مفاهیم AdaBoost AdaBoost Concepts

انواع دیگر ویژگی‌ها Other types of features

پرسش و پاسخ تشخیص هرزنامه (رفع اشکال ۱) Spam Detection FAQ (Remedial #1)

بردار چیست؟ (رفع اشکال ۲) What is a Vector? (Remedial #2)

مثال هرزنامه پیامکی SMS Spam Example

هرزنامه پیامکی در کدنویسی SMS Spam in Code

جعبه پیشنهادات Suggestion Box

ساخت تحلیلگر احساسات خودتان Build your own sentiment analyzer

توصیف تحلیلگر احساسات Description of Sentiment Analyzer

مرور رگرسیون لجستیک Logistic Regression Review

پیش‌پردازش: توکن‌سازی Preprocessing: Tokenization

پیش‌پردازش: تبدیل توکن‌ها به بردارها Preprocessing: Tokens to Vectors

تحلیل احساسات در پایتون با استفاده از رگرسیون لجستیک Sentiment Analysis in Python using Logistic Regression

توسعه تحلیل احساسات Sentiment Analysis Extension

چگونه تحلیل احساسات را بهبود ببخشیم و پرسش و پاسخ How to Improve Sentiment Analysis & FAQ

کاوش NLTK NLTK Exploration

کاوش NLTK: برچسب‌گذاری نقش کلمات NLTK Exploration: POS Tagging

کاوش NLTK: ریشه‌یابی و لماتیزاسیون NLTK Exploration: Stemming and Lemmatization

کاوش NLTK: تشخیص موجودیت نامگذاری شده NLTK Exploration: Named Entity Recognition

NLTK بیشتر می‌خواهید؟ Want more NLTK?

تحلیل معنایی پنهان Latent Semantic Analysis

تحلیل معنایی پنهان - چه کاری انجام می‌دهد؟ Latent Semantic Analysis - What does it do?