آموزش پردازش زبان‌های طبیعی با یادگیری عمیق در پایتون - آخرین آپدیت

دانلود Natural Language Processing with Deep Learning in Python

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:

راهنمای جامع استخراج و پیاده‌سازی word2vec، GloVe، جاسازی کلمات و تحلیل احساسات با شبکه‌های بازگشتی

  • درک و پیاده‌سازی word2vec
  • درک متد CBOW در word2vec
  • درک متد skip-gram در word2vec
  • درک بهینه‌سازی نمونه‌برداری منفی (negative sampling) در word2vec
  • درک و پیاده‌سازی GloVe با استفاده از گرادیان کاهشی (gradient descent) و حداقل مربعات متناوب (alternating least squares)
  • استفاده از شبکه‌های عصبی بازگشتی (recurrent neural networks) برای برچسب‌گذاری اجزای کلام (parts-of-speech tagging)
  • استفاده از شبکه‌های عصبی بازگشتی برای شناسایی موجودیت نام‌گذاری شده (named entity recognition)
  • درک و پیاده‌سازی شبکه‌های عصبی بازگشتی برای تحلیل احساسات
  • درک و پیاده‌سازی شبکه‌های تنسور عصبی بازگشتی (recursive neural tensor networks) برای تحلیل احساسات
  • استفاده از Gensim برای به‌دست آوردن بردارهای کلمه از پیش آموزش‌دیده و محاسبه شباهت‌ها و قیاس‌ها
  • درک مبانی مهم برای OpenAI ChatGPT، GPT-4، DALL-E، Midjourney و Stable Diffusion

پیش‌نیازها:

  • نصب Numpy، Matplotlib، Sci-Kit Learn و Theano یا TensorFlow (که امروزه باید بسیار آسان باشد)
  • درک بک‌پروپگیشن (backpropagation) و گرادیان کاهشی (gradient descent)، و توانایی استخراج و کدنویسی معادلات آن‌ها به صورت مستقل
  • کدنویسی یک شبکه عصبی بازگشتی از پایه‌های اولیه در Theano (یا TensorFlow)، به ویژه تابع scan
  • کدنویسی یک شبکه عصبی پیش‌خور (feedforward) در Theano (یا TensorFlow)
  • تجربه با الگوریتم‌های درختی مفید است

آیا تا به حال فکر کرده‌اید که فناوری‌های هوش مصنوعی مانند OpenAI ChatGPT، GPT-4، DALL-E، Midjourney و Stable Diffusion واقعاً چگونه کار می‌کنند؟ در این دوره، شما مبانی این برنامه‌های پیشگامانه را خواهید آموخت.

در این دوره، به بررسی پردازش زبان طبیعی (NLP) با استفاده از یادگیری عمیق خواهیم پرداخت.

پیش از این، شما با برخی از اصول اولیه آشنا شده‌اید؛ از جمله اینکه چگونه بسیاری از مسائل NLP در واقع مسائل عادی یادگیری ماشین و علم داده هستند که خود را در پوششی دیگر پنهان کرده‌اند، و همچنین با روش‌های ساده و کاربردی مانند کیسه کلمات (bag-of-words) و ماتریس‌های اصطلاح-سند.

این‌ها به ما امکان دادند کارهای بسیار جالبی انجام دهیم، مانند شناسایی ایمیل‌های هرزنامه (spam)، سرودن شعر، بازنویسی مقالات و گروه‌بندی کلمات مشابه.

در این دوره به شما نشان خواهم داد که چگونه کارهای شگفت‌انگیزتری انجام دهید. در این دوره، ما نه فقط ۱، بلکه ۴ معماری جدید را یاد خواهیم گرفت.

اولین مورد، word2vec است.

در این دوره، دقیقاً به شما نشان خواهم داد که word2vec چگونه کار می‌کند، از تئوری تا پیاده‌سازی، و خواهید دید که این فقط کاربرد مهارت‌هایی است که از قبل می‌دانید.

Word2vec جالب است زیرا کلمات را به صورت جادویی به یک فضای برداری نگاشت می‌کند که در آن می‌توانید قیاس‌هایی مانند موارد زیر را بیابید:

  • پادشاه - مرد = ملکه - زن

  • فرانسه - پاریس = انگلستان - لندن

  • دسامبر - نوامبر = جولای - ژوئن

برای آن دسته از مبتدیانی که الگوریتم‌ها را دشوار می‌یابند و فقط می‌خواهند از یک کتابخانه استفاده کنند، ما کاربرد کتابخانه Gensim را برای به دست آوردن بردارهای کلمه از پیش آموزش‌دیده، محاسبه شباهت‌ها و قیاس‌ها، و اعمال این بردارهای کلمه برای ساخت طبقه‌بندی‌کننده‌های متنی نشان خواهیم داد.

ما همچنین به متد GloVe خواهیم پرداخت، که آن نیز بردارهای کلمه را پیدا می‌کند، اما از تکنیکی به نام تجزیه ماتریسی (matrix factorization) استفاده می‌کند که یک الگوریتم محبوب برای سیستم‌های توصیه‌گر (recommender systems) است.

به طور شگفت‌انگیزی، بردارهای کلمه‌ای که توسط GloVe تولید می‌شوند، به همان اندازه بردارهای تولید شده توسط word2vec خوب هستند و آموزش آن‌ها بسیار آسان‌تر است.

ما همچنین به برخی از مسائل کلاسیک NLP، مانند برچسب‌گذاری اجزای کلام (parts-of-speech tagging) و شناسایی موجودیت نام‌گذاری شده (named entity recognition) خواهیم پرداخت و از شبکه‌های عصبی بازگشتی (recurrent neural networks) برای حل آن‌ها استفاده خواهیم کرد. خواهید دید که تقریباً هر مشکلی را می‌توان با استفاده از شبکه‌های عصبی حل کرد، اما همچنین خطرات داشتن پیچیدگی بیش از حد را نیز خواهید آموخت.

در نهایت، با شبکه‌های عصبی بازگشتی (recursive neural networks) آشنا خواهید شد، که سرانجام به ما در حل مشکل نفی (negation) در تحلیل احساسات (sentiment analysis) کمک می‌کنند. شبکه‌های عصبی بازگشتی از این واقعیت بهره می‌برند که جملات دارای ساختار درختی هستند و ما سرانجام می‌توانیم از استفاده ساده‌لوحانه از کیسه کلمات (bag-of-words) فاصله بگیریم.

تمام مواد مورد نیاز برای این دوره به صورت رایگان قابل دانلود و نصب هستند. ما بیشتر کارهای خود را در Numpy، Matplotlib و Theano انجام خواهیم داد. من همیشه برای پاسخ به سوالات شما و کمک به شما در مسیر علم داده در دسترس هستم.

این دوره بر "نحوه ساخت و درک" تمرکز دارد، نه صرفاً "نحوه استفاده". هر کسی می‌تواند پس از ۱۵ دقیقه مطالعه مستندات، استفاده از یک API را یاد بگیرد. مسئله "به خاطر سپردن حقایق" نیست، بلکه "دیدن خودتان از طریق آزمایش" است. این دوره به شما یاد می‌دهد که چگونه آنچه را که در داخل مدل اتفاق می‌افتد، تجسم کنید. اگر به دنبال چیزی بیشتر از یک نگاه سطحی به مدل‌های یادگیری ماشین هستید، این دوره برای شماست.

در کلاس می‌بینمتان!

"اگر نمی‌توانید آن را پیاده‌سازی کنید، آن را نمی‌فهمید."

  • یا همانطور که فیزیکدان بزرگ، ریچارد فاینمن گفت: "آنچه را که نمی‌توانم بسازم، نمی‌فهمم."

  • دوره‌های من تنها دوره‌هایی هستند که در آن‌ها یاد می‌گیرید چگونه الگوریتم‌های یادگیری ماشین را از پایه پیاده‌سازی کنید.

  • دوره‌های دیگر به شما یاد می‌دهند که چگونه داده‌هایتان را به یک کتابخانه متصل کنید، اما آیا واقعاً برای سه خط کد به کمک نیاز دارید؟

  • بعد از انجام یک کار مشابه با ۱۰ مجموعه داده، متوجه می‌شوید که ۱۰ چیز را یاد نگرفته‌اید. شما ۱ چیز را یاد گرفته‌اید و فقط همان سه خط کد را ۱۰ بار تکرار کرده‌اید...

پیش‌نیازهای پیشنهادی:

  • حسابان (گرفتن مشتق)

  • جمع و ضرب ماتریس

  • احتمال (توزیع‌های شرطی و توام)

  • برنامه‌نویسی پایتون: if/else، حلقه‌ها (loops)، لیست‌ها (lists)، دیکشنری‌ها (dicts)، مجموعه‌ها (sets)

  • کدنویسی Numpy: عملیات ماتریسی و برداری، بارگذاری فایل CSV

  • شبکه‌های عصبی و بک‌پروپگیشن (backpropagation)، توانایی استخراج و کدنویسی الگوریتم‌های گرادیان کاهشی به صورت مستقل

  • توانایی کدنویسی یک شبکه عصبی پیش‌خور (feedforward) در Theano یا TensorFlow

  • توانایی کدنویسی یک شبکه عصبی بازگشتی / LSTM / GRU در Theano یا TensorFlow از پایه‌های اولیه، به ویژه تابع scan

  • تجربه با الگوریتم‌های درختی مفید است

ترتیب پیشنهادی برای شرکت در دوره‌های من:

  • به سخنرانی "نقشه راه پیش‌نیازهای یادگیری ماشین و هوش مصنوعی" (Machine Learning and AI Prerequisite Roadmap) مراجعه کنید (در بخش سوالات متداول (FAQ) هر یک از دوره‌های من، از جمله دوره رایگان Numpy، موجود است).

ویژگی‌های منحصر به فرد:

  • توضیح هر خط کد با جزئیات - در صورت عدم موافقت، هر زمان که خواستید به من ایمیل بزنید.

  • عدم اتلاف وقت با "تایپ" روی کیبورد مانند سایر دوره‌ها - بیایید صادق باشیم، هیچ کس واقعاً نمی‌تواند کدی ارزشمند برای یادگیری را تنها در ۲۰ دقیقه از پایه بنویسد.

  • ترسی از ریاضیات در سطح دانشگاهی وجود ندارد - جزئیات مهمی را در مورد الگوریتم‌ها دریافت کنید که سایر دوره‌ها از آن‌ها صرف نظر می‌کنند.


سرفصل ها و درس ها

کلیات، مرور و مسائل اجرایی Outline, Review, and Logistical Things

  • مقدمه، کلیات و مرور Introduction, Outline, and Review

  • چگونه در این دوره موفق شویم How to Succeed in this Course

  • کد/داده این دوره را از کجا تهیه کنیم Where to get the code / data for this course

  • داده‌های پیش‌پردازش شده ویکی‌پدیا Preprocessed Wikipedia Data

  • چگونه فایل‌ها را برای کاربران ویندوز باز کنیم How to Open Files for Windows Users

بخش مبتدی: کار با بردارهای کلمه Beginner's Corner: Working with Word Vectors

  • بردارها چه هستند؟ What are vectors?

  • قیاس کلمه چیست؟ What is a word analogy?

  • یافتن و ارزیابی بردارهای کلمه با استفاده از TF-IDF و t-SNE Trying to find and assess word vectors using TF-IDF and t-SNE

  • بردارهای کلمه از پیش آموزش‌دیده GloVe Pretrained word vectors from GloVe

  • بردارهای کلمه از پیش آموزش‌دیده word2vec Pretrained word vectors from word2vec

  • طبقه‌بندی متن با بردارهای کلمه Text Classification with word vectors

  • طبقه‌بندی متن در کد Text Classification in Code

  • استفاده از بردارهای از پیش آموزش‌دیده در ادامه دوره Using pretrained vectors later in the course

  • صندوق پیشنهادها Suggestion Box

مرور مدل‌سازی زبان و شبکه‌های عصبی Review of Language Modeling and Neural Networks

  • مقدمه بخش مرور Review Section Intro

  • بیگِرام‌ها و مدل‌های زبان Bigrams and Language Models

  • بیگِرام‌ها در کد Bigrams in Code

  • مدل بیگِرام عصبی Neural Bigram Model

  • مدل بیگِرام عصبی در کد Neural Bigram Model in Code

  • مدل بیگِرام شبکه عصبی Neural Network Bigram Model

  • مدل بیگِرام شبکه عصبی در کد Neural Network Bigram Model in Code

  • بهبود کارایی Improving Efficiency

  • بهبود کارایی در کد Improving Efficiency in Code

  • جمع‌بندی بخش مرور Review Section Summary

تعبیه‌های کلمه و Word2Vec Word Embeddings and Word2Vec

  • بازگشت بیگِرام Return of the Bigram

  • CBOW CBOW

  • Skip-Gram Skip-Gram

  • سافت‌مکس سلسله‌مراتبی Hierarchical Softmax

  • نمونه‌برداری منفی Negative Sampling

  • نمونه‌برداری منفی - جزئیات مهم Negative Sampling - Important Details

  • چرا دو ماتریس تعبیه کلمه دارم و با آنها چه کنم؟ Why do I have 2 word embedding matrices and what do I do with them?

  • ترفندهای پیاده‌سازی Word2Vec Word2Vec implementation tricks

  • طرح کلی پیاده‌سازی Word2Vec Word2Vec implementation outline

  • Word2Vec در کد با نام‌پای Word2Vec in Code with Numpy

  • تنسورفلو یا تیانو - انتخاب شما! Tensorflow or Theano - Your Choice!

  • جزئیات پیاده‌سازی Word2Vec با تنسورفلو Word2Vec Tensorflow Implementation Details

  • Word2Vec با تنسورفلو در کد Word2Vec Tensorflow in Code

  • جایگزین داده‌های ویکی‌پدیا: پیکره براون Alternative to Wikipedia Data: Brown Corpus

تعبیه‌های کلمه با استفاده از GloVe Word Embeddings using GloVe

  • مقدمه بخش GloVe GloVe Section Introduction

  • تجزیه ماتریسی برای سیستم‌های توصیه‌گر - مفاهیم پایه Matrix Factorization for Recommender Systems - Basic Concepts

  • آموزش تجزیه ماتریسی Matrix Factorization Training

  • گسترش مدل تجزیه ماتریسی Expanding the Matrix Factorization Model

  • رگولاریزاسیون برای تجزیه ماتریسی Regularization for Matrix Factorization

  • GloVe - بردارهای سراسری برای نمایش کلمه GloVe - Global Vectors for Word Representation

  • مرور روش‌های آموزش GloVe Recap of ways to train GloVe

  • GloVe در کد - گرادیان کاهشی نام‌پای GloVe in Code - Numpy Gradient Descent

  • GloVe در کد - حداقل مربعات متناوب GloVe in Code - Alternating Least Squares

  • GloVe در تنسورفلو با گرادیان کاهشی GloVe in Tensorflow with Gradient Descent

  • بصری‌سازی قیاس‌های کشور با t-SNE Visualizing country analogies with t-SNE

  • چالش فراپارامتر Hyperparameter Challenge

  • آموزش GloVe با SVD (تجزیه مقدار منفرد) Training GloVe with SVD (Singular Value Decomposition)

یکپارچه‌سازی Word2Vec و GloVe Unifying Word2Vec and GloVe

  • اطلاعات متقابل نقطه‌ای - Word2Vec به عنوان تجزیه ماتریسی Pointwise Mutual Information - Word2Vec as Matrix Factorization

  • PMI در کد PMI in Code

استفاده از شبکه‌های عصبی برای حل مسائل NLP Using Neural Networks to Solve NLP Problems

  • برچسب‌گذاری اجزای کلام (POS) Parts-of-Speech (POS) Tagging

  • چگونه می‌توان از شبکه‌های عصبی برای حل برچسب‌گذاری POS استفاده کرد؟ How can neural networks be used to solve POS tagging?

  • خط مبنای برچسب‌گذاری اجزای کلام Parts-of-Speech Tagging Baseline

  • شبکه عصبی بازگشتی برچسب‌گذاری اجزای کلام در تیانو Parts-of-Speech Tagging Recurrent Neural Network in Theano

  • شبکه عصبی بازگشتی برچسب‌گذاری اجزای کلام در تنسورفلو Parts-of-Speech Tagging Recurrent Neural Network in Tensorflow

  • چگونه یک HMM برچسب‌گذاری POS را حل می‌کند؟ How does an HMM solve POS tagging?

  • مدل پنهان مارکوف (HMM) برچسب‌گذاری اجزای کلام Parts-of-Speech Tagging Hidden Markov Model (HMM)

  • شناسایی موجودیت نام‌دار (NER) Named Entity Recognition (NER)

  • مقایسه NER و برچسب‌گذاری POS Comparing NER and POS tagging

  • خط مبنای شناسایی موجودیت نام‌دار Named Entity Recognition Baseline

  • شبکه عصبی بازگشتی شناسایی موجودیت نام‌دار در تیانو Named Entity Recognition RNN in Theano

  • شبکه عصبی بازگشتی شناسایی موجودیت نام‌دار در تنسورفلو Named Entity Recognition RNN in Tensorflow

  • چالش فراپارامتر II Hyperparameter Challenge II

شبکه‌های عصبی بازگشتی (شبکه‌های عصبی درختی) Recursive Neural Networks (Tree Neural Networks)

  • مقدمه بخش شبکه‌های عصبی بازگشتی Recursive Neural Networks Section Introduction

  • جملات به عنوان درخت Sentences as Trees

  • توصیف داده برای شبکه‌های عصبی بازگشتی Data Description for Recursive Neural Networks

  • شبکه‌های عصبی بازگشتی / شبکه‌های عصبی درختی (TNNs) چه هستند؟ What are Recursive Neural Networks / Tree Neural Networks (TNNs)?

  • ساخت یک TNN با بازگشت Building a TNN with Recursion

  • تبدیل درخت‌ها به دنباله‌ها Trees to Sequences

  • شبکه‌های عصبی تانسوری بازگشتی Recursive Neural Tensor Networks

  • RNTN در تنسورفلو (نکات) RNTN in Tensorflow (Tips)

  • RNTN در تنسورفلو (کد) RNTN in Tensorflow (Code)

  • شبکه عصبی بازگشتی در تنسورفلو با بازگشت Recursive Neural Network in TensorFlow with Recursion

مرور مبانی تیانو و تنسورفلو Theano and Tensorflow Basics Review

  • (مرور) مبانی تیانو (Review) Theano Basics

  • (مرور) شبکه عصبی تیانو در کد (Review) Theano Neural Network in Code

  • (مرور) مبانی تنسورفلو (Review) Tensorflow Basics

  • (مرور) شبکه عصبی تنسورفلو در کد (Review) Tensorflow Neural Network in Code

پیوست / پایان‌بندی پرسش‌های متداول Appendix / FAQ Finale

  • پیوست چیست؟ What is the Appendix?

راه‌اندازی محیط شما (پرسش‌های متداول به درخواست دانشجو) Setting Up Your Environment (FAQ by Student Request)

  • بررسی پیش از نصب Pre-Installation Check

  • راه‌اندازی محیط آناکوندا Anaconda Environment Setup

  • چگونه نام‌پای، سای‌پای، مت‌پلات‌لیب، پانداس، آی‌پایتون، تیانو و تنسورفلو را نصب کنیم How to install Numpy, Scipy, Matplotlib, Pandas, IPython, Theano, and TensorFlow

کمک اضافی در کدنویسی پایتون برای مبتدیان (پرسش‌های متداول به درخواست دانشجو) Extra Help With Python Coding for Beginners (FAQ by Student Request)

  • چگونه wp2txt یا WikiExtractor.py را نصب کنیم How to install wp2txt or WikiExtractor.py

  • چگونه فایل .tar.gz را از حالت فشرده خارج کنیم How to Uncompress a .tar.gz file

  • چگونه خودتان کدنویسی کنید (قسمت ۱) How to Code by Yourself (part 1)

  • چگونه خودتان کدنویسی کنید (قسمت ۲) How to Code by Yourself (part 2)

  • اثبات اینکه استفاده از ژوپیتر نوت‌بوک تفاوتی با عدم استفاده از آن ندارد Proof that using Jupyter Notebook is the same as not using it

  • پایتون ۲ در مقابل پایتون ۳ Python 2 vs Python 3

  • آیا تیانو از رده خارج شده است؟ Is Theano Dead?

استراتژی‌های یادگیری مؤثر برای یادگیری ماشین (پرسش‌های متداول به درخواست دانشجو) Effective Learning Strategies for Machine Learning (FAQ by Student Request)

  • چگونه در این دوره موفق شویم (نسخه طولانی) How to Succeed in this Course (Long Version)

  • آیا این دوره برای مبتدیان است یا متخصصان؟ آکادمیک است یا عملی؟ سریع است یا آرام؟ Is this for Beginners or Experts? Academic or Practical? Fast or slow-paced?

  • نقشه راه پیش‌نیازهای یادگیری ماشین و هوش مصنوعی (قسمت ۱) Machine Learning and AI Prerequisite Roadmap (pt 1)

  • نقشه راه پیش‌نیازهای یادگیری ماشین و هوش مصنوعی (قسمت ۲) Machine Learning and AI Prerequisite Roadmap (pt 2)

پیوست / پایان‌بندی پرسش‌های متداول Appendix / FAQ Finale

  • بونوس BONUS

نمایش نظرات

آموزش پردازش زبان‌های طبیعی با یادگیری عمیق در پایتون
جزییات دوره
12 hours
96
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
51,149
4.7 از 5
ندارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Lazy Programmer Inc. Lazy Programmer Inc.

امروز ، بیشتر وقتم را به عنوان یک مهندس هوش مصنوعی و یادگیری ماشین با تمرکز بر یادگیری عمیق می گذرانم ، اگرچه همچنین به عنوان دانشمند داده ، مهندس داده های بزرگ و مهندس نرم افزار کامل پشته نیز شناخته شده ام. من مدرک کارشناسی ارشد خود را در رشته مهندسی کامپیوتر با گرایش یادگیری ماشین و تشخیص الگو دریافت کردم. این تجربه شامل تبلیغات آنلاین و رسانه های دیجیتالی به عنوان دانشمند داده (بهینه سازی نرخ کلیک و تبدیل) و مهندس داده های بزرگ (ساخت خطوط لوله پردازش داده) است. برخی از فناوری های کلان داده ای که من مرتباً استفاده می کنم ، Hadoop ، Pig ، Hive ، MapReduce و Spark هستند. من مدل های یادگیری عمیق را برای پیش بینی میزان کلیک و رفتار کاربر و همچنین برای پردازش تصویر و سیگنال و مدل سازی متن ایجاد کرده ام. کار من در سیستم های پیشنهادی از آموزش تقویت و فیلتر کردن مشارکتی استفاده کرده است و ما نتایج را با استفاده از تست A / B معتبر کردیم.

Lazy Programmer Team Lazy Programmer Team

مهندس هوش مصنوعی و آموزش ماشین من فوق لیسانس خود را در رشته مهندسی کامپیوتر با تخصص یادگیری ماشین و تشخیص الگو دریافت کردم. تجربه شامل تبلیغات آنلاین و رسانه های دیجیتال به عنوان یک دانشمند داده (بهینه سازی نرخ کلیک و تبدیل) و مهندس کلان داده (ساخت خطوط پردازش داده). برخی از فناوری های داده بزرگ که من اغلب استفاده می کنم Hadoop ، Pig ، Hive ، MapReduce و Spark هستند. من مدلهای یادگیری عمیقی برای پیش بینی نرخ کلیک و رفتار کاربر و همچنین پردازش تصویر و سیگنال و مدل سازی متن ایجاد کرده ام. کار من در سیستم های توصیه از یادگیری تقویتی و فیلترینگ مشارکتی استفاده کرده است و ما نتایج را با استفاده از آزمایش A/B معتبر کرده ایم.