🔔 با توجه به بهبود نسبی اینترنت، آمادهسازی دورهها آغاز شده است. به دلیل تداوم برخی اختلالات، بارگذاری دورهها ممکن است با کمی تأخیر انجام شود. مدت اشتراکهای تهیهشده محفوظ است.
لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش پردازش زبانهای طبیعی با یادگیری عمیق در پایتون
- آخرین آپدیت
دانلود Natural Language Processing with Deep Learning in Python
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
راهنمای جامع استخراج و پیادهسازی word2vec، GloVe، جاسازی کلمات و تحلیل احساسات با شبکههای بازگشتی
درک و پیادهسازی word2vec
درک متد CBOW در word2vec
درک متد skip-gram در word2vec
درک بهینهسازی نمونهبرداری منفی (negative sampling) در word2vec
درک و پیادهسازی GloVe با استفاده از گرادیان کاهشی (gradient descent) و حداقل مربعات متناوب (alternating least squares)
استفاده از شبکههای عصبی بازگشتی (recurrent neural networks) برای برچسبگذاری اجزای کلام (parts-of-speech tagging)
استفاده از شبکههای عصبی بازگشتی برای شناسایی موجودیت نامگذاری شده (named entity recognition)
درک و پیادهسازی شبکههای عصبی بازگشتی برای تحلیل احساسات
درک و پیادهسازی شبکههای تنسور عصبی بازگشتی (recursive neural tensor networks) برای تحلیل احساسات
استفاده از Gensim برای بهدست آوردن بردارهای کلمه از پیش آموزشدیده و محاسبه شباهتها و قیاسها
درک مبانی مهم برای OpenAI ChatGPT، GPT-4، DALL-E، Midjourney و Stable Diffusion
پیشنیازها:
نصب Numpy، Matplotlib، Sci-Kit Learn و Theano یا TensorFlow (که امروزه باید بسیار آسان باشد)
درک بکپروپگیشن (backpropagation) و گرادیان کاهشی (gradient descent)، و توانایی استخراج و کدنویسی معادلات آنها به صورت مستقل
کدنویسی یک شبکه عصبی بازگشتی از پایههای اولیه در Theano (یا TensorFlow)، به ویژه تابع scan
کدنویسی یک شبکه عصبی پیشخور (feedforward) در Theano (یا TensorFlow)
تجربه با الگوریتمهای درختی مفید است
آیا تا به حال فکر کردهاید که فناوریهای هوش مصنوعی مانند OpenAI ChatGPT، GPT-4، DALL-E، Midjourney و Stable Diffusion واقعاً چگونه کار میکنند؟ در این دوره، شما مبانی این برنامههای پیشگامانه را خواهید آموخت.
در این دوره، به بررسی پردازش زبان طبیعی (NLP) با استفاده از یادگیری عمیق خواهیم پرداخت.
پیش از این، شما با برخی از اصول اولیه آشنا شدهاید؛ از جمله اینکه چگونه بسیاری از مسائل NLP در واقع مسائل عادی یادگیری ماشین و علم داده هستند که خود را در پوششی دیگر پنهان کردهاند، و همچنین با روشهای ساده و کاربردی مانند کیسه کلمات (bag-of-words) و ماتریسهای اصطلاح-سند.
اینها به ما امکان دادند کارهای بسیار جالبی انجام دهیم، مانند شناسایی ایمیلهای هرزنامه (spam)، سرودن شعر، بازنویسی مقالات و گروهبندی کلمات مشابه.
در این دوره به شما نشان خواهم داد که چگونه کارهای شگفتانگیزتری انجام دهید. در این دوره، ما نه فقط ۱، بلکه ۴ معماری جدید را یاد خواهیم گرفت.
اولین مورد، word2vec است.
در این دوره، دقیقاً به شما نشان خواهم داد که word2vec چگونه کار میکند، از تئوری تا پیادهسازی، و خواهید دید که این فقط کاربرد مهارتهایی است که از قبل میدانید.
Word2vec جالب است زیرا کلمات را به صورت جادویی به یک فضای برداری نگاشت میکند که در آن میتوانید قیاسهایی مانند موارد زیر را بیابید:
پادشاه - مرد = ملکه - زن
فرانسه - پاریس = انگلستان - لندن
دسامبر - نوامبر = جولای - ژوئن
برای آن دسته از مبتدیانی که الگوریتمها را دشوار مییابند و فقط میخواهند از یک کتابخانه استفاده کنند، ما کاربرد کتابخانه Gensim را برای به دست آوردن بردارهای کلمه از پیش آموزشدیده، محاسبه شباهتها و قیاسها، و اعمال این بردارهای کلمه برای ساخت طبقهبندیکنندههای متنی نشان خواهیم داد.
ما همچنین به متد GloVe خواهیم پرداخت، که آن نیز بردارهای کلمه را پیدا میکند، اما از تکنیکی به نام تجزیه ماتریسی (matrix factorization) استفاده میکند که یک الگوریتم محبوب برای سیستمهای توصیهگر (recommender systems) است.
به طور شگفتانگیزی، بردارهای کلمهای که توسط GloVe تولید میشوند، به همان اندازه بردارهای تولید شده توسط word2vec خوب هستند و آموزش آنها بسیار آسانتر است.
ما همچنین به برخی از مسائل کلاسیک NLP، مانند برچسبگذاری اجزای کلام (parts-of-speech tagging) و شناسایی موجودیت نامگذاری شده (named entity recognition) خواهیم پرداخت و از شبکههای عصبی بازگشتی (recurrent neural networks) برای حل آنها استفاده خواهیم کرد. خواهید دید که تقریباً هر مشکلی را میتوان با استفاده از شبکههای عصبی حل کرد، اما همچنین خطرات داشتن پیچیدگی بیش از حد را نیز خواهید آموخت.
در نهایت، با شبکههای عصبی بازگشتی (recursive neural networks) آشنا خواهید شد، که سرانجام به ما در حل مشکل نفی (negation) در تحلیل احساسات (sentiment analysis) کمک میکنند. شبکههای عصبی بازگشتی از این واقعیت بهره میبرند که جملات دارای ساختار درختی هستند و ما سرانجام میتوانیم از استفاده سادهلوحانه از کیسه کلمات (bag-of-words) فاصله بگیریم.
تمام مواد مورد نیاز برای این دوره به صورت رایگان قابل دانلود و نصب هستند. ما بیشتر کارهای خود را در Numpy، Matplotlib و Theano انجام خواهیم داد. من همیشه برای پاسخ به سوالات شما و کمک به شما در مسیر علم داده در دسترس هستم.
این دوره بر "نحوه ساخت و درک" تمرکز دارد، نه صرفاً "نحوه استفاده". هر کسی میتواند پس از ۱۵ دقیقه مطالعه مستندات، استفاده از یک API را یاد بگیرد. مسئله "به خاطر سپردن حقایق" نیست، بلکه "دیدن خودتان از طریق آزمایش" است. این دوره به شما یاد میدهد که چگونه آنچه را که در داخل مدل اتفاق میافتد، تجسم کنید. اگر به دنبال چیزی بیشتر از یک نگاه سطحی به مدلهای یادگیری ماشین هستید، این دوره برای شماست.
در کلاس میبینمتان!
"اگر نمیتوانید آن را پیادهسازی کنید، آن را نمیفهمید."
یا همانطور که فیزیکدان بزرگ، ریچارد فاینمن گفت: "آنچه را که نمیتوانم بسازم، نمیفهمم."
دورههای من تنها دورههایی هستند که در آنها یاد میگیرید چگونه الگوریتمهای یادگیری ماشین را از پایه پیادهسازی کنید.
دورههای دیگر به شما یاد میدهند که چگونه دادههایتان را به یک کتابخانه متصل کنید، اما آیا واقعاً برای سه خط کد به کمک نیاز دارید؟
بعد از انجام یک کار مشابه با ۱۰ مجموعه داده، متوجه میشوید که ۱۰ چیز را یاد نگرفتهاید. شما ۱ چیز را یاد گرفتهاید و فقط همان سه خط کد را ۱۰ بار تکرار کردهاید...
کدنویسی Numpy: عملیات ماتریسی و برداری، بارگذاری فایل CSV
شبکههای عصبی و بکپروپگیشن (backpropagation)، توانایی استخراج و کدنویسی الگوریتمهای گرادیان کاهشی به صورت مستقل
توانایی کدنویسی یک شبکه عصبی پیشخور (feedforward) در Theano یا TensorFlow
توانایی کدنویسی یک شبکه عصبی بازگشتی / LSTM / GRU در Theano یا TensorFlow از پایههای اولیه، به ویژه تابع scan
تجربه با الگوریتمهای درختی مفید است
ترتیب پیشنهادی برای شرکت در دورههای من:
به سخنرانی "نقشه راه پیشنیازهای یادگیری ماشین و هوش مصنوعی" (Machine Learning and AI Prerequisite Roadmap) مراجعه کنید (در بخش سوالات متداول (FAQ) هر یک از دورههای من، از جمله دوره رایگان Numpy، موجود است).
ویژگیهای منحصر به فرد:
توضیح هر خط کد با جزئیات - در صورت عدم موافقت، هر زمان که خواستید به من ایمیل بزنید.
عدم اتلاف وقت با "تایپ" روی کیبورد مانند سایر دورهها - بیایید صادق باشیم، هیچ کس واقعاً نمیتواند کدی ارزشمند برای یادگیری را تنها در ۲۰ دقیقه از پایه بنویسد.
ترسی از ریاضیات در سطح دانشگاهی وجود ندارد - جزئیات مهمی را در مورد الگوریتمها دریافت کنید که سایر دورهها از آنها صرف نظر میکنند.
سرفصل ها و درس ها
کلیات، مرور و مسائل اجرایی
Outline, Review, and Logistical Things
مقدمه، کلیات و مرور
Introduction, Outline, and Review
چگونه در این دوره موفق شویم
How to Succeed in this Course
کد/داده این دوره را از کجا تهیه کنیم
Where to get the code / data for this course
دادههای پیشپردازش شده ویکیپدیا
Preprocessed Wikipedia Data
چگونه فایلها را برای کاربران ویندوز باز کنیم
How to Open Files for Windows Users
بخش مبتدی: کار با بردارهای کلمه
Beginner's Corner: Working with Word Vectors
بردارها چه هستند؟
What are vectors?
قیاس کلمه چیست؟
What is a word analogy?
یافتن و ارزیابی بردارهای کلمه با استفاده از TF-IDF و t-SNE
Trying to find and assess word vectors using TF-IDF and t-SNE
بردارهای کلمه از پیش آموزشدیده GloVe
Pretrained word vectors from GloVe
بردارهای کلمه از پیش آموزشدیده word2vec
Pretrained word vectors from word2vec
طبقهبندی متن با بردارهای کلمه
Text Classification with word vectors
طبقهبندی متن در کد
Text Classification in Code
استفاده از بردارهای از پیش آموزشدیده در ادامه دوره
Using pretrained vectors later in the course
صندوق پیشنهادها
Suggestion Box
مرور مدلسازی زبان و شبکههای عصبی
Review of Language Modeling and Neural Networks
مقدمه بخش مرور
Review Section Intro
بیگِرامها و مدلهای زبان
Bigrams and Language Models
بیگِرامها در کد
Bigrams in Code
مدل بیگِرام عصبی
Neural Bigram Model
مدل بیگِرام عصبی در کد
Neural Bigram Model in Code
مدل بیگِرام شبکه عصبی
Neural Network Bigram Model
مدل بیگِرام شبکه عصبی در کد
Neural Network Bigram Model in Code
بهبود کارایی
Improving Efficiency
بهبود کارایی در کد
Improving Efficiency in Code
جمعبندی بخش مرور
Review Section Summary
تعبیههای کلمه و Word2Vec
Word Embeddings and Word2Vec
بازگشت بیگِرام
Return of the Bigram
CBOW
CBOW
Skip-Gram
Skip-Gram
سافتمکس سلسلهمراتبی
Hierarchical Softmax
نمونهبرداری منفی
Negative Sampling
نمونهبرداری منفی - جزئیات مهم
Negative Sampling - Important Details
چرا دو ماتریس تعبیه کلمه دارم و با آنها چه کنم؟
Why do I have 2 word embedding matrices and what do I do with them?
چگونه نامپای، سایپای، متپلاتلیب، پانداس، آیپایتون، تیانو و تنسورفلو را نصب کنیم
How to install Numpy, Scipy, Matplotlib, Pandas, IPython, Theano, and TensorFlow
کمک اضافی در کدنویسی پایتون برای مبتدیان (پرسشهای متداول به درخواست دانشجو)
Extra Help With Python Coding for Beginners (FAQ by Student Request)
چگونه wp2txt یا WikiExtractor.py را نصب کنیم
How to install wp2txt or WikiExtractor.py
چگونه فایل .tar.gz را از حالت فشرده خارج کنیم
How to Uncompress a .tar.gz file
چگونه خودتان کدنویسی کنید (قسمت ۱)
How to Code by Yourself (part 1)
چگونه خودتان کدنویسی کنید (قسمت ۲)
How to Code by Yourself (part 2)
اثبات اینکه استفاده از ژوپیتر نوتبوک تفاوتی با عدم استفاده از آن ندارد
Proof that using Jupyter Notebook is the same as not using it
پایتون ۲ در مقابل پایتون ۳
Python 2 vs Python 3
آیا تیانو از رده خارج شده است؟
Is Theano Dead?
استراتژیهای یادگیری مؤثر برای یادگیری ماشین (پرسشهای متداول به درخواست دانشجو)
Effective Learning Strategies for Machine Learning (FAQ by Student Request)
چگونه در این دوره موفق شویم (نسخه طولانی)
How to Succeed in this Course (Long Version)
آیا این دوره برای مبتدیان است یا متخصصان؟ آکادمیک است یا عملی؟ سریع است یا آرام؟
Is this for Beginners or Experts? Academic or Practical? Fast or slow-paced?
نقشه راه پیشنیازهای یادگیری ماشین و هوش مصنوعی (قسمت ۱)
Machine Learning and AI Prerequisite Roadmap (pt 1)
نقشه راه پیشنیازهای یادگیری ماشین و هوش مصنوعی (قسمت ۲)
Machine Learning and AI Prerequisite Roadmap (pt 2)
پیوست / پایانبندی پرسشهای متداول
Appendix / FAQ Finale
امروز ، بیشتر وقتم را به عنوان یک مهندس هوش مصنوعی و یادگیری ماشین با تمرکز بر یادگیری عمیق می گذرانم ، اگرچه همچنین به عنوان دانشمند داده ، مهندس داده های بزرگ و مهندس نرم افزار کامل پشته نیز شناخته شده ام.
من مدرک کارشناسی ارشد خود را در رشته مهندسی کامپیوتر با گرایش یادگیری ماشین و تشخیص الگو دریافت کردم.
این تجربه شامل تبلیغات آنلاین و رسانه های دیجیتالی به عنوان دانشمند داده (بهینه سازی نرخ کلیک و تبدیل) و مهندس داده های بزرگ (ساخت خطوط لوله پردازش داده) است. برخی از فناوری های کلان داده ای که من مرتباً استفاده می کنم ، Hadoop ، Pig ، Hive ، MapReduce و Spark هستند.
من مدل های یادگیری عمیق را برای پیش بینی میزان کلیک و رفتار کاربر و همچنین برای پردازش تصویر و سیگنال و مدل سازی متن ایجاد کرده ام.
کار من در سیستم های پیشنهادی از آموزش تقویت و فیلتر کردن مشارکتی استفاده کرده است و ما نتایج را با استفاده از تست A / B معتبر کردیم.
مهندس هوش مصنوعی و آموزش ماشین من فوق لیسانس خود را در رشته مهندسی کامپیوتر با تخصص یادگیری ماشین و تشخیص الگو دریافت کردم. تجربه شامل تبلیغات آنلاین و رسانه های دیجیتال به عنوان یک دانشمند داده (بهینه سازی نرخ کلیک و تبدیل) و مهندس کلان داده (ساخت خطوط پردازش داده). برخی از فناوری های داده بزرگ که من اغلب استفاده می کنم Hadoop ، Pig ، Hive ، MapReduce و Spark هستند. من مدلهای یادگیری عمیقی برای پیش بینی نرخ کلیک و رفتار کاربر و همچنین پردازش تصویر و سیگنال و مدل سازی متن ایجاد کرده ام. کار من در سیستم های توصیه از یادگیری تقویتی و فیلترینگ مشارکتی استفاده کرده است و ما نتایج را با استفاده از آزمایش A/B معتبر کرده ایم.
نمایش نظرات