🔔 با توجه به بهبود نسبی اینترنت، آمادهسازی دورهها آغاز شده است. به دلیل تداوم برخی اختلالات، بارگذاری دورهها ممکن است با کمی تأخیر انجام شود. مدت اشتراکهای تهیهشده محفوظ است.
لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش علم داده: پردازش زبان طبیعی (NLP) در پایتون
- آخرین آپدیت
دانلود Data Science: Natural Language Processing (NLP) in Python
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
آیا تا به حال فکر کردهاید که فناوریهای هوش مصنوعی مانند OpenAI ChatGPT، GPT-4، DALL-E، Midjourney و Stable Diffusion واقعاً چگونه کار میکنند؟ در این دوره، شما مبانی این کاربردهای پیشگامانه را خواهید آموخت.
در این دوره، شما چندین سیستم کاربردی را با استفاده از پردازش زبان طبیعی (NLP) – شاخهای از یادگیری ماشین و علم داده که با متن و گفتار سروکار دارد – خواهید ساخت. این دوره بخشی از مجموعه دورههای یادگیری عمیق من نیست، بنابراین شامل هیچ ریاضیات پیچیدهای نمیشود؛ فقط کدنویسی مستقیم در پایتون. تمام مواد آموزشی این دوره رایگان هستند.
پس از بحث مختصری درباره اینکه NLP چیست و چه کارهایی میتواند انجام دهد، شروع به ساخت ابزارهای بسیار مفید خواهیم کرد. اولین چیزی که خواهیم ساخت، یک الگوریتم رمزگشایی رمز (Cipher Decryption) است. این الگوریتمها در جنگ و جاسوسی کاربرد دارند. در این بخش، نحوه ساخت و بهکارگیری چندین ابزار مفید NLP را خواهیم آموخت، به ویژه: مدلهای زبانی سطح کاراکتر (با استفاده از اصل مارکوف) و الگوریتمهای ژنتیک.
پروژه دوم، که در آن شروع به استفاده از "یادگیری ماشین" سنتیتر میکنیم، ساخت یک تشخیصدهنده هرزنامه (Spam Detector) است. احتمالاً امروزه در مقایسه با اوایل دهه 2000، هرزنامه بسیار کمی دریافت میکنید، که دلیل آن وجود سیستمهایی مانند همین است.
در مرحله بعد، ما یک مدل برای تحلیل احساسات (Sentiment Analysis) در پایتون خواهیم ساخت. این ابزار به ما اجازه میدهد تا یک امتیاز به یک قطعه متن اختصاص دهیم که نشان میدهد چقدر مثبت یا منفی است. افراد از تحلیل احساسات در توییتر برای پیشبینی بازار سهام استفاده کردهاند.
ما به برخی ابزارها و تکنیکهای کاربردی مانند کتابخانه NLTK (Natural Language Toolkit) و تحلیل معنایی پنهان (Latent Semantic Analysis - LSA) خواهیم پرداخت.
در نهایت، دوره را با ساخت یک بازنویسنده خودکار مقاله (Article Spinner) به پایان میرسانیم. این یک مسئله بسیار دشوار است و حتی محبوبترین محصولات موجود در حال حاضر نیز آن را به درستی انجام نمیدهند. این درسها طوری طراحی شدهاند که شما را تنها به شروع کار هدایت کنند و ایدههایی برای بهبود آنها توسط خودتان ارائه دهند. پس از تسلط، میتوانید از آن به عنوان ابزاری برای سئو (SEO) یا بهینهسازی موتور جستجو استفاده کنید. بازاریابان اینترنتی در سراسر جهان عاشق شما خواهند شد اگر بتوانید این کار را برایشان انجام دهید!
این دوره بر "چگونگی ساخت و درک" تمرکز دارد، نه صرفاً "چگونگی استفاده". هر کسی میتواند پس از خواندن مستندات، در 15 دقیقه استفاده از یک API را یاد بگیرد. مسئله "به خاطر سپردن حقایق" نیست، بلکه "مشاهده مستقیم از طریق آزمایش" است. این دوره به شما میآموزد که چگونه آنچه در درون مدل اتفاق میافتد را بصریسازی کنید. اگر به دنبال درکی عمیقتر از مدلهای یادگیری ماشین هستید و نمیخواهید صرفاً نگاهی سطحی داشته باشید، این دوره برای شماست.
"اگر نمیتوانید چیزی را پیادهسازی کنید، آن را نمیفهمید."
یا همانطور که ریچارد فاینمن، فیزیکدان بزرگ، گفت: "آنچه را نتوانم بسازم، درک نمیکنم."
دورههای من تنها دورههایی هستند که در آنها یاد میگیرید چگونه الگوریتمهای یادگیری ماشین را از صفر پیادهسازی کنید.
دورههای دیگر به شما آموزش میدهند که چگونه دادههای خود را به یک کتابخانه متصل کنید، اما آیا واقعاً برای 3 خط کد به کمک نیاز دارید؟
پس از انجام همین کار با 10 مجموعه داده، متوجه میشوید که 10 چیز یاد نگرفتهاید. شما 1 چیز یاد گرفتید و فقط همان 3 خط کد را 10 بار تکرار کردید...
توسعه الگوریتم رمزگشایی رمز با استفاده از الگوریتمهای ژنتیک و مدلسازی زبان با مدلهای مارکوف
نوشتن کد تشخیص هرزنامه (Spam Detection) در پایتون
نوشتن کد تحلیل احساسات (Sentiment Analysis) در پایتون
انجام تحلیل معنایی پنهان (Latent Semantic Analysis - LSA) یا نمایه سازی معنایی پنهان (Latent Semantic Indexing) در پایتون
کسب درک و ایده برای نوشتن بازنویسنده خودکار مقاله (Article Spinner) در پایتون
درک مبانی مهم برای فناوریهایی مانند OpenAI ChatGPT، GPT-4، DALL-E، Midjourney و Stable Diffusion
پیشنیازها
پایتون را نصب کنید؛ رایگان است!
باید حداقل تا حدودی با کدنویسی پایتون راحت باشید.
نحوه نصب کتابخانههای عددی پایتون مانند Numpy، Scipy، Scikit-learn، Matplotlib و BeautifulSoup را بدانید.
دوره رایگان پیشنیازهای Numpy من را بگذرانید (رایگان است، هیچ بهانهای پذیرفته نیست!) تا درباره Numpy، Matplotlib، Pandas و Scikit-Learn، و همچنین اصول یادگیری ماشین (Machine Learning) بیاموزید.
اختیاری: اگر میخواهید بخشهای ریاضی را درک کنید، آشنایی با جبر خطی و احتمال مفید خواهد بود.
سرفصل ها و درس ها
پردازش زبان طبیعی: کاربردهای آن چیست؟
Natural Language Processing - What is it used for?
مقدمه و سرفصلها
Introduction and Outline
چرا NLP را یاد بگیریم؟
Why Learn NLP?
پیام اصلی این دوره (دیدگاه کلی)
The Central Message of this Course (Big Picture Perspective)
آمادگی برای دوره
Course Preparation
چگونه در این دوره موفق شویم؟
How to Succeed in this Course
کد و دادهها را از کجا دریافت کنیم؟
Where to get the code and data
نحوه باز کردن فایلها برای کاربران ویندوز
How to Open Files for Windows Users
مرور مبانی یادگیری ماشین
Machine Learning Basics Review
یادگیری ماشین: مقدمه بخش
Machine Learning: Section Introduction
طبقهبندی چیست؟
What is Classification?
طبقهبندی در کدنویسی
Classification in Code
رگرسیون چیست؟
What is Regression?
رگرسیون در کدنویسی
Regression in Code
بردار ویژگی چیست؟
What is a Feature Vector?
یادگیری ماشین چیزی جز هندسه نیست
Machine Learning is Nothing but Geometry
تمام دادهها یکسان هستند
All Data is the Same
مقایسه مدلهای مختلف یادگیری ماشین
Comparing Different Machine Learning Models
یادگیری ماشین و یادگیری عمیق: مباحث آینده
Machine Learning and Deep Learning: Future Topics
خلاصه بخش
Section Summary
مدلهای مارکوف
Markov Models
مدلهای مارکوف: مقدمه بخش
Markov Models Section Introduction
خاصیت مارکوف
The Markov Property
مدل مارکوف
The Markov Model
هموارسازی احتمالات و لگاریتم احتمال
Probability Smoothing and Log-Probabilities
ساخت طبقهبند متنی (تئوری)
Building a Text Classifier (Theory)
ساخت طبقهبند متنی (تمرین)
Building a Text Classifier (Exercise Prompt)
ساخت طبقهبند متنی (کد - بخش ۱)
Building a Text Classifier (Code pt 1)
ساخت طبقهبند متنی (کد - بخش ۲)
Building a Text Classifier (Code pt 2)
مدل زبان (تئوری)
Language Model (Theory)
مدل زبان (تمرین)
Language Model (Exercise Prompt)
مدل زبان (کد - بخش ۱)
Language Model (Code pt 1)
مدل زبان (کد - بخش ۲)
Language Model (Code pt 2)
مدلهای مارکوف: خلاصه بخش
Markov Models Section Summary
تنظیم محیط شما (پرسشهای متداول به درخواست دانشجو)
Setting Up Your Environment (FAQ by Student Request)
بررسی پیش از نصب
Pre-Installation Check
تنظیم محیط آناکوندا
Anaconda Environment Setup
نحوه نصب Numpy, Scipy, Matplotlib, Pandas, IPython, Theano و TensorFlow
How to install Numpy, Scipy, Matplotlib, Pandas, IPython, Theano, and TensorFlow
کمک اضافی با کدنویسی پایتون برای مبتدیان (پرسشهای متداول به درخواست دانشجو)
Extra Help With Python Coding for Beginners (FAQ by Student Request)
چگونه خودتان کدنویسی کنید (بخش ۱)
How to Code by Yourself (part 1)
چگونه خودتان کدنویسی کنید (بخش ۲)
How to Code by Yourself (part 2)
اثبات اینکه استفاده از Jupyter Notebook تفاوتی با عدم استفاده از آن ندارد
Proof that using Jupyter Notebook is the same as not using it
پایتون ۲ در برابر پایتون ۳
Python 2 vs Python 3
راهبردهای یادگیری موثر برای یادگیری ماشین (پرسشهای متداول به درخواست دانشجو)
Effective Learning Strategies for Machine Learning (FAQ by Student Request)
چگونه در این دوره موفق شویم (نسخه طولانی)
How to Succeed in this Course (Long Version)
آیا این برای مبتدیان است یا متخصصان؟ آکادمیک یا عملی؟ سریع یا با سرعت آهسته؟
Is this for Beginners or Experts? Academic or Practical? Fast or slow-paced?
نقشه راه پیشنیازهای یادگیری ماشین و هوش مصنوعی (بخش ۱)
Machine Learning and AI Prerequisite Roadmap (pt 1)
نقشه راه پیشنیازهای یادگیری ماشین و هوش مصنوعی (بخش ۲)
Machine Learning and AI Prerequisite Roadmap (pt 2)
ضمیمه / پایان پرسشهای متداول
Appendix / FAQ Finale
امروز ، بیشتر وقتم را به عنوان یک مهندس هوش مصنوعی و یادگیری ماشین با تمرکز بر یادگیری عمیق می گذرانم ، اگرچه همچنین به عنوان دانشمند داده ، مهندس داده های بزرگ و مهندس نرم افزار کامل پشته نیز شناخته شده ام.
من مدرک کارشناسی ارشد خود را در رشته مهندسی کامپیوتر با گرایش یادگیری ماشین و تشخیص الگو دریافت کردم.
این تجربه شامل تبلیغات آنلاین و رسانه های دیجیتالی به عنوان دانشمند داده (بهینه سازی نرخ کلیک و تبدیل) و مهندس داده های بزرگ (ساخت خطوط لوله پردازش داده) است. برخی از فناوری های کلان داده ای که من مرتباً استفاده می کنم ، Hadoop ، Pig ، Hive ، MapReduce و Spark هستند.
من مدل های یادگیری عمیق را برای پیش بینی میزان کلیک و رفتار کاربر و همچنین برای پردازش تصویر و سیگنال و مدل سازی متن ایجاد کرده ام.
کار من در سیستم های پیشنهادی از آموزش تقویت و فیلتر کردن مشارکتی استفاده کرده است و ما نتایج را با استفاده از تست A / B معتبر کردیم.
مهندس هوش مصنوعی و آموزش ماشین من فوق لیسانس خود را در رشته مهندسی کامپیوتر با تخصص یادگیری ماشین و تشخیص الگو دریافت کردم. تجربه شامل تبلیغات آنلاین و رسانه های دیجیتال به عنوان یک دانشمند داده (بهینه سازی نرخ کلیک و تبدیل) و مهندس کلان داده (ساخت خطوط پردازش داده). برخی از فناوری های داده بزرگ که من اغلب استفاده می کنم Hadoop ، Pig ، Hive ، MapReduce و Spark هستند. من مدلهای یادگیری عمیقی برای پیش بینی نرخ کلیک و رفتار کاربر و همچنین پردازش تصویر و سیگنال و مدل سازی متن ایجاد کرده ام. کار من در سیستم های توصیه از یادگیری تقویتی و فیلترینگ مشارکتی استفاده کرده است و ما نتایج را با استفاده از آزمایش A/B معتبر کرده ایم.
نمایش نظرات