این یک دوره عملی و کاربردی است که برای ارائه یک نمای کلی جامع از تمام مفاهیم ضروری پردازش زبان طبیعی مدرن (NLP) در پایتون طراحی شده است.
ما با مرور تاریخچه و تکامل NLP در ۷۰ سال گذشته، از جمله محبوبترین معماری فعلی، ترانسفورمرز (Transformers)، شروع خواهیم کرد. همچنین به مراحل اولیه پیشپردازش متن که برای مدلسازی لازم است، میپردازیم؛ جایی که یاد میگیرید چگونه دادهها را با پانداس (pandas) و اسپاسی (spaCy) پاکسازی و نرمالسازی کنید، سپس آن دادهها را با استفاده از شمارش کلمات و امتیازات TF-IDF به یک ماتریس سند-واژه (Document-Term Matrix) وکتورسازی کنید.
پس از آن، دوره به دو بخش تقسیم میشود:
نیمه اول، تکنیکهای سنتی یادگیری ماشین را پوشش میدهد.
نیمه دوم، رویکردهای مدرن یادگیری عمیق و مدلهای زبان بزرگ (LLM) را شامل میشود.
برای کاربردهای سنتی NLP، با تحلیل احساسات (Sentiment Analysis) جهت تعیین مثبت یا منفی بودن متن با استفاده از کتابخانه VADER شروع میکنیم. سپس، طبقهبندی متن (Text Classification) بر روی دادههای برچسبدار با Naïve Bayes و مدلسازی موضوعی (Topic Modeling) بر روی دادههای بدون برچسب با استفاده از فاکتورسازی ماتریس نامنفی (Non-Negative Matrix Factorization) را پوشش میدهیم، همه اینها با استفاده از کتابخانه scikit-learn انجام میشود.
هنگامی که درک قوی از مفاهیم بنیادی NLP پیدا کردید، به نیمه دوم دوره که به تکنیکهای مدرن NLP میپردازد، حرکت خواهیم کرد؛ این بخش شامل پیشرفتهای عمده در NLP و تغییر رویکرد علم داده در دهه گذشته است.
ما با اجزای اساسی تکنیکهای مدرن NLP، یعنی شبکههای عصبی (neural networks)، آغاز میکنیم. شما یاد خواهید گرفت که چگونه شبکههای عصبی آموزش میبینند، با اصطلاحات کلیدی مانند لایهها، گرهها، وزنها و توابع فعالسازی آشنا میشوید و سپس با معماریهای محبوب یادگیری عمیق (deep learning) و کاربردهای عملی آنها معرفی خواهید شد.
پس از آن، به ترانسفورمرز (Transformers)، معماریهای پشت LLMهای محبوبی مانند ChatGPT، Gemini و Claude میپردازیم. ما نحوه کار لایههای اصلی و وظایف آنها را پوشش میدهیم، از جمله امبدینگها (embeddings)، مکانیسم توجه (attention) و شبکههای عصبی پیشخور (feedforward neural networks). همچنین تفاوت بین مدلهای فقط-انکودر (encoder-only)، فقط-دیکودر (decoder-only) و انکودر-دیکودر (encoder-decoder) و انواع LLMهایی که در هر دسته قرار میگیرند را مرور خواهیم کرد.
در نهایت، آنچه را که با پایتون آموختهایم، به کار میبریم. ما از کتابخانه ترانسفورمرز (Transformers) Hugging Face و Model Hub آنها برای نمایش شش کاربرد عملی NLP استفاده خواهیم کرد، از جمله تحلیل احساسات (Sentiment Analysis)، تشخیص موجودیتهای نامدار (Named Entity Recognition)، طبقهبندی صفر-شات (Zero-Shot Classification)، خلاصهسازی متن (Text Summarization)، تولید متن (Text Generation) و شباهتسنجی اسناد (Document Similarity).
نصب و راهاندازی
نصب Anaconda، شروع کدنویسی پایتون در ژوپیتر نوتبوک (Jupyter Notebook) و یادگیری نحوه ایجاد یک محیط کُندا (conda) جدید برای آمادهسازی جهت این دوره
مبانی پردازش زبان طبیعی (NLP 101)
مرور مبانی پردازش زبان طبیعی (NLP)، شامل مفاهیم کلیدی، تکامل NLP در طول سالیان و کاربردها و کتابخانههای پایتون آن
پیشپردازش متن
گذر از مراحل پیشپردازش متن مورد نیاز قبل از اعمال الگوریتمهای یادگیری ماشین، شامل پاکسازی، نرمالسازی، وکتورسازی و موارد دیگر
NLP با یادگیری ماشین
انجام تحلیل احساسات، طبقهبندی متن و مدلسازی موضوعی با استفاده از روشهای سنتی NLP، شامل تکنیکهای یادگیری ماشین مبتنی بر قوانین، نظارتشده و بدون نظارت
شبکههای عصبی و یادگیری عمیق
تجزیه و تحلیل بصری مفاهیم پشت شبکههای عصبی و یادگیری عمیق، اجزای سازنده تکنیکهای مدرن NLP
ترانسفورمرز و LLMها
غرق شدن در بخشهای اصلی معماری ترانسفورمر، شامل امبدینگها، توجه (attention) و FFNs، و همچنین LLMهای محبوب برای وظایف NLP مانند BERT، GPT و غیره
ترانسفورمرز Hugging Face
معرفی کتابخانه ترانسفورمرز Hugging Face در پایتون و مرور مثالهایی از نحوه استفاده از LLMهای از پیش آموزشدیده برای انجام وظایف NLP، از جمله تحلیل احساسات، تشخیص موجودیت نامدار (NER)، طبقهبندی صفر-شات، خلاصهسازی متن، تولید متن و شباهتسنجی اسناد
مرور NLP و گامهای بعدی
مرور تکنیکهای NLP پوشش داده شده در این دوره، زمان استفاده از آنها و نحوه عمیقتر شدن و بهروز ماندن
__________
آماده شروع هستید؟ همین امروز بپیوندید و به دسترسی فوری و مادامالعمر به موارد زیر دست پیدا کنید:
۱۲.۵ ساعت ویدیوی آموزشی با کیفیت بالا
۱۳ تکلیف خانگی
۴ تمرین تعاملی
کتاب الکترونیکی پردازش زبان طبیعی در پایتون (بیش از ۲۰۰ صفحه)
فایلهای پروژه و راهحلهای قابل دانلود
پشتیبانی تخصصی و انجمن پرسش و پاسخ
۳۰ روز گارانتی رضایت Udemy
اگر شما یک دانشمند داده مشتاق یا باتجربه هستید که به دنبال یک نمای کلی کاربردی از تکنیکهای سنتی و مدرن NLP در پایتون هستید، این دوره برای شماست.
یادگیری شاد و پربار!
-آلیس ژائو (متخصص پایتون و مربی علم داده، Maven Analytics)
__________
به دنبال دورههای بیشتر در حوزه داده و هوش مصنوعی هستید؟ عبارت "Maven Analytics" را جستجو کنید تا به کتابخانه کامل دورههای ما، شامل اکسل (Excel)، پاور بیآی (Power BI)، مایاسکیوال (MySQL)، تابلو (Tableau)، یادگیری ماشین (Machine Learning) و موارد دیگر دسترسی پیدا کنید!
ببینید چرا دورههای ما جزو برترینهای Udemy هستند:
"برخی از بهترین دورههایی که تا به حال گذراندهام. من چندین زبان برنامهنویسی، اکسل، VBA و توسعه وب را مطالعه کردهام و Maven جزو بهترینهایی است که دیدهام!" راس سی.
"این چهارمین دوره من از Maven Analytics و چهارمین بررسی ۵ ستاره من است، بنابراین دیگر چیزی برای گفتن ندارم. کاش Maven زودتر در زندگی من بود!" تاتیانا ام.
"Maven Analytics باید به استاندارد جدید برای تمام دورههای تدریسشده در Udemy تبدیل شود!" جونا ام.
Maven Analytics
برنده جایزه تجزیه و تحلیل و آموزش هوش تجاری
Alice Zhao
مدرس علم داده در Maven Analytics
نمایش نظرات