آموزش نقشه راه شغلی علم داده: بوت‌کمپ ۱۰۰ روزه دیتا ساینس - آخرین آپدیت

دانلود Data Science Career Path: 100 Days of Data Science Bootcamp

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:

دوره جامع علم داده برای همه: تسلط بر آمار، ریاضی، پایتون، EDA، یادگیری ماشین و عمیق در ۱۰۰ روز

  • مبانی علم داده، کاربردها و فرایند گام به گام تبدیل شدن به یک دانشمند داده را درک کنید.
  • داده‌ها را با استفاده از برنامه‌نویسی پایتون، از متغیرها و انواع داده تا حلقه‌ها، توابع و مفاهیم شی‌ءگرا تحلیل کنید.
  • مفاهیم آماری و احتمال، شامل توزیع‌ها، آزمون فرضیه و تحلیل استنباطی را با پایتون به کار ببرید.
  • پاکسازی، تبدیل و تحلیل اکتشافی داده (EDA) را با مجموعه داده‌های واقعی با استفاده از پاندا (pandas) و نام‌پای (NumPy) انجام دهید.
  • داده‌ها را به طور مؤثر با پایتون بصری‌سازی کنید؛ نمودارهای میله‌ای، هیستوگرام‌ها، نمودارهای پراکندگی، نقشه‌های حرارتی، نمودارهای جعبه‌ای و موارد دیگر ایجاد کنید.
  • ریاضیات ضروری را بیاموزید و مدل‌های یادگیری ماشین برای رگرسیون، طبقه‌بندی و خوشه‌بندی را با استفاده از سایکیت‌لرن (scikit-learn) بسازید و به درستی ارزیابی کنید.
  • بر تکنیک‌های پیشرفته یادگیری ماشین مانند اعتبارسنجی متقاطع، مهندسی ویژگی، منظم‌سازی و تنظیم هایپرپارامتر مسلط شوید.
  • روش‌های محبوب یادگیری ترکیبی (Ensemble Learning) از جمله رندوم فارست (Random Forest)، آدا بوست (AdaBoost)، کت‌بوست (CatBoost)، لایت‌جی‌بی‌ام (LightGBM) و ایکس‌جی‌بوست (XGBoost) را پیاده‌سازی کنید.
  • یادگیری عمیق را با استفاده از شبکه‌های عصبی و تنسورفلو (TensorFlow)، از پیش‌پردازش داده تا ارزیابی مدل، کشف کنید.
  • از پروژه‌ها و ارزیابی‌های واقعی برای کسب تجربه عملی و ساخت یک نمونه کار (پورتفولیو) قوی در زمینه علم داده بهره‌مند شوید.

پیش‌نیازها:

  • بدون نیاز به تجربه قبلی. شما هر آنچه برای تبدیل شدن به یک دانشمند داده در ۱۰۰ روز لازم است را خواهید آموخت.
  • دانش ریاضیات جبر در سطح مدرسه (حداقل تا پایه دهم) الزامی است. این بدان معناست که شما واجد شرایط شرکت در این دوره نیستید مگر اینکه حداقل پایه دهم تحصیلات خود را گذرانده باشید.

به «مسیر شغلی علم داده: بوت‌کمپ ۱۰۰ روزه علم داده» خوش آمدید، سفری با ساختار منحصر به فرد، فشرده و جامع که برای هر کسی که واقعاً متعهد به تبدیل شدن به یک دانشمند داده کامل و آماده به کار است – صرف نظر از پیش‌زمینه فعلی، تجربه قبلی یا سابقه تحصیلی شما – طراحی شده است.


چرا این دوره اهمیت دارد؟

بسیاری از فراگیران با منابع پراکنده، راهنمایی‌های ناهماهنگ یا محتوای نظری سنگین که مهارت عملی واقعی ایجاد نمی‌کند، دست و پنجه نرم می‌کنند. این دوره این مشکل را حل می‌کند. این دوره به گونه‌ای ساختار یافته است که پیشرفت گام به گام، انباشتی و روزانه را فراهم آورد و به شما کمک می‌کند دانش را به توانایی، و توانایی را به آمادگی شغلی تبدیل کنید.


چه چیزی خواهید آموخت – کاوشی عمیق در سفر ۱۰۰ روزه

این دوره ۱۰۰ روزه یک مرور سطحی نیست – بلکه یک نقشه راه حرفه‌ای و ساختاریافته است که دانش، مجموعه مهارت‌ها و شهود شما را در علم داده لایه به لایه می‌سازد. این دوره از یک فلسفه عملی و واقعی-محور پیروی می‌کند و از یک مجموعه داده قدرتمند تشخیص کلاهبرداری اعتباری و مجموعه‌ای از بلوک‌های یادگیری ساختاریافته استفاده می‌کند و به تدریج شما را با کل چشم‌انداز علم داده آشنا می‌سازد.

هر روز، شما به درس‌های دقیق و راهنمایی‌شده و وظایف کدنویسی عملی می‌پردازید که منعکس‌کننده کار روزانه دانشمندان داده واقعی است. در ادامه، نگاهی عمیق به آنچه در طول این سفر بر آن مسلط خواهید شد، ارائه شده است:

مبانی علم داده و برنامه نویسی پایتون

در روزهای اولیه این چالش، شما یک پایه و اساس بسیار محکم خواهید ساخت. یاد خواهید گرفت که چگونه مانند یک دانشمند داده فکر کنید – نه فقط چگونه کد بنویسید.

  • مبانی پایتون برای تحلیل داده: متغیرها، حلقه‌ها، شرطی‌ها و توابع.
  • کار با ساختارهای داده‌ای مانند لیست‌ها، دیکشنری‌ها، تاپل‌ها و مجموعه‌ها به صورت روان.
  • نوشتن کدهای تمیز، ماژولار و قابل استفاده مجدد برای جریان‌های کاری تحلیل.
  • وارد کردن و مدیریت مجموعه داده‌های واقعی با استفاده از پاندا (pandas) و نام‌پای (NumPy).
  • درک انواع داده، بهینه‌سازی حافظه و تنظیم عملکرد در دیتافریم‌ها.

تحلیل اکتشافی داده (EDA) – یافتن معنا در داده‌های خام

یکی از ضروری‌ترین مراحل در هر پروژه علم داده، EDA است، و این دوره شما را به طور عمیق و مکرر با آن درگیر می‌کند.

  • درک شکل، الگوها و ماهیت داده‌های خام.
  • بینش‌های دقیق در سطح ویژگی: بررسی توزیع‌ها، کج‌شدگی و داده‌های پرت (outliers).
  • استفاده از عملیات پیشرفته پاندا برای گروه‌بندی، فیلتر کردن، تجمیع و تغییر شکل داده‌ها.
  • بصری‌سازی روابط تک‌متغیره، دومتغیره و چندمتغیره با استفاده از:
    • سی‌بورن (Seaborn) (هیستوگرام‌ها، pairplotها، نقشه‌های حرارتی)
    • مت‌پلات‌لیب (Matplotlib) برای بصری‌سازی‌های سفارشی
  • توسعه شهود داده: پرسیدن سؤالات صحیح و فرمول‌بندی فرضیه‌ها بر اساس الگوها.
  • پاکسازی و پیش‌پردازش مجموعه داده‌ها: مدیریت مقادیر گمشده، داده‌های پرت، داده‌های تکراری و فرمت‌های ناسازگار.

احتمال و آمار برای علم داده

شما فقط فرمول‌ها را حفظ نخواهید کرد – بلکه مبانی ریاضیاتی که یادگیری ماشین و تحلیل داده را هدایت می‌کنند، درک خواهید کرد.

  • درک توزیع‌های احتمال، شامل:
    • توزیع‌های نرمال (Normal)، دوجمله‌ای (Binomial)، پواسون (Poisson)، نمایی (Exponential) و یکنواخت (Uniform)
  • یادگیری آمار توصیفی: میانگین، میانه، مد، دامنه، واریانس، انحراف معیار.
  • درک آمار استنباطی: فواصل اطمینان، آزمون فرضیه و مقادیر پی (p-values).
  • انجام آزمون‌های خی‌دو (chi-square tests)، تی-تست‌ها (t-tests) و آنووا (ANOVA) برای اعتبارسنجی بینش‌ها از داده‌ها.
  • یادگیری نحوه تفسیر نتایج آماری واقعی و ترجمه آن‌ها به تصمیمات تجاری قابل اجرا.

ریاضیات ضروری برای علم داده – ساخت شهود از اعداد

ریاضیات زبان پشت الگوریتم‌های یادگیری ماشین است، و این دوره اطمینان می‌دهد که شما فقط مدل‌ها را به صورت کورکورانه اعمال نمی‌کنید، بلکه واقعاً درک می‌کنید که چگونه و چرا کار می‌کنند. در طول این سفر، شما یک درک گام به گام از ضروری‌ترین مفاهیم ریاضیاتی که هر وظیفه تحلیل و پیش‌بینی داده را هدایت می‌کنند، خواهید ساخت.

  • مبانی جبر خطی:
    • بردارها، ماتریس‌ها و عملیات‌هایی مانند ضرب نقطه‌ای، ترانهاده و معکوس.
    • چگونگی قدرت‌بخشیدن جبر خطی به مدل‌هایی مانند رگرسیون خطی (Linear Regression) و تحلیل مؤلفه‌های اصلی (PCA).
    • نمایش ماتریسی مجموعه داده‌ها و تبدیلات.
  • مبانی حسابان (کالکولوس):
    • درک چگونگی عملکرد بهینه‌سازی از طریق مشتقات و گرادیان‌ها.
    • نقش اصلی مشتقات جزئی در آموزش مدل‌های یادگیری ماشین از طریق گرادیان کاهشی (gradient descent).
    • شهود پشت توابع هزینه (loss functions)، شیب، انحنا و همگرایی.

یادگیری ماشین – ساخت مدل‌های پیش‌بین از ابتدا

شما به تدریج دانش یادگیری ماشین خود را از سطح مبتدی به متوسط ارتقا خواهید داد و الگوریتم‌ها را مستقیماً بر روی مجموعه داده خود اعمال می‌کنید.

  • درک کامل جریان کاری یادگیری ماشین:
    • تقسیم داده، پیش‌پردازش، آموزش، اعتبارسنجی و آزمون.
  • اعمال الگوریتم‌های کلیدی طبقه‌بندی و رگرسیون از جمله:
    • رگرسیون لجستیک (Logistic Regression)، درختان تصمیم (Decision Trees)، رندوم فارست (Random Forests)، کی-نزدیکترین همسایگان (K-Nearest Neighbors)، و روش‌های پیشرفته یادگیری ترکیبی (Ensemble Methods).
  • مدیریت عدم تعادل کلاس با استفاده از تکنیک‌هایی مانند SMOTE و نمونه‌برداری طبقه‌بندی‌شده (stratified sampling).
  • یادگیری تکنیک‌های ارزیابی مدل:
    • دقت (Accuracy)، صحت (Precision)، بازیابی (Recall)، نمره F1 (F1-score)، ROC-AUC و ماتریس‌های سردرگمی (confusion matrices).
  • درک مبادله بایاس-واریانس و بیش‌برازش (overfitting) در مقابل کم‌برازش (underfitting).
  • ساخت مدل‌های قابل توضیح و تفسیر اهمیت ویژگی‌ها.

مهندسی ویژگی – ایجاد ورودی‌های هوشمند برای مدل‌ها

یاد خواهید گرفت که چگونه مجموعه داده خود را برای تغذیه معنادارتر مدل‌های یادگیری ماشین، طراحی و تبدیل کنید.

  • شناسایی ویژگی‌های نامربوط یا تکراری.
  • ایجاد متغیرهای مشتق‌شده جدید بر اساس دانش دامنه.
  • رمزگذاری یکتا (One-hot encoding)، رمزگذاری برچسب (label encoding) و کار با ویژگی‌های طبقه‌ای.
  • مقیاس‌بندی (Scaling)، نرمال‌سازی (normalizing) و تبدیل ویژگی‌های عددی.
  • ساخت پایپ‌لاین‌ها برای پیش‌پردازش و تضمین تکرارپذیری.

بهبود و ارزیابی مدل

دانستن نحوه تنظیم و پالایش مدل‌هایتان آماتورها را از حرفه‌ای‌ها جدا می‌کند – این دوره شما را در انجام این کار با دقت و خلاقیت راهنمایی خواهد کرد.

  • تکنیک‌های اعتبارسنجی متقاطع (k-fold، stratified k-fold).
  • تنظیم هایپرپارامتر با استفاده از GridSearchCV و RandomizedSearchCV.
  • درک و تفسیر منحنی‌های یادگیری (learning curves).
  • استراتژی‌های انتخاب مدل بر اساس معیارها و نیازهای کسب‌وکار.

پروژه‌های سرتاسری – مطالعات موردی واقعی

شما روی پروژه‌های واقعی کاملاً راهنمایی‌شده کار خواهید کرد که جریان کاری یک دانشمند داده حرفه‌ای را از داده‌های خام تا ارائه نهایی شبیه‌سازی می‌کند.

  • پرداختن به پروژه طبقه‌بندی بهترین مهاجمان با پیاده‌سازی مدل سرتاسری.
  • مستندسازی کل فرایند: از EDA، مدل‌سازی، تنظیم تا ارتباط نتایج.
  • یادگیری نحوه تبدیل دفترچه‌های ژوپیتر (Jupyter notebooks) به نمونه‌کارها و گزارش‌های حرفه‌ای.
  • پرورش مهارت‌های داستان‌سرایی برای ارتباط مؤثر یافته‌های خود با مخاطبان فنی و غیرفنی.

تفکر علم داده و مهارت‌های نرم

در طول دوره، شما ذهنیت و عادات یک دانشمند داده را خواهید ساخت، از جمله:

  • پرسیدن سؤالات هوشمندانه و تحلیلی برای درک مسائل کسب‌وکار.
  • پرورش صبر برای رفع اشکال، تکرار و پالایش راه‌حل‌ها.
  • نوشتن توضیحات (کامنت) کد و مستندات واضح.
  • تمرین روزانه برای ساخت انعطاف‌پذیری و سرعت حل مسئله.


چگونه این دوره شما را متحول خواهد کرد؟

اگر منظم باشید و این نقشه راه ۱۰۰ روزه را دنبال کنید، از نداشتن دانش قبلی به توانایی‌های زیر دست خواهید یافت:

  • با اطمینان بر روی مجموعه داده‌های واقعی کار کرده و تحلیل مستقل انجام دهید.
  • مدل‌های یادگیری ماشین را در سناریوهای واقعی بسازید، تنظیم و استقرار دهید.
  • مبانی ریاضیاتی روش‌های کلیدی علم داده را درک کنید.
  • یک نمونه کار پروژه‌ای (پورتفولیو) ایجاد کنید که شایسته مصاحبه‌های شغلی و فرصت‌های فریلنسری باشد.
  • مسلط به زبان داده صحبت کرده و در تصمیمات مبتنی بر داده در هر تیمی مشارکت کنید.
  • واجد شرایط شدن برای نقش‌های سطح ابتدایی تا متوسط در علم داده، مهندسی یادگیری ماشین یا تحلیلگری.

این فقط یک دوره نیست – بلکه یک مسیر تحول کامل است که مملو از مهارت‌های عملی و تکالیف اعتماد به نفس‌ساز است.



چرا چالش ۱۰۰ روزه؟

مهارت‌های بزرگ یک‌شبه آموخته نمی‌شوند – بلکه با تلاش مداوم و متمرکز ساخته می‌شوند. رویکرد چالش ۱۰۰ روزه به شما کمک می‌کند تا:

  • عادات روزانه یادگیری و حل مسئله را توسعه دهید.
  • با پیروی از یک سرعت ساختاریافته، از خستگی بیش از حد (burnout) جلوگیری کنید.
  • از طریق یک مسیر روزانه روشن، نظم و مسئولیت‌پذیری را بسازید.
  • تسلط تدریجی را پرورش دهید – جایی که هر مفهوم و ابزار منطقی به نظر می‌رسد زیرا به طور منطقی از آنچه روز قبل انجام داده‌اید، ساخته می‌شود.

با دنبال کردن روش چالش، شما فقط محتوا را مصرف نمی‌کنید – بلکه به یک خالق، متخصص و متفکر در زمینه علم داده تبدیل می‌شوید.



یک محدودیت صادقانه

این دوره برای فراگیرانی که محتوای بسیار بصری یا متحرک را ترجیح می‌دهند، مناسب نیست. سبک تدریس بر درس‌های متنی، کد-محور و غنی از توضیح، با تأکید بر عمق، وضوح و کاربرد عملی متمرکز است. در حالی که نمودارها و شکل‌ها در صورت لزوم گنجانده شده‌اند، رویکرد اصلی یادگیری، مطالعه، انجام و تفکر غوطه‌ور است – نه تماشای انیمیشن.



نکته پایانی: آنچه برای موفقیت لازم است

این دوره به صبر، نظم و سخت‌کوشی نیاز دارد. این دوره به گونه‌ای طراحی شده است که کامل و چالش‌برانگیز باشد – زیرا برتری در علم داده را نمی‌توان شتاب‌زده به دست آورد. اگر به این فرایند متعهد شوید، حتی زمانی که دشوار می‌شود ادامه دهید و به ساختار اعتماد کنید – نه تنها با دانش، بلکه با قدرت واقعی برای حل مسائل داده و ساخت یک شغل ظاهر خواهید شد.

اگر آماده‌اید مسئولیت رشد خود را بر عهده بگیرید، سفری دقیق را در آغوش بکشید و مجموعه‌ای از مهارت‌ها را بسازید که در سراسر جهان مورد احترام است – پس این چالش ۱۰۰ روزه علم داده، همراهی عالی برای شماست.


سرفصل ها و درس ها

IMPORTANT Messages for you!

  • رد نکنید، از اینجا شروع کنید! Don't skip, Start from here!

  • نحوه گذراندن کلاس‌ها How to take the classes

  • همین حالا بازپرداخت بگیرید، اگر... Take a refund now, if....

  • چیزی اضافه برای شما! Something Extra for you!

مرحله 1: دنیای علم داده ------- Phase 1: The world of Data Science -------

  • یادداشت‌هایی بر دنیای علم داده! Notes on Data Science World!

روز 1: مقدمه‌ای بر علم داده Day 1: Introduction to Data Science

  • پیام‌های مهم برای شما! Important Messages for You!

  • علم داده چیست؟ What is Data Science

  • مبانی علم داده Fundamentals of Data Science

  • مسیر تبدیل شدن به یک دانشمند داده The path to be a Data Scientist

  • ارزیابی دانش 1 Knowledge Assessment 1

روز 2: حوزه علم داده – بخش 1 Day 2: The Field of Data Science - PART 1

  • تحلیل داده Data Analysis

  • هوش تجاری Business Intelligence

  • مدل‌سازی آماری Statistical Modeling

  • ارزیابی دانش 2 Knowledge Assessment 2

روز 3: حوزه علم داده – بخش 2 Day 3: The Field of Data Science - PART 2

  • یادگیری ماشین Machine Learning

  • یادگیری عمیق Deep Learning

  • هوش مصنوعی Artificial Intelligence

  • ارزیابی دانش 3 Knowledge Assessment 3

روز 4: نقش داده در علم داده Day 4: The role of Data in Data Science

  • داده سنتی در مقابل داده بزرگ (Big Data) Traditional Data vs Big Data

  • کار با داده بزرگ (Big Data) Working with Big Data

  • مثال‌های واقعی از داده بزرگ (Big Data) Real - life examples of Big data

  • ارزیابی دانش 4 Knowledge Assessment 4

روز 5: ابزارهای علم داده Day 5: Tools of Data Science

  • ابزارهای مدیریت پایگاه داده Database management tools

  • زبان‌های برنامه‌نویسی Programming languages

  • ابزارهای تحلیل داده 360 360 Data analytics tools

  • ابزارهای بصری‌سازی داده Data visualization tools

  • محیط‌های توسعه Development environments

  • ارزیابی دانش 5 Knowledge Assessment 5

روز 6: متدولوژی علم داده Day 6: Data Science Methodology

  • گام 1 – درک کسب‌وکار Step 1 - Business understanding

  • گام 2 – جمع‌آوری داده Step 2 - Data collection

  • گام 3 – آماده‌سازی داده Step 3 - Data preparation

  • گام 4 – مدل‌سازی داده Step 4 - Data modeling

  • گام 5 – ارزیابی مدل Step 5 - Model evaluation

  • گام 6 – استقرار مدل Step 6 - Model deployment

  • ارزیابی دانش 6 Knowledge Assessment 6

مرحله 2: پایتون برای علم داده ------- Phase 2: Python for Data Science -------

  • نصب پایتون و ژوپیتر نوت‌بوک Installing Python & Jupyter notebook

  • یادداشت‌هایی درباره پایتون برای علم داده Notes on Python for data science

  • مجموعه‌داده‌های استفاده شده در این مرحله Datasets used in this phase

روز 7: عبارات و متغیرهای پایتون Day 7: Python Expressions & Variables

  • عبارات و متغیرها Expressions and Variables

  • تمرین عملی: عبارات و متغیرها Hands-on: Expressions and Variables

  • شروع با برنامه‌نویسی پایتون Starting with python programming

روز 8: انواع داده در پایتون Day 8: Python Data Types

  • درک انواع داده Understanding Data Types

  • تمرین عملی: انواع داده Hands-on: Data Types

  • تبدیل انواع داده #1 Converting data types #1

  • تبدیل انواع داده #2 Converting data types #2

  • تبدیل انواع داده #3 Converting data types #3

روز 9: عملگرهای رشته‌ای پایتون Day 9: Python String Operators

  • عملگرهای رشته‌ای مختلف Various String Operators

  • تمرین عملی: عملگرهای رشته‌ای Hands-on: String Operators

  • شروع از متغیرها تا انواع داده Starting with Variables to Data Types

روز 10: تاپل‌ها و لیست‌های پایتون Day 10: Python Tuples and Lists

  • درک تاپل‌ها و لیست‌ها Understanding Tuples and Lists

  • تمرین عملی: تاپل‌ها و لیست‌ها Hands-on: Tuples and Lists

  • ایجاد لیست Creating list

  • ایندکس‌گذاری لیست Indexing list

  • برش دادن لیست (Slicing) Slicing list

  • افزودن عناصر Adding elements

  • حذف عناصر Removing elements

  • جایگزینی عناصر Replacing elements

روز 11: عملگرهای مجموعه (Set) در پایتون Day 11: Python Set operators

  • درک مجموعه (Set) Understanding Set

  • تمرین عملی: عملگرهای مجموعه (Set) Hands-on: Set operators

  • یکپارچه‌سازی مجموعه Set integration

  • کاهش مجموعه Set reduction

روز 12: دیکشنری‌ها در پایتون Day 12: Python Dictionaries

  • درک دیکشنری‌ها Understanding Dictionaries

  • تمرین عملی: دیکشنری‌ها Hands-on: Dictionaries

  • ایجاد دیکشنری Create dictionary

  • افزودن کلیدها و مقادیر Adding keys and values

روز 13: شرطی‌ها در پایتون Day 13: Python Conditionals

  • شرط و انشعاب Condition and Branching

  • تمرین عملی: شرط و انشعاب Hands-on: Condition & Branching

  • دستور شرطی #1 Conditional statement #1

  • دستور شرطی #2 Conditional statement #2

  • عبارت منطقی #1 Logical expression #1

  • عبارت منطقی #2 Logical expression #2

  • عبارت منطقی #3 Logical expression #3

روز 14: تکرارکننده‌ها در پایتون Day 14: Python Iteratives

  • حلقه‌ها برای تکرار Loops for Iteration

  • تمرین عملی: حلقه‌ها Hands-on: Loops

  • حلقه For For loop

  • حلقه While While loop

روز 15: توابع پایتون Day 15: Python Functions

  • توسعه توابع Developing Functions

  • تمرین عملی: توابع Hands-on: Functions

  • کار با تابع #1 Dealing with function #1

روز 16: شیء و کلاس‌ها در پایتون Day 16: Python Object & Classes

  • شیء و کلاس‌ها Object and Classes

  • تمرین عملی: شیء و کلاس‌ها Hands-on: Object & Classes

  • کار با تابع #2 Dealing with function #2

روز 17: وب اسکرپینگ در پایتون Day 17: Python Web Scrapping

  • API, REST API و درخواست (Request) API, REST API & Request

  • HTML و BeautifulSoup HTML and BeautifulSoup

  • آزمایشگاه عملی: BeautifulSoup Hands-on Lab: BeautifulSoup

  • وب اسکرپینگ در پایتون Web scrapping in Python

روز 18: خواندن و نوشتن فایل‌ها Day 18: Reading and Writing files

  • خواندن و نوشتن با Pandas Reading and Writing with Pandas

  • آزمایشگاه عملی: وارد کردن مجموعه‌داده‌ها Hands-on Lab: Importing datasets

  • خواندن و نوشتن JSON و XML Reading and Writing JASON & XML

  • آزمایشگاه عملی: وارد کردن JSON و XML Hands-on Lab: Importing JASON & XML

  • خواندن فایل‌ها با پایتون Reading Files with Python

مرحله 3: احتمال و توزیع ------- Phase 3: Probability and Distribution -------

  • یادداشت‌هایی درباره احتمال و توزیع Notes on Probability & Distribution

روز 19: شروع با احتمال Day 19: Getting started with Probability

  • احتمال چیست؟ What is probability?

  • مقدار مورد انتظار در مقابل مقدار واقعی Expected value v/s Actual value

  • فراوانی در احتمال Frequency in probability

  • مکمل‌ها در احتمال Complements in probability

  • ارزیابی دانش 7 Knowledge Assessment 7

روز 20: ترکیبیات در احتمال Day 20: Combinatorics in Probability

  • مقدمه‌ای بر ترکیبیات Intro to combinatorics

  • جایگشت‌ها Permutations

  • عملیات فاکتوریل‌ها Factorials operations

  • ترکیب‌ها Combinations

  • ارزیابی دانش 8 Knowledge Assessment 8

روز 21: استنتاج بیزی Day 21: Bayesian Inference

  • مجموعه‌های متقابلاً انحصاری Mutually exclusive sets

  • وابستگی‌های مجموعه Set dependencies

  • احتمال شرطی Conditional probability

  • ارزیابی دانش 10 Knowledge Assessment 10

روز 22: قوانین احتمال Day 22: The law of Probability

  • قانون جمع The additive rule

  • قانون ضرب The multiplication law

  • قانون بیز The bayes' law

  • ارزیابی دانش 11 Knowledge Assessment 11

روز 23: درک داده‌های آماری Day 23: Understanding Statistical data

  • جامعه آماری و نمونه Population and Sample

  • انواع داده‌های آماری Types of Statistical data

  • سطح اندازه‌گیری Level of Measurement

  • ارزیابی دانش 15 Knowledge Assessment 15

روز 24: توزیع‌های احتمال Day 24: Probability Distributions

  • مقدمه‌ای بر توزیع‌ها Intro to Distributions

  • توزیع‌های گسسته Discrete distributions

  • توزیع‌های پیوسته Continuous distributions

  • ارزیابی دانش 12 Knowledge Assessment 12

روز 25: توزیع‌های احتمال – گسسته Day 25: Probability Distributions - Discrete

  • توزیع یکنواخت Uniform distribution

  • توزیع برنولی Bernoulli distribution

  • توزیع دو جمله‌ای Binomial distribution

  • توزیع پواسون Poisson distribution

  • ارزیابی دانش 13 Knowledge Assessment 13

روز 26: توزیع‌های احتمال – پیوسته Day 26: Probability Distributions - Continuous

  • توزیع نرمال Normal distribution

  • توزیع تی استیودنت Students' T distribution

  • توزیع کای-دو Chi-squared distribution

  • توزیع نمایی Exponential distribution

  • ارزیابی دانش 14 Knowledge Assessment 14

مرحله 4: پاکسازی و دستکاری داده ------- Phase 4: Data cleaning & Manipulation -------

  • یادداشت‌هایی درباره پاکسازی داده Notes on Data cleaning

  • مجموعه‌داده‌ها برای فازهای 4 تا 9 Datasets for Phase 4 to 9

روز 27: تعریف مقادیر گمشده Day 27: Define Missing values

  • درک مقادیر گمشده Understanding Missing values

  • پایتون برای شناسایی مقادیر گمشده Python for missing value identification

  • تمرین عملی: شناسایی مقادیر گمشده Hands-on: Missing value identification

  • شناسایی مقادیر گمشده Identify missing value

روز 28: پر کردن مقادیر گمشده (Imputing) Day 28: Imputing Missing Values

  • درک پر کردن مقادیر (Imputation) Understanding Imputation

  • پایتون برای پر کردن مقادیر گمشده Python for missing value imputation

  • تمرین عملی: پر کردن مقادیر گمشده Hands-on: Imputing missing values

  • پر کردن مقادیر گمشده Imputing missing values

روز 29: انواع داده در دیتافریم (Dataframe) Day 29: Dataframe's Data Types

  • انواع داده در دیتافریم Dataframe's data types

  • پایتون برای تغییر نوع داده (casting) Python for casting data types

  • تمرین عملی: انواع داده در دیتافریم Hands-on: Data types in dataframe

  • بررسی نوع داده Checking data type

  • تخصیص نوع داده Assigning data type

روز 30: مقابله با ناسازگاری‌ها Day 30: Dealing with Inconsistencies

  • مقدار ناسازگار چیست؟ What is Inconsistent value?

  • پایتون برای مقابله با ناسازگاری‌ها Python for dealing inconsistencies

  • تمرین عملی: کار با ناسازگاری‌ها Hands-on: Working with inconsistencies

  • یافتن مقادیر منحصر به فرد Finding the unique values

  • حذف مقادیر ناسازگار Removing inconsistent value

روز 31: مقابله با موارد تکراری Day 31: Dealing with Duplicates

  • درک موارد تکراری Understanding duplicates

  • پایتون برای مقابله با موارد تکراری Python for dealing duplicates

  • تمرین عملی: کار با موارد تکراری Hands-on Working with duplicates

  • شناسایی موارد تکراری Identify duplicates

  • حذف موارد تکراری Removing duplicates

روز 32: مرتب‌سازی ترتیب داده‌ها Day 32: Sorting data order

  • مرتب‌سازی داده چیست؟ What is data sorting?

  • پایتون برای مرتب‌سازی داده Python for sorting data

  • تمرین عملی: مرتب‌سازی داده Hands-on: Sorting data

  • مرتب‌سازی مجموعه‌داده dataset sorting

روز 33: برش دادن دیتافریم (Slicing) Day 33: Slicing Dataframe

  • درک برش دادن (Slicing) Understanding slicing

  • پایتون برای برش دادن داده Python for data slicing

  • تمرین عملی: برش دادن داده Hands-on: Data slicing

  • برش دادن با loc Slicing with loc

  • برش دادن با iloc Slicing with iloc

روز 34: فیلتر کردن دیتافریم (Dataframe) Day 34: Filtering Dataframe

  • روش‌های فیلتر کردن داده Methods of Data filtering

  • پایتون برای فیلتر کردن داده Python for data filtering

  • تمرین عملی: فیلتر کردن داده Hands-on: Data filtering

  • فیلتر کردن بولین Boolean filtering

  • شرایط چندگانه Multiple conditions

روز 35: ادغام دیتافریم‌ها (Dataframes) Day 35: Merging Dataframes

  • درک ادغام داده Understanding data merge

  • پایتون برای ادغام داده Python for merging data

  • تمرین عملی: ادغام دیتافریم‌ها Hands-on: Merging dataframes

  • ادغام دیتافریم‌ها Merging dataframes

روز 36: اتصال دیتافریم‌ها (Concatenating) Day 36: Concatenating Dataframes

  • درک اتصال (Concatenation) Understanding concatenation

  • پایتون برای اتصال Python for concatenation

  • تمرین عملی: اتصال داده Hands-on: Data concatenation

  • اتصال دیتافریم‌ها Concatenating dataframes

مرحله 5: تحلیل اکتشافی داده (EDA) و بصری‌سازی داده ------- Phase 5: EDA and Data Visualizations -------

  • یادداشت‌هایی درباره تحلیل اکتشافی داده Notes on Exploratory data analysis

  • مجموعه‌داده مورد استفاده در این مرحله Dataset used in this phase

روز 37: تحلیل فراوانی و درصد Day 37: Frequency & Percentage Analysis

  • درک فراوانی و درصد Understanding Frequency & Percentage

  • پایتون برای تحلیل فراوانی-درصد Python for frequency-percentage analysis

  • تمرین عملی: فراوانی و درصد Hands-on: Frequency & Percentage

  • متد شمارش مقادیر (Value counts) Value counts method

روز 38: آمار توصیفی Day 38: Descriptive Statistics

  • میانگین، میانه و مد Mean, Median and Mode

  • چولگی و کشیدگی Skewness and Kurtosis

  • واریانس و کوواریانس Variance and Covariance

  • انحراف معیار Standard deviation

  • ارزیابی دانش 16 Knowledge Assessment 16

روز 39: تحلیل توصیفی با پایتون Day 39: Python Descriptive Analysis

  • پایتون برای تحلیل توصیفی Python for descriptive analysis

  • تمرین عملی: تحلیل توصیفی Hands-on: Descriptive analysis

  • آمار توصیفی Descriptive statistics

روز 40: تحلیل داده با Group-by Day 40: Group-by data analysis

  • تحلیل داده با Group-by Group-by data analysis

  • پایتون برای تحلیل Group-by Python for group-by analysis

  • تمرین عملی: تحلیل Group-by Hands-on: Group-by analysis

  • متد Group by Group by method

روز 41: تحلیل جدول محوری (PIVOT table) Day 41: PIVOT table analysis

  • تحلیل جدول محوری (PIVOT table) PIVOT table analysis

  • پایتون برای تحلیل جدول محوری (PIVOT table) Python for PIVOT table analysis

  • تمرین عملی: تحلیل جدول محوری (PIVOT table) Hands-on: PIVOT table analysis

  • تحلیل جدول محوری (PIVOT table) PIVOT table analysis

روز 42: تحلیل جدول متقاطع (Cross-tab) Day 42: Cross-tab analysis

  • تحلیل جدول متقاطع (Cross-tab) Cross-tab analysis

  • پایتون برای تحلیل جدول متقاطع (Cross-tab) Python for Cross-tab analysis

  • تمرین عملی: تحلیل جدول متقاطع (Cross-tab) Hands-on: Cross-tab analysis

  • تحلیل جدول متقاطع (Cross-tab) Cross-tab analysis

روز 43: بصری‌سازی نمودار میله‌ای (Bar Chart) Day 43: Bar Chart Visualization

  • موارد استفاده نمودار میله‌ای Use cases of Bar chart

  • پایتون برای ایجاد نمودار میله‌ای Python for creating bar chart

  • تمرین عملی: ایجاد نمودار میله‌ای Hands-on: Creating bar chart

  • نمودار میله‌ای Bar chart

  • نمودار میله‌ای خوشه‌ای Clustered bar plot

روز 44: بصری‌سازی نمودار دایره‌ای (Pie Chart) Day 44: Pie Chart Visualization

  • موارد استفاده نمودار دایره‌ای Use cases of pie chart

  • پایتون برای ایجاد نمودار دایره‌ای Python for creating pie chart

  • تمرین عملی: نمودار دایره‌ای Hands-on: Pie chart

  • نمودار دایره‌ای Pie chart

روز 45: بصری‌سازی نمودار خطی (Line Chart) Day 45: Line Chart Visualization

  • موارد استفاده نمودار خطی Use cases of line chart

  • پایتون برای ایجاد نمودار خطی Python for creating line chart

  • تمرین عملی: نمودار خطی Hands-on: Line chart

  • نمودار خطی Line chart

روز 46: بصری‌سازی هیستوگرام (Histogram) Day 46: Histogram Visualization

  • مورد استفاده هیستوگرام Use case of Histogram

  • پایتون برای ایجاد هیستوگرام Python for creating histogram

  • تمرین عملی: هیستوگرام Hands-on: Histogram

  • هیستوگرام Histogram

روز 47: بصری‌سازی نمودار پراکندگی (Scatterplot) Day 47: Scatterplot Visualization

  • موارد استفاده نمودار پراکندگی Use cases of Scatterplot

  • پایتون برای ایجاد نمودار پراکندگی Python for creating Scatterplot

  • تمرین عملی: نمودار پراکندگی Hands-on: Scatterplot

  • نمودار پراکندگی Scatterplot

روز 48: بصری‌سازی نقشه‌حرارتی (Heatmap) Day 48: Heatmap Visualization

  • موارد استفاده نقشه‌حرارتی Use cases of Heatmap

  • پایتون برای ایجاد نقشه‌حرارتی Python for creating Heatmap

  • تمرین عملی: نقشه‌حرارتی Hands-on: Heatmap

  • نقشه‌حرارتی Heatmap

روز 49: بصری‌سازی نمودار جعبه‌ای (Box-plot) Day 49: Box-plot Visualization

  • موارد استفاده نمودار جعبه‌ای Use cases of Box-plot

  • پایتون برای ایجاد نمودار جعبه‌ای Python for creating Box-plot

  • تمرین عملی: نمودار جعبه‌ای Hands-on: Box-plot

  • نمودار جعبه‌ای Boxplot

مرحله 6: آمار استنباطی و مدل‌سازی آماری ------- Phase 6: Inferential Statistics & Statistical Modeling -------

  • یادداشت‌هایی درباره آمار استنباطی Notes on Inferential statistics

روز 50: کاوش آمار استنباطی Day 50: Exploring Inferential Statistics

  • آمار استنباطی چیست؟ What is inferential statistics

  • قضیه حد مرکزی Central limit theorem

  • خطای استاندارد Standard error

  • برآوردگرها و برآوردها Estimators and estimates

  • ارزیابی دانش 17 Knowledge Assessment 17

روز 51: اصول آمار استنباطی Day 51: Essentials of Inferential Statistics

  • فاصله اطمینان Confidence interval

  • Z-score در مقابل T-score Z-score v/s T-score

  • حاشیه خطا Margin of error

  • فرضیه صفر در مقابل فرضیه جایگزین Null v/s Alternative Hypothesis

  • خطای نوع I و نوع II Type | and Type || Error

  • ارزیابی دانش 18 Knowledge Assessment 18

روز 52: پنج گام در آزمون فرضیه Day 52: Five-steps in Hypothesis Testing

  • گام 1: تدوین فرضیه‌ها Step 1: Formulate the Hypotheses

  • گام 2: انتخاب سطح معنی‌داری Step 2: Select Significance level

  • گام 3: انجام آزمون فرض Step 3: Perform assumption test

  • گام 4: انجام آزمون مناسب Step 4: Perform appropriate test

  • گام 5: تصمیم‌گیری و نتیجه‌گیری Step 5: Decision and Conclusion

  • ارزیابی دانش 19 Knowledge Assessment 19

روز 53: بررسی توزیع Day 53: Investigating distribution

  • Kdeplot برای توزیع Kdeplot for distribution

  • پایتون برای ایجاد Kdeplot Python for creating Kdeplot

  • تمرین عملی: Kdeplot Hands-on: Kdeplot

  • Kdeplot برای توزیع Kdeplot for distribution

روز 54: آزمون نرمالیتی (Normality Test) Day 54: Normality Test

  • آزمون شاپیرو-ویلک Shapiro Wilk test

  • پایتون برای آزمون شاپیرو-ویلک Python for Shapiro Wilk test

  • تمرین عملی: آزمون شاپیرو-ویلک Hands-on: Shapiro Wilk test

  • آزمون نرمالیتی Normality test

روز 55: تبدیل داده Day 55: Data Transformation

  • روش‌های تبدیل داده Data transformations methods

  • پایتون برای تبدیل داده Python for data transformation

  • تمرین عملی: تبدیل داده Hands-on: Data transformation

  • تبدیل SQRT SQRT transformation

  • تبدیل LOG LOG transformation

  • تبدیل BOXCOX BOXCOX transformation

روز 56: آزمون تی نمونه‌های مستقل Day 56: T-test Independent sample

  • آزمون تی نمونه‌های مستقل Independent sample t-test

  • پایتون برای آزمون تی نمونه‌های مستقل Python for Independent sample t-test

  • تمرین عملی: آزمون تی نمونه‌های مستقل Hands-on: Independent sample t-test

  • آزمون تی نمونه‌های مستقل Independent sample t-test

روز 57: آزمون تی یک نمونه‌ای Day 57: T-test one sample

  • آزمون تی یک نمونه‌ای One sample t-test

  • پایتون برای آزمون تی یک نمونه‌ای Python for One sample t-test

  • تمرین عملی: آزمون تی یک نمونه‌ای Hands-on: One sample t-test

  • آزمون تی یک نمونه‌ای One sample t-test

روز 58: تحلیل واریانس Day 58: Analysis of Variance

  • تحلیل واریانس Analysis of Variance

  • پایتون برای تحلیل واریانس Python for Analysis of Variance

  • تمرین عملی: تحلیل واریانس Hands-on: Analysis of Variance

  • آزمون لوین (Levene) Levene's test

  • تحلیل واریانس Analysis of Variance

روز 59: آزمون کای-دو Day 59: Chi - Square test

  • آزمون کای-دو Chi square test

  • پایتون برای آزمون کای-دو Python for Chi square test

  • تمرین عملی: آزمون کای-دو Hands-on: Chi square test

  • آزمون کای-دو Chi square test

روز 60: آزمون همبستگی پیرسون Day 60: Pearson Correlation Test

  • همبستگی پیرسون Pearson correlation

  • پایتون برای همبستگی پیرسون Python for Pearson correlation

  • تمرین عملی: همبستگی پیرسون Hands-on: Pearson correlation

  • همبستگی پیرسون Pearson correlation

روز 61: تحلیل رگرسیون خطی Day 61: Linear Regression Analysis

  • تحلیل رگرسیون خطی Linear regression analysis

  • پایتون برای رگرسیون خطی Python for Linear regression

  • تمرین عملی: رگرسیون خطی Hands-on: Linear regression

  • رگرسیون خطی Linear Regression

مرحله 7: مهندسی ویژگی (Feature Engineering) و پیش‌پردازش داده ------- Phase 7: Feature Engineering & Data Preprocessing -------

  • یادداشت‌هایی درباره مهندسی ویژگی (Feature Engineering) Notes on Feature engineering

  • مجموعه‌داده‌ها برای این مرحله Datasets for this phase

روز 62: تولید ویژگی‌های جدید Day 62: Generating new features

  • چگونه ویژگی جدید تولید کنیم؟ How to generate new feature?

  • پایتون برای تولید ویژگی‌های جدید Python for generating new features

  • تمرین عملی: تولید ویژگی‌های جدید Hands-on: Generating new features

  • تولید ویژگی Feature generation

روز 63: استخراج عناصر تاریخ Day 63: Extracting date elements

  • چرا این مهم است؟ Why is it important?

  • پایتون برای استخراج عناصر تاریخ Python for extracting date elements

  • تمرین عملی: استخراج عناصر تاریخ Hands-on: Extracting date elements

  • استخراج روز، ماه و سال Extracting day, month and year

روز 64: رمزگذاری ویژگی (Feature encoding) Day 64: Feature encoding

  • چه زمانی ویژگی را رمزگذاری کنیم؟ When to encode feature

  • پایتون برای رمزگذاری ویژگی Python for encoding feature

  • تمرین عملی: رمزگذاری ویژگی Hands-on: Feature encoding

  • رمزگذاری ویژگی Feature encoding

روز 65: دسته‌بندی ویژگی (Feature binning) Day 65: Feature binning

  • چه زمانی ویژگی را دسته‌بندی کنیم؟ When to bin feature

  • پایتون برای دسته‌بندی ویژگی Python for binning feature

  • تمرین عملی: دسته‌بندی ویژگی Hands-on: Feature binning

  • دسته‌بندی ویژگی Feature binning

روز 66: نگاشت ویژگی (Feature mapping) Day 66: Feature mapping

  • چه زمانی ویژگی را نگاشت کنیم؟ When to map feature

  • پایتون برای نگاشت ویژگی Python for mapping feature

  • تمرین عملی: نگاشت ویژگی Hands-on: Feature mapping

  • نگاشت ویژگی Feature mapping

روز 67: تولید متغیرهای ساختگی (dummies) Day 67: Generating dummies

  • چه زمانی متغیرهای ساختگی تولید کنیم؟ When to generate dummies

  • پایتون برای تولید متغیرهای ساختگی Python for generating dummies

  • تمرین عملی: تولید متغیرهای ساختگی hands-on: Generating dummies

  • تولید متغیرهای ساختگی Generating dummies

روز 68: انتخاب ویژگی (Feature selection) Day 68: Feature selection

  • چرا ضروری است؟ Why it is necessary?

  • پایتون برای انتخاب ویژگی Python for Feature selection

  • تمرین عملی: انتخاب ویژگی Hand-on: Feature selection

  • انتخاب ویژگی Feature selection

روز 69: مقیاس‌گذاری ویژگی (Feature scaling) Day 69: Feature scaling

  • روش‌های مقیاس‌گذاری ویژگی Methods of Feature scaling

  • پایتون برای مقیاس‌گذاری ویژگی‌ها Python for scaling features

  • تمرین عملی: مقیاس‌گذاری ویژگی Hands-on: Feature scaling

  • مقیاس‌گذاری استاندارد (Standard scaling) Standard scaling

  • مقیاس‌گذاری MinMax MinMax Scaling

روز 70: کاهش ابعاد (Dimensionality reduction) Day 70: Dimensionality reduction

  • What is Dimensionality reduction?

  • پایتون برای کاهش ابعاد Python for Dimensionality reduction

  • عملی: کاهش ابعاد Hands-on: Dimensionality reduction

  • نسبت واریانس توضیح داده شده Explained variance ratio

  • انتخاب n_component Select n_component

  • تحلیل مؤلفه‌های اصلی Principal component analysis

روز ۷۱: تقسیم مجموعه داده Day 71: Splitting Dataset

  • چرا لازم است؟ Why it is necessary?

  • پایتون برای مجموعه داده‌های آموزش-آزمایش Python for train-test set

  • عملی: مجموعه داده‌های آموزش-آزمایش Hands-on: Train-test set

  • تقسیم آموزش-آزمایش Train test split

-------- فاز ۸: یادگیری ماشین [پیش‌نیاز] ------- ------- Phase 8: Machine Learning [Prerequisite] -------

  • نکاتی درباره یادگیری ماشین Notes on Machine Learning

روز ۷۲: ریاضیات ضروری - بخش ۱ Day 72: Essential Mathematics PART 1

  • ماتریس چیست؟ What is Matrix?

  • اسکالرها و بردارها Scalars and Vectors

  • مقدمه‌ای بر جبر خطی Linear algebra introduction

  • ارزیابی دانش ۲۰ Knowledge Assessment 20

روز ۷۳: ریاضیات ضروری - بخش ۲ Day 73: Essential Mathematics PART 2

  • تنسور چیست؟ What is Tensor?

  • ترانهاده ماتریس Transpose of Matrix

  • ضرب نقطه‌ای و ماتریس Dot product and Matrix

  • ارزیابی دانش ۲۱ Knowledge Assessment 21

روز ۷۴: مقدمه‌ای بر یادگیری ماشین Day 74: Introduction to Machine learning

  • یادگیری ماشین چیست؟ What is Machine learning?

  • مدل‌های رگرسیون نظارت شده Supervised Regression models

  • مدل‌های طبقه‌بندی نظارت شده Supervised Classification models

  • مدل‌های خوشه‌بندی بدون نظارت Unsupervised clustering models

  • ارزیابی دانش ۲۲ Knowledge Assessment 22

روز ۷۵: ارزیابی و اعتبارسنجی Day 75: Evaluation and Validation

  • معیارهای ارزیابی مدل Model evaluating metrics

  • بیش‌برازش و کم‌برازش Overfitting & Underfitting

  • مشکل داده نامتوازن Imbalanced data problem

  • ارزیابی دانش ۲۳ Knowledge Assessment 23

-------- فاز ۹: یادگیری ماشین عملی [از A تا Z] ------- ------- Phase 9: Hands-on Machine Learning [A - Z] -------

  • نکاتی درباره یادگیری ماشین Notes on Machine learning

  • مجموعه داده‌های تمرینی مورد استفاده در این فاز Practice datasets used for this phase

روز ۷۶: مدل رگرسیون خطی Day 76: Linear Regression Model

  • رگرسیون خطی چگونه کار می‌کند How Linear regression works

  • پایتون برای مدل رگرسیون خطی Python for Linear regression model

  • عملی: مدل رگرسیون خطی Hands-on: Linear regression model

  • ساخت رگرسیون خطی Build Linear Regression

  • پیش‌بینی با رگرسیون خطی Prediction with Linear Regression

  • ارزیابی مدل Model evaluation

روز ۷۷: مدل رگرسیون لجستیک Day 77: Logistic Regression Model

  • رگرسیون لجستیک چگونه کار می‌کند How Logistic regression works

  • پایتون برای رگرسیون لجستیک Python for logistic regression

  • عملی: رگرسیون لجستیک Hands-on: Logistic Regression

  • ساخت رگرسیون لجستیک Build Logistic Regression

  • ارزیابی مدل LGR Evaluate the LGR model

روز ۷۸: مقابله با بیش‌برازش - روش ۱ Day 78: Dealing with overfitting - Method 1

  • اعتبارسنجی متقاطع K-fold K-fold cross validation

  • پایتون برای اعتبارسنجی متقاطع Python for cross-validation

  • عملی: اعتبارسنجی متقاطع k-fold Hands-on: k-fold cross validation

  • اعتبارسنجی متقاطع K-fold K-fold cross validation

روز ۷۹: مقابله با بیش‌برازش - روش ۲ Day 79: Dealing with overfitting - Method 2

  • رگولاریزاسیون L1, L2 L1, L2 regularization

  • پایتون برای رگولاریزاسیون Python for regularization

  • عملی: رگولاریزاسیون مدل Hands-on: Model regularization

  • رگولاریزاسیون L1 و L2 L1 & L2 regularization

روز ۸۰: حل مشکل داده نامتوازن - روش ۱ Day 80: Solving imbalanced data - Method 1

  • روش نمونه‌برداری بیش از حد (oversampling) The oversampling method

  • پایتون برای روش‌های نمونه‌برداری بیش از حد Python for oversampling methods

  • عملی: روش‌های نمونه‌برداری بیش از حد Hands-on: oversampling methods

  • SMOTE - نمونه‌برداری بیش از حد SMOTE - oversampling

روز ۸۱: حل مشکل داده نامتوازن - روش ۲ Day 81: Solving imbalanced data - Method 2

  • روش نمونه‌برداری کمتر از حد (undersampling) The undersampling method

  • پایتون برای روش‌های نمونه‌برداری کمتر از حد Python for undersampling methods

  • عملی: روش‌های نمونه‌برداری کمتر از حد Hands-on: Undersampling methods

  • Tomek Links - نمونه‌برداری کمتر از حد Tomek Links - Undersampling

روز ۸۲: مدل خوشه‌بندی KMeans Day 82: KMeans Clustering Model

  • خوشه‌بندی KMeans چگونه کار می‌کند How KMeans clustering works

  • پایتون برای خوشه‌بندی KMeans Python for KMeans clustering

  • عملی: خوشه‌بندی KMeans Hands-on: KMeans clustering

  • محاسبه WCSS Calculating WCSS

  • رسم نمودار آرنجی Plotting Elbow chart

  • ساخت خوشه KMeans Building KMeans cluster

روز ۸۳: مدل رگرسیون درخت تصمیم Day 83: Decision Tree Regression Model

  • رگرسیون درخت تصمیم چگونه کار می‌کند How Decision tree regression works

  • پایتون برای رگرسیون درخت تصمیم Python for decision tree regression

  • عملی: رگرسیون درخت تصمیم Hands-on: Decision tree regression

  • رگرسیون درخت تصمیم Decision tree regression

روز ۸۴: مدل طبقه‌بندی درخت تصمیم Day 84: Decision Tree Classification Model

  • طبقه‌بندی درخت تصمیم چگونه کار می‌کند How Decision tree classification works

  • پایتون برای طبقه‌بندی درخت تصمیم Python for Decision tree classification

  • عملی: طبقه‌بندی درخت تصمیم Hands-on: Decision tree classification

  • طبقه‌بندی درخت تصمیم Decision tree classification

روز ۸۵: مدل رگرسیون جنگل تصادفی Day 85: Random Forest Regression Model

  • رگرسیون جنگل تصادفی چگونه کار می‌کند How Random forest regression works

  • پایتون برای رگرسیون جنگل تصادفی Python for Random forest regression

  • عملی: رگرسیون جنگل تصادفی Hands-on: Random forest regression

  • رگرسیون جنگل تصادفی Random forest regression

روز ۸۶: مدل طبقه‌بندی جنگل تصادفی Day 86: Random Forest Classification Model

  • طبقه‌بندی جنگل تصادفی چگونه کار می‌کند How Random forest classification works

  • پایتون برای طبقه‌بندی جنگل تصادفی Python for Random forest classification

  • عملی: طبقه‌بندی جنگل تصادفی Hands-on: Random forest classification

  • طبقه‌بندی جنگل تصادفی Random forest classification

روز ۸۷: مدل‌های AdaBoost Day 87: AdaBoost Models

  • مدل‌های AdaBoost چگونه کار می‌کنند How AdaBoost Models work

  • پایتون برای مدل‌های AdaBoost Python for AdaBoost Models

  • عملی: مدل‌های AdaBoost Hands-on: AdaBoost Models

  • مدل طبقه‌بندی AdaBoost AdaBoost Classification Model

روز ۸۸: مدل GBM سنتی Day 88: Traditional GBM Model

  • GBM سنتی چگونه کار می‌کند How Traditional GBM works

  • پایتون برای مدل GBM سنتی Python for Traditional GBM Model

  • عملی: مدل GBM سنتی Hands-on: Traditional GBM Model

  • مدل طبقه‌بندی GBM سنتی Trad GBM Classification Model

روز ۸۹: مدل‌های CatBoost Day 89: CatBoost Models

  • مدل‌های CatBoost چگونه کار می‌کنند How CatBoost Models work

  • پایتون برای مدل‌های CatBoost Python for CatBoost Models

  • عملی: مدل‌های CatBoost Hands-on: CatBoost Models

  • مدل طبقه‌بندی CatBoost CatBoost Classification Model

روز ۹۰: مدل‌های LightGBM Day 90: LightGBM Models

  • مدل‌های LightGBM چگونه کار می‌کنند How LightGBM Models work

  • پایتون برای مدل‌های LightGBM Python for LightGBM Models

  • عملی: مدل‌های LightGBM Hands-on: LightGBM Models

  • طبقه‌بند LightGBM LightGBM Classifier

روز ۹۱: مدل‌های XGBoost Day 91: XGBoost Models

  • مدل‌های XGBoost چگونه کار می‌کنند How XGBoost Models work

  • پایتون برای مدل‌های XGBoost Python for XGBoost Models

  • عملی: مدل‌های XGBoost Hands-on: XGBoost Models

  • مدل‌های XGBoost XGBoost Models

روز ۹۲: تنظیم هایپرپارامتر Day 92: Hyper-parameter Tuning

  • تنظیم هایپرپارامتر چیست؟ What is Hyperparameter tuning?

  • پایتون برای تنظیم هایپرپارامتر Python for Hyperparameter tuning

  • عملی: تنظیم هایپرپارامتر Hands-on: Hyperparameter tuning

  • جستجوی بیزین CV Bayes search CV

-------- فاز ۱۰: یادگیری عمیق و هوش مصنوعی ------- ------- Phase 10: Deep Learning & Artificial Intelligence -------

  • نکاتی درباره یادگیری عمیق Notes on Deep learning

روز ۹۳: مبانی یادگیری عمیق Day 93: Fundamentals of Deep Learning

  • درک یادگیری عمیق Understanding Deep Learning

  • شبکه‌های عصبی در یادگیری عمیق Neural Networks in Deep Learning

  • TensorFlow چیست؟ What is TensorFlow?

  • TensorFlow 2.0 چگونه کار می‌کند How TensorFlow 2.0 works

  • ارزیابی دانش ۲۴ Knowledge Assessment 24

روز ۹۴: مقداردهی اولیه و نزول گرادیان Day 94: Initialization & Gradient Descent

  • مقداردهی اولیه چیست؟ What is Initialization?

  • مقداردهی اولیه گلوروت Glorot Initialization

  • نزول گرادیان تصادفی Stochastic Gradient Descent

  • ارزیابی دانش ۲۵ Knowledge Assessment 25

روز ۹۵: یادگیری عمیق در زندگی واقعی Day 95: Deep Learning in Real-life

  • درک داده Understanding the data

  • پیش‌پردازش داده Preprocessing the data

  • آموزش مدل Model training

  • ارزیابی مدل Model evaluation

  • حل مشکل واقعی با یادگیری عمیق Solve Real problem with Deep Learning

روز ۹۶: مبانی هوش مصنوعی Day 96: AI Fundamentals

  • هوش مصنوعی و جریان کاری آن چیست؟ What is AI and AI workflow?

  • انواع مختلف هوش مصنوعی Various types of Artificial intelligence

  • هوش مصنوعی مولد و موارد استفاده آن Generative AI and Its use cases

  • NLP، فناوری گفتار و بینایی کامپیوتر NLP, Speech Technology & Computer vision

  • ارزیابی دانش ۲۶ Knowledge Assessment 26

روز ۹۷: مهندسی پرامپت Day 97: Prompt Engineering

  • پرامپت چیست؟ What is Prompt?

  • مهندسی پرامپت The Prompt engineering

  • بهترین روش‌ها در PE Best practices in PE

  • الگوی مصاحبه PE Interview pattern of PE

  • ارزیابی دانش ۲۷ Knowledge Assessment 27

روز ۹۸: توسعه هوش مصنوعی مولد تبدیل متن به تصویر Day 98: Gen AI Text-to-Image Development

  • مروری بر پروژه Project overview

  • دیفیوزرها - پایپ‌لاین انتشار پایدار Diffusers - Stable Diffusion Pipeline

  • runwayml/stable-diffusion-v1-5 runwayml/stable-diffusion-v1-5

  • توسعه مدل هوش مصنوعی مولد تبدیل متن به تصویر Developing Gen AI Text to Image Model

  • آزمایشگاه عملی: هوش مصنوعی مولد Text2Image Hands-on Lab: Gen AI Text2Image

روز ۹۹: توسعه ربات چت هوش مصنوعی مولد Day 99: Gen AI Chatbot Development

  • مروری بر پروژه Project overview

  • مدل Gemma-2-2b برای ربات چت Gemma-2-2b Model for Chatbot

  • مدل Llama-2-7b برای ربات چت Llama-2-7b Model for Chatbot

  • توسعه ربات چت هوش مصنوعی مولد Developing Gen AI Chatbot

  • آزمایشگاه عملی: ربات چت هوش مصنوعی مولد Hands-on Lab: Gen AI Chatbot

روز ۱۰۰ - علم داده در دنیای واقعی Day 100 - Data Science in Real World

  • طبقه‌بندی بهترین مهاجمان Classifying the Best Strikers

پیوست - مدیریت داده از A تا Z با SQL APPENDIX - Data Management A-Z with SQL

  • RDBMS: مثال و اهمیت RDBMS: example and importance

  • ویژگی‌های کلیدی RDBMS Key features of RDBMS

  • کلید اصلی در مقابل کلید خارجی Primary key v/s Foreign key

  • انواع رابطه در RDBMS Types of relationship in RDBMS

  • انواع داده در RDBMS Data types in RDBMS

  • نصب MySQL در ویندوز و مک Installing MySQL in Windows and Mac

  • بارگذاری مجموعه داده CSV در MySQL Loading CSV dataset in MySQL

  • ایجاد پایگاه داده Creating database

  • انتخاب پایگاه داده Selecting database

  • اصلاح پایگاه داده Modifying database

  • حذف پایگاه داده Deleting database

  • SELECT....FROM: انتخاب داده از جدول SELECT....FROM: select data from table

  • DISTINCT: انتخاب مقادیر منحصربه‌فرد برای ستون DISTINCT: selecting unique values for column

  • AS: انتخاب ستون‌ها بر اساس نام مستعار AS: selecting columns based on aliases

  • WHERE: انتخاب داده بر اساس شرط WHERE: selecting data based on condition

  • CREATE: ایجاد جدول CREATE: creating table

  • NOT NULL: محدود کردن مقادیر Null NOT NULL: limiting null values

  • UNIQUE: محدود کردن تکراری‌ها UNIQUE: limiting duplicates

  • INSERT INTO: افزودن مقادیر در ستون‌ها INSERT INTO: adding values in columns

  • UPDATE: به‌روزرسانی مقادیر بر اساس شرط UPDATE: updating values based on condition

  • DELETE: حذف مقادیر بر اساس شرط DELETE: deleting values based on condition

  • TRUNCATE: حذف همه مقادیر به جز جدول TRUNCATE: deleting all the values except table

  • DROP: حذف کل جدول DROP: removing entire table

  • CHECK: محدود کردن مقادیر خاص در ستون‌ها CHECK: limiting specific values in columns

  • ADD COLUMN: افزودن ستون جدید ADD COLUMN: adding new column

  • MODIFY COLUMN: جایگزینی انواع داده MODIFY COLUMN: replacing data types

  • RENAME COLUMN: تغییر نام ستون‌ها RENAME COLUMN: changing column names

  • DROP COLUMN: حذف ستون‌ها DROP COLUMN: deleting columns

  • ADD CONSTRAINT: افزودن کلید اصلی ADD CONSTRAINT: adding primary key

  • ADD CONSTRAINT….REFERENCES: افزودن کلید خارجی ADD CONSTRAINT….REFERENCES: adding foreign key

  • DROP CONSTRAINT: حذف کلیدها DROP CONSTRAINT: deleting keys

  • CREATE INDEX: ایجاد فهرست جدید CREATE INDEX: creating new index

  • CREATE UNIQUE INDEX: ایجاد فهرست بدون تکرار CREATE UNIQUE INDEX: creating index without duplicates

  • DROP INDEX: حذف فهرست موجود DROP INDEX: deleting existing index

  • IS NULL: فیلتر کردن مقادیر واقعی IS NULL: filtering the actual values out

  • IS NOT NULL: فیلتر کردن مقادیر از دست رفته IS NOT NULL: filtering the missing values out

  • AND: ترکیب دو یا چند شرط AND: combining two or more conditions

  • OR: عملگر منطقی انعطاف‌پذیر OR: flexible logical operator

  • NOT: حذف مقادیر از فیلتر NOT: excluding values from filteration

  • BETWEEN...AND: فیلتر کردن محدوده‌های مقادیر BETWEEN...AND: filtering ranges of values

  • LIKE: فیلتر کردن بر اساس الگو LIKE: filtering based on pattern

  • IN: منطق دقیق برای شرایط متعدد IN: precise logic for multiple conditions

  • LIMIT: فیلتر کردن با داده محدود LIMIT: filtering with limited data

  • CHAR_LENGTH: یافتن طول متن CHAR_LENGTH: finding the length of text

  • CONCAT: اضافه کردن رشته‌های مختلف به هم CONCAT: adding different strings together

  • LOWER: تبدیل به حروف کوچک LOWER: converting into lowercase

  • UPPER: تبدیل به حروف بزرگ UPPER: converting into uppercase

  • TRIM: حذف فاصله‌های اضافی TRIM: removing unnecessary gaps

  • REPLACE: جایگزینی مقدار قدیمی با مقدار جدید REPLACE: replacing old value by new value

  • ABS: تبدیل مقدار منفی به مثبت ABS: negative to positive value

  • SUM: محاسبه مقدار کل SUM: calculating the total value

  • AVG: محاسبه مقدار میانگین AVG: calculating the average value

  • COUNT: شمارش کل آیتم‌ها COUNT: counting total items

  • DIV: تقسیم داده‌های عددی DIV: dividing numeric data

  • MIN: یافتن کمترین مقدار MIN: finding the lowest value

  • MAX: یافتن بیشترین مقدار MAX: finding the highest value

  • POWER: ضرب‌های چندگانه POWER: multiple multiplications

  • ROUND: کاهش اعشار ROUND: decreasing the decimals

  • SQRT و LOG: توابع تبدیل SQRT and LOG: transformation functions

  • DATEFORMAT: قالب‌بندی شکل تاریخ DATEFORMAT: formatting the date shape

  • DATEDIFF: یافتن تفاوت تاریخ DATEDIFF: finding the date difference

  • DAY/MONTH/YEAR: استخراج بخش‌هایی از تاریخ DAY/MONTH/YEAR: extracting parts of dates

  • ORDER BY: مرتب‌سازی داده‌ها بر اساس یک ستون ORDER BY: sorting data based on a column

  • GROUP BY: تحلیل داده گروهی با توابع GROUP BY: group data analysis with functions

  • INNER JOIN: ادغام بر اساس مقادیر مشترک INNER JOIN: joining on common values

  • LEFT JOIN: ادغام بر اساس مقادیر جدول چپ LEFT JOIN: joining on left table values

  • RIGHT JOIN: ادغام بر اساس مقادیر جدول راست RIGHT JOIN: joining on right table values

  • CROSS JOIN: ادغام همه مقادیر از جداول CROSS JOIN: joining all values from tables

  • HAVING: قالب شرطی پیشرفته HAVING: advanced conditional format

  • EXISTS: فیلترگذاری تو در تو بین جداول EXISTS: nested filtering between tables

  • ANY: فیلترگذاری تو در تو بین جداول ANY: nested filtering between tables

  • CASE: یافتن نتایج شرطی CASE: finding the conditional outcomes

پیوست - هوش تجاری از A تا Z با PowerBI APPENDIX - Business Intelligence A-Z with PowerBI

  • دانلود مجموعه‌های داده Download datasets

  • دانلود Power BI دسکتاپ Downloading Power BI desktop

  • تنظیمات مهم برای Power BI Important setting to Power BI

  • وارد کردن مجموعه داده به Power BI Importing dataset into Power BI

  • تنظیم نام‌های جدول و ستون Adjusting table and column names

  • تنظیم انواع داده صحیح Setting correct data types

  • تقسیم و حذف ستون Splitting and removing column

  • جایگزینی مقادیر در یک ستون Replacing values in a column

  • دستکاری داده‌های متنی Text data manipulation

  • تحلیل داده‌های عددی Numeric data analysis

  • دستکاری تاریخ و زمان Date and time manipulation

  • ستون شرطی Conditional column

  • گروه‌بندی و تجمیع Grouping and aggregating

  • ادغام مجموعه‌های داده Joining datasets

  • الحاق مجموعه‌های داده Concatenating datasets

  • درک مدل‌سازی داده Understanding data modeling

  • ایجاد مدل داده در Power BI Creating data model in Power BI

  • مدیریت و ویرایش مدل‌های داده Managing & editing data models

  • فرمت‌ها و دسته‌بندی‌های ستون داده Data column formats & categories

  • ایجاد و مدیریت سلسله‌مراتب Creating & managing hierarchies

  • DAX برای ریاضیات و آمار DAX for math and statistics

  • DAX برای شمارش دسته‌بندی‌ها DAX for counting categories

  • DAX برای توابع منطقی DAX for logical functions

  • شروع کار با داشبورد Getting started with dashboard

  • نصب کارت‌های KPI Installing KPI cards

  • رسم نمودار خطی Plotting line chart

  • توسعه نمودار مساحتی Developing area chart

  • نصب نمودارهای سنجش Installing gauge charts

  • تزئین داشبورد Decorating dashboard

  • ایجاد نمودارهای میله‌ای Creating bar charts

  • نصب نمودار دونات Installing donut chart

  • بصری‌سازی ماتریس جدول Table matrix visualization

  • بصری‌سازی نقشه Map visualization

  • ویژه: راهنمای ابزار Power BI SPEACIAL: Power BI tooltip

  • ویژه: اسلایسرها برای تعامل‌پذیری SPECIAL: Slicers for interactivity

  • ویژه: افزودن دکمه سفارشی SPECIAL: Adding custom button

  • مهم: لمس نهایی IMPORTANT: Final touch

گام‌های بعدی شما برای حرفه Your Next Steps for Career

  • پورتفولیوی خود را توسعه دهید Develop your portfolio

  • اولین شغل خود را پیدا کنید! Get your first job!

نمایش نظرات

آموزش نقشه راه شغلی علم داده: بوت‌کمپ ۱۰۰ روزه دیتا ساینس
جزییات دوره
48.5 hours
444
Udemy (یودمی) Udemy (یودمی)
(آخرین آپدیت)
3,323
4.9 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar