راهنمای کامل هوش مصنوعی مولد برای تجزیه و تحلیل داده و علم داده

Complete Guide to Generative AI for Data Analysis and Data Science

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: GenAI این پتانسیل را دارد که افراد بیشتری را قادر به کار و تجزیه و تحلیل داده ها کند، اما برای موفقیت، به یک پایه محکم در مدیریت داده، آمار و یادگیری ماشین نیاز دارید. این دوره آن پایه را فراهم می کند. مدرس Dan Sullivan به شما آموزش می‌دهد که چگونه سؤالات کسب‌وکار و سؤالات علم داده را به اجزایی که می‌توان به صورت برنامه‌نویسی به آنها پرداخت و سپس چگونه از genAI برای ایجاد برنامه‌ها و اسکریپت‌ها برای پیاده‌سازی یک راه‌حل استفاده کرد. این دوره بر روی سه رکن مورد نیاز برای یک تحلیلگر داده یا دانشمند داده موفق تمرکز می کند: مهارت های حل مسئله، درک آمار و یادگیری ماشین، و تجربه عملی با رویه های مدیریت داده.

سرفصل ها و درس ها

مقدمه Introduction

  • شروع کردن Getting started

1. رمزگشایی از داده ها: تجزیه و تحلیل داده ها و علم داده 1. Demystifying Data: Data Analysis and Data Science

  • نتایج را تفسیر کنید Interpret the results

  • جمع آوری و به دست آوردن داده ها Collecting and obtaining data

  • مدل سازی پیش بینی Predictive modeling

  • سوال پرسیدن Asking questions

  • تجزیه و تحلیل داده ها Analyzing data

  • یادگیری ماشینی Machine learning

  • تمیز کردن و آماده سازی داده ها Cleaning and preparing data

2. ابزارهای تجارت 2. Tools of the Trade

  • الگوریتم های یادگیری ماشینی Machine learning algorithms

  • آمار Statistics

  • حل مسئله Problem-solving

  • پایتون Python

  • پلتفرم های آماری Statistics platforms

  • کتابخانه های یادگیری ماشینی Machine learning libraries

  • پایگاه داده های SQL و رابطه ای SQL and relational databases

  • صفحات گسترده Spreadsheets

3. تفکر درباره داده ها 3. Thinking About Data

  • داده های گسسته در مقابل داده های پیوسته Discrete vs. continuous data

  • داده های طبقه بندی شده Categorical data

  • داده های کمی و کیفی Quantitative and qualitative data

4. تکنیک هایی برای توصیف داده ها 4. Techniques for Describing Data

  • چالش: توصیف داده ها Challenge: Describing data

  • اقدامات گرایش مرکزی Measures of central tendency

  • اقدامات گسترش Measures of spread

  • راه حل: توصیف داده ها Solution: Describing data

  • تجسم توزیع داده ها Visualizing data distribution

  • توصیف مجموعه داده با استفاده از هوش مصنوعی مولد Describing a dataset using generative AI

5. توزیع داده ها 5. Distributions of Data

  • تجسم توزیع دووجهی در پایتون Visualizing a bimodal distribution in Python

  • راه حل: توزیع داده ها Solution: Distribution of data

  • تجسم یک توزیع عادی در پایتون Visualizing a normal distribution in Python

  • توزیع داده ها Distributions of data

  • چالش: توزیع داده ها Challenge: Distributions of data

  • ایجاد توزیع نرمال Generating a normal distribution

  • تجسم توزیع یکنواخت در پایتون Visualizing a uniform distribution in Python

  • تجسم یک توزیع نرمال در یک صفحه گسترده Visualizing a normal distribution in a spreadsheet

  • Jupyter Notebook and Colab Jupyter Notebook and Colab

6. داده های نمونه گیری 6. Sampling Data

  • ایجاد نمونه ها Creating samples

  • نمونه گیری و جمعیت زیاد Sampling and large populations

  • ذخیره نمونه ها در یک فایل Saving samples to a file

  • مقایسه جمعیت با آمار نمونه Comparing population to sample statistics

  • راه حل: نمونه برداری از داده ها Solution: Sampling data

  • چالش: نمونه برداری از داده ها Challenge: Sampling data

7. استنتاج از داده ها 7. Making Inferences from Data

  • راه حل: استنتاج از داده ها Solution: Making inferences from data

  • خطاهای نوع I و نوع II Type I and type II errors

  • تولید پایتون برای تست نرمال بودن Generating Python for testing normality

  • تست های ANOVA برای مقایسه میانگین ها ANOVA tests for comparing means

  • تولید پایتون برای تحلیل همبستگی Generating Python for correlation analysis

  • تولید اسکریپت های پایتون برای تست های مجذور کای Generating Python Scripts for Chi-squared tests

  • تحلیل همبستگی Correlation analysis

  • روش شناسی آزمون فرضیه Hypothesis testing methodology

  • آزمون استقلال متغیرهای طبقه بندی شده Testing independence of categorical variables

  • چالش: استنتاج از داده ها Challenge: Making inferences from data

  • آمار استنباطی Inferential statistics

  • تست نرمال بودن Testing for normality

  • تجزیه و تحلیل ترجیحات مشتری Analyzing customer preferences

  • تولید اسکریپت های پایتون برای ANOVA Generating Python scripts for ANOVA

8. تجسم داده ها 8. Visualizing Data

  • تجسم ترکیب Visualizing composition

  • تجسم همبستگی ها Visualizing correlations

  • راه حل: تجسم داده ها Solution: Visualizing data

  • تجسم روندها Visualizing trends

  • چالش: تجسم داده ها Challenge: Visualizing data

  • تجسم داده ها Visualizing data

  • تجسم توزیع ها Visualizing distributions

9. پسرفت 9.Regression

  • رگرسیون خطی Linear regression

  • چالش: ساخت مدل رگرسیون Challenge: Building a regression model

  • ساخت مدل رگرسیون خطی Building a linear regression model

  • تجسم داده های فروش Visualizing sales data

  • ارزیابی مدل های رگرسیون خطی Evaluating linear regression models

  • ارزیابی مدل رگرسیون خطی فروش Evaluating a sales linear regression model

  • راه حل: ساخت مدل رگرسیون Solution: Building a regression model

10. تجزیه و تحلیل داده ها در فایل ها 10. Analyzing Data in Files

  • راه حل: داده های از دست رفته Solution: Missing data

  • فریم های داده در پایتون Dataframes in Python

  • چالش: داده های از دست رفته Challenge: Missing data

  • بازرسی چارچوب های داده Inspecting dataframes

  • بارگیری JSON در دیتافریم Loading JSON into dataframes

  • مرور یک نمونه فایل JSON Reviewing an example JSON file

  • استفاده از صفحات گسترده با فایل های CSV Using spreadsheets with CSV files

  • فایل های داده Data files

  • بارگیری داده‌های CSV در فریم‌های داده Loading CSV data into dataframes

  • کیفیت داده ها و پاکسازی داده ها Data quality and data cleansing

  • استفاده از jq با فایل های JSON Using jq with JSON files

  • تولید دستورات jq با استفاده از هوش مصنوعی Generating jq commands using AI

  • استفاده از هوش مصنوعی برای کیفیت داده ها و پاکسازی داده ها Using AI for data quality and data cleansing

11. تجزیه و تحلیل داده ها در پایگاه های داده 11. Analyzing Data in Databases

  • چالش: یک مدل داده رابطه ای ایجاد کنید Challenge: Generate a relational data model

  • راه حل: یک مدل داده رابطه ای ایجاد کنید Solution: Generate a relational data model

  • ایجاد جداول و درج داده ها Creating tables and inserting data

  • مقدمه ای بر SQL Introduction to SQL

  • پرس و جو داده ها با SQL Querying data with SQL

  • ایجاد یک طرحواره ستاره ای، داده های مصنوعی و پرس و جوها Generating a star schema, synthetic data, and queries

  • پایگاه های داده رابطه ای Relational databases

  • استخراج، تبدیل و بارگذاری داده ها در پایگاه های داده Extraction, transformation, and loading data into databases

  • پایگاه های داده NoSQL NoSQL databases

  • تولید مجموعه داده های مصنوعی برای پایگاه داده رابطه ای Generating synthetic data sets for a relational database

  • اتصال داده ها با SQL Joining data with SQL

  • آمار توصیفی در SQL Descriptiive statistics in SQL

12. مقدمه ای بر یادگیری ماشین 12. Introduction to Machine Learning

  • چرخه زندگی یادگیری ماشینی Machine learning lifecycle

  • مهندسی ویژگی Feature engineering

  • طبقه بندی Classification

  • یادگیری تحت نظارت و بدون نظارت Supervised and unsupervised learning

  • خوشه بندی Clustering

  • ارزیابی مدل Model evaluation

  • رگرسیون Regression

13. ساخت مدل های یادگیری ماشین: طبقه بندی 13. Building Machine Learning Models: Classification

  • مدل طبقه بندی ساده Simple classification model

  • راه حل: پیش بینی قصد مصرف کننده Solution: Predicting consumer intent

  • تنظیم فراپارامتر Hyperparameter tuning

  • رسیدگی به داده های از دست رفته Handling missing data

  • طبقه بندی با شبکه های عصبی Classification with neural networks

  • ارزیابی اهمیت ویژگی Evaluating feature importance

  • مقایسه چندین الگوریتم Comparing multiple algorithms

  • چالش: پیش بینی قصد مصرف کننده Challenge: Predicting consumer intent

14. ساخت مدل های یادگیری ماشین: خوشه بندی 14. Building Machine Learning Models: Clustering

  • خوشه بندی با DBSCAN Clustering with DBSCAN

  • خوشه بندی با k-means Clustering with k-means

  • خوشه بندی با خوشه بندی سلسله مراتبی Clustering with hierarchical clustering

  • چالش: تقسیم بندی مشتریان Challenge: Customer segmentation

  • راه حل: تقسیم بندی مشتریان Solution: Customer segmentation

15. مجموعه داده های ML Access را باز کنید 15. Open Access ML Datasets

  • دسترسی باز به مجموعه داده های ML Open access ML datasets

16. تجزیه و تحلیل شبکه 16. Network Analysis

  • تجسم یک زنجیره تامین پیچیده Visualizing a complex supply chain

  • تجزیه و تحلیل یک شبکه اجتماعی Analyzing a social network

  • ایجاد یک زنجیره تامین مصنوعی Generating a synthetic supply chain

  • مقدمه ای بر نظریه گراف Introduction to graph theory

  • NetworkX NetworkX

  • یافتن بالاترین نمرات بین بودن Finding highest betweenness scores

  • راه حل: تجزیه و تحلیل یک شبکه اجتماعی Solution: Analyzing a social network

  • مباحث پیشرفته در تحلیل زنجیره تامین Advanced topics in supply chain analysis

  • چالش: تجزیه و تحلیل یک شبکه اجتماعی Challenge: Analyzing a social network

  • زنجیره تامین و تجزیه و تحلیل شبکه Supply chains and network analysis

17. شبیه سازی 17. Simulations

  • مقدمه ای بر شبیه سازی Introduction to simulations

  • مدل‌سازی بیماری‌های عفونی مبتنی بر عامل Agent-base infectious diseases modeling

  • انواع شبیه سازی Types of simulations

  • چالش: شبیه سازی آتش سوزی جنگل Challenge: Simulating forest fires

  • مدل سازی شیوع بیماری های عفونی Modeling the spread of infectious diseases

  • راه حل: شبیه سازی آتش سوزی جنگل Solution: Simulating forest fires

  • مدلسازی مدیریت موجودی Modeling inventory management

  • مدل سازی مبتنی بر عامل Agent-based modeling

18. پروژه Capstone 18. Capstone Project

  • راه حل پروژه Capstone Capstone project solution

  • الزامات پروژه Capstone Capstone project requirements

19. ادامه سفر یادگیری هوش مصنوعی 19. Continuing Your AI Learning Journey

  • مراحل بعدی و منابع اضافی Next steps and additional resources

نمایش نظرات

راهنمای کامل هوش مصنوعی مولد برای تجزیه و تحلیل داده و علم داده
جزییات دوره
10h 21m
135
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
44
- از 5
ندارد
دارد
دارد
Dan Sullivan
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Dan Sullivan Dan Sullivan

معمار سازمانی ، کارشناس بزرگ داده دان سالیوان ، دکترای علوم ، یک معمار سازمانی و متخصص داده های بزرگ است.

دان متخصص در معماری داده ، تجزیه و تحلیل ، داده کاوی ، آمار ، مدل سازی داده ها ، داده های بزرگ و رایانش ابری است. علاوه بر این ، او دارای دکترای ژنتیک ، بیوانفورماتیک و زیست محاسباتی است. Dan به طور منظم با Spark ، Oracle ، NoSQL ، MongoDB ، Redis ، R و Python کار می کند. وی تجربه نوشتن گسترده ای در موضوعاتی از جمله رایانش ابری ، داده های بزرگ ، Hadoop و امنیت دارد.