راهنمای کامل هوش مصنوعی مولد برای تجزیه و تحلیل داده و علم داده

Complete Guide to Generative AI for Data Analysis and Data Science

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: GenAI این پتانسیل را دارد که افراد بیشتری را قادر به کار و تجزیه و تحلیل داده ها کند، اما برای موفقیت، به یک پایه محکم در مدیریت داده، آمار و یادگیری ماشین نیاز دارید. این دوره آن پایه را فراهم می کند. مدرس Dan Sullivan به شما آموزش می‌دهد که چگونه سؤالات کسب‌وکار و سؤالات علم داده را به اجزایی که می‌توان به صورت برنامه‌نویسی به آنها پرداخت و سپس چگونه از genAI برای ایجاد برنامه‌ها و اسکریپت‌ها برای پیاده‌سازی یک راه‌حل استفاده کرد. این دوره بر روی سه رکن مورد نیاز برای یک تحلیلگر داده یا دانشمند داده موفق تمرکز می کند: مهارت های حل مسئله، درک آمار و یادگیری ماشین، و تجربه عملی با رویه های مدیریت داده.

سرفصل ها و درس ها

مقدمه Introduction

  • شروع کردن Getting started

1. رمزگشایی از داده ها: تجزیه و تحلیل داده ها و علم داده 1. Demystifying Data: Data Analysis and Data Science

  • نتایج را تفسیر کنید Interpret the results

  • جمع آوری و به دست آوردن داده ها Collecting and obtaining data

  • مدل سازی پیش بینی Predictive modeling

  • سوال پرسیدن Asking questions

  • تجزیه و تحلیل داده ها Analyzing data

  • یادگیری ماشینی Machine learning

  • تمیز کردن و آماده سازی داده ها Cleaning and preparing data

2. ابزارهای تجارت 2. Tools of the Trade

  • الگوریتم های یادگیری ماشینی Machine learning algorithms

  • آمار Statistics

  • حل مسئله Problem-solving

  • پایتون Python

  • پلتفرم های آماری Statistics platforms

  • کتابخانه های یادگیری ماشینی Machine learning libraries

  • پایگاه داده های SQL و رابطه ای SQL and relational databases

  • صفحات گسترده Spreadsheets

3. تفکر درباره داده ها 3. Thinking About Data

  • داده های گسسته در مقابل داده های پیوسته Discrete vs. continuous data

  • داده های طبقه بندی شده Categorical data

  • داده های کمی و کیفی Quantitative and qualitative data

4. تکنیک هایی برای توصیف داده ها 4. Techniques for Describing Data

  • چالش: توصیف داده ها Challenge: Describing data

  • اقدامات گرایش مرکزی Measures of central tendency

  • اقدامات گسترش Measures of spread

  • راه حل: توصیف داده ها Solution: Describing data

  • تجسم توزیع داده ها Visualizing data distribution

  • توصیف مجموعه داده با استفاده از هوش مصنوعی مولد Describing a dataset using generative AI

5. توزیع داده ها 5. Distributions of Data

  • تجسم توزیع دووجهی در پایتون Visualizing a bimodal distribution in Python

  • راه حل: توزیع داده ها Solution: Distribution of data

  • تجسم یک توزیع عادی در پایتون Visualizing a normal distribution in Python

  • توزیع داده ها Distributions of data

  • چالش: توزیع داده ها Challenge: Distributions of data

  • ایجاد توزیع نرمال Generating a normal distribution

  • تجسم توزیع یکنواخت در پایتون Visualizing a uniform distribution in Python

  • تجسم یک توزیع نرمال در یک صفحه گسترده Visualizing a normal distribution in a spreadsheet

  • Jupyter Notebook and Colab Jupyter Notebook and Colab

6. داده های نمونه گیری 6. Sampling Data

  • ایجاد نمونه ها Creating samples

  • نمونه گیری و جمعیت زیاد Sampling and large populations

  • ذخیره نمونه ها در یک فایل Saving samples to a file

  • مقایسه جمعیت با آمار نمونه Comparing population to sample statistics

  • راه حل: نمونه برداری از داده ها Solution: Sampling data

  • چالش: نمونه برداری از داده ها Challenge: Sampling data

7. استنتاج از داده ها 7. Making Inferences from Data

  • راه حل: استنتاج از داده ها Solution: Making inferences from data

  • خطاهای نوع I و نوع II Type I and type II errors

  • تولید پایتون برای تست نرمال بودن Generating Python for testing normality

  • تست های ANOVA برای مقایسه میانگین ها ANOVA tests for comparing means

  • تولید پایتون برای تحلیل همبستگی Generating Python for correlation analysis

  • تولید اسکریپت های پایتون برای تست های مجذور کای Generating Python Scripts for Chi-squared tests

  • تحلیل همبستگی Correlation analysis

  • روش شناسی آزمون فرضیه Hypothesis testing methodology

  • آزمون استقلال متغیرهای طبقه بندی شده Testing independence of categorical variables

  • چالش: استنتاج از داده ها Challenge: Making inferences from data

  • آمار استنباطی Inferential statistics

  • تست نرمال بودن Testing for normality

  • تجزیه و تحلیل ترجیحات مشتری Analyzing customer preferences

  • تولید اسکریپت های پایتون برای ANOVA Generating Python scripts for ANOVA

8. تجسم داده ها 8. Visualizing Data

  • تجسم ترکیب Visualizing composition

  • تجسم همبستگی ها Visualizing correlations

  • راه حل: تجسم داده ها Solution: Visualizing data

  • تجسم روندها Visualizing trends

  • چالش: تجسم داده ها Challenge: Visualizing data

  • تجسم داده ها Visualizing data

  • تجسم توزیع ها Visualizing distributions

9. پسرفت 9.Regression

  • رگرسیون خطی Linear regression

  • چالش: ساخت مدل رگرسیون Challenge: Building a regression model

  • ساخت مدل رگرسیون خطی Building a linear regression model

  • تجسم داده های فروش Visualizing sales data

  • ارزیابی مدل های رگرسیون خطی Evaluating linear regression models

  • ارزیابی مدل رگرسیون خطی فروش Evaluating a sales linear regression model

  • راه حل: ساخت مدل رگرسیون Solution: Building a regression model

10. تجزیه و تحلیل داده ها در فایل ها 10. Analyzing Data in Files

  • راه حل: داده های از دست رفته Solution: Missing data

  • فریم های داده در پایتون Dataframes in Python

  • چالش: داده های از دست رفته Challenge: Missing data

  • بازرسی چارچوب های داده Inspecting dataframes

  • بارگیری JSON در دیتافریم Loading JSON into dataframes

  • مرور یک نمونه فایل JSON Reviewing an example JSON file

  • استفاده از صفحات گسترده با فایل های CSV Using spreadsheets with CSV files

  • فایل های داده Data files

  • بارگیری داده‌های CSV در فریم‌های داده Loading CSV data into dataframes

  • کیفیت داده ها و پاکسازی داده ها Data quality and data cleansing

  • استفاده از jq با فایل های JSON Using jq with JSON files

  • تولید دستورات jq با استفاده از هوش مصنوعی Generating jq commands using AI

  • استفاده از هوش مصنوعی برای کیفیت داده ها و پاکسازی داده ها Using AI for data quality and data cleansing

11. تجزیه و تحلیل داده ها در پایگاه های داده 11. Analyzing Data in Databases

  • چالش: یک مدل داده رابطه ای ایجاد کنید Challenge: Generate a relational data model

  • راه حل: یک مدل داده رابطه ای ایجاد کنید Solution: Generate a relational data model

  • ایجاد جداول و درج داده ها Creating tables and inserting data

  • مقدمه ای بر SQL Introduction to SQL

  • پرس و جو داده ها با SQL Querying data with SQL

  • ایجاد یک طرحواره ستاره ای، داده های مصنوعی و پرس و جوها Generating a star schema, synthetic data, and queries

  • پایگاه های داده رابطه ای Relational databases

  • استخراج، تبدیل و بارگذاری داده ها در پایگاه های داده Extraction, transformation, and loading data into databases

  • پایگاه های داده NoSQL NoSQL databases

  • تولید مجموعه داده های مصنوعی برای پایگاه داده رابطه ای Generating synthetic data sets for a relational database

  • اتصال داده ها با SQL Joining data with SQL

  • آمار توصیفی در SQL Descriptiive statistics in SQL

12. مقدمه ای بر یادگیری ماشین 12. Introduction to Machine Learning

  • چرخه زندگی یادگیری ماشینی Machine learning lifecycle

  • مهندسی ویژگی Feature engineering

  • طبقه بندی Classification

  • یادگیری تحت نظارت و بدون نظارت Supervised and unsupervised learning

  • خوشه بندی Clustering

  • ارزیابی مدل Model evaluation

  • رگرسیون Regression

13. ساخت مدل های یادگیری ماشین: طبقه بندی 13. Building Machine Learning Models: Classification

  • مدل طبقه بندی ساده Simple classification model

  • راه حل: پیش بینی قصد مصرف کننده Solution: Predicting consumer intent

  • تنظیم فراپارامتر Hyperparameter tuning

  • رسیدگی به داده های از دست رفته Handling missing data

  • طبقه بندی با شبکه های عصبی Classification with neural networks

  • ارزیابی اهمیت ویژگی Evaluating feature importance

  • مقایسه چندین الگوریتم Comparing multiple algorithms

  • چالش: پیش بینی قصد مصرف کننده Challenge: Predicting consumer intent

14. ساخت مدل های یادگیری ماشین: خوشه بندی 14. Building Machine Learning Models: Clustering

  • خوشه بندی با DBSCAN Clustering with DBSCAN

  • خوشه بندی با k-means Clustering with k-means

  • خوشه بندی با خوشه بندی سلسله مراتبی Clustering with hierarchical clustering

  • چالش: تقسیم بندی مشتریان Challenge: Customer segmentation

  • راه حل: تقسیم بندی مشتریان Solution: Customer segmentation

15. مجموعه داده های ML Access را باز کنید 15. Open Access ML Datasets

  • دسترسی باز به مجموعه داده های ML Open access ML datasets

16. تجزیه و تحلیل شبکه 16. Network Analysis

  • تجسم یک زنجیره تامین پیچیده Visualizing a complex supply chain

  • تجزیه و تحلیل یک شبکه اجتماعی Analyzing a social network

  • ایجاد یک زنجیره تامین مصنوعی Generating a synthetic supply chain

  • مقدمه ای بر نظریه گراف Introduction to graph theory

  • NetworkX NetworkX

  • یافتن بالاترین نمرات بین بودن Finding highest betweenness scores

  • راه حل: تجزیه و تحلیل یک شبکه اجتماعی Solution: Analyzing a social network

  • مباحث پیشرفته در تحلیل زنجیره تامین Advanced topics in supply chain analysis

  • چالش: تجزیه و تحلیل یک شبکه اجتماعی Challenge: Analyzing a social network

  • زنجیره تامین و تجزیه و تحلیل شبکه Supply chains and network analysis

17. شبیه سازی 17. Simulations

  • مقدمه ای بر شبیه سازی Introduction to simulations

  • مدل‌سازی بیماری‌های عفونی مبتنی بر عامل Agent-base infectious diseases modeling

  • انواع شبیه سازی Types of simulations

  • چالش: شبیه سازی آتش سوزی جنگل Challenge: Simulating forest fires

  • مدل سازی شیوع بیماری های عفونی Modeling the spread of infectious diseases

  • راه حل: شبیه سازی آتش سوزی جنگل Solution: Simulating forest fires

  • مدلسازی مدیریت موجودی Modeling inventory management

  • مدل سازی مبتنی بر عامل Agent-based modeling

18. پروژه Capstone 18. Capstone Project

  • راه حل پروژه Capstone Capstone project solution

  • الزامات پروژه Capstone Capstone project requirements

19. ادامه سفر یادگیری هوش مصنوعی 19. Continuing Your AI Learning Journey

  • مراحل بعدی و منابع اضافی Next steps and additional resources

نمایش نظرات

Linkedin (لینکدین)

لینکدین: شبکه اجتماعی حرفه‌ای برای ارتباط و کارآفرینی

لینکدین به عنوان یکی از بزرگترین شبکه‌های اجتماعی حرفه‌ای، به میلیون‌ها افراد در سراسر جهان این امکان را می‌دهد تا ارتباط برقرار کنند، اطلاعات حرفه‌ای خود را به اشتراک بگذارند و فرصت‌های شغلی را کشف کنند. این شبکه اجتماعی به کاربران امکان می‌دهد تا رزومه حرفه‌ای خود را آپدیت کنند، با همکاران، دوستان و همکاران آینده ارتباط برقرار کنند، به انجمن‌ها و گروه‌های حرفه‌ای ملحق شوند و از مقالات و مطالب مرتبط با حوزه کاری خود بهره‌مند شوند.

لینکدین همچنین به کارفرمایان امکان می‌دهد تا به دنبال نیروهای با تجربه و مهارت مورد نیاز خود بگردند و ارتباط برقرار کنند. این شبکه حرفه‌ای به عنوان یک پلتفرم کلیدی برای بهبود دسترسی به فرصت‌های شغلی و گسترش شبکه حرفه‌ای خود، نقش مهمی را ایفا می‌کند. از این رو، لینکدین به عنوان یکی از مهمترین ابزارهای کارآفرینی و توسعه حرفه‌ای در دنیای امروز مورد توجه قرار دارد.

راهنمای کامل هوش مصنوعی مولد برای تجزیه و تحلیل داده و علم داده
جزییات دوره
10h 21m
135
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
44
- از 5
ندارد
دارد
دارد
Dan Sullivan
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Dan Sullivan Dan Sullivan

معمار سازمانی ، کارشناس بزرگ داده دان سالیوان ، دکترای علوم ، یک معمار سازمانی و متخصص داده های بزرگ است.

دان متخصص در معماری داده ، تجزیه و تحلیل ، داده کاوی ، آمار ، مدل سازی داده ها ، داده های بزرگ و رایانش ابری است. علاوه بر این ، او دارای دکترای ژنتیک ، بیوانفورماتیک و زیست محاسباتی است. Dan به طور منظم با Spark ، Oracle ، NoSQL ، MongoDB ، Redis ، R و Python کار می کند. وی تجربه نوشتن گسترده ای در موضوعاتی از جمله رایانش ابری ، داده های بزرگ ، Hadoop و امنیت دارد.