SQL برای آموزش تجزیه و تحلیل داده های اکتشافی

SQL for Exploratory Data Analysis Essential Training

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: بیاموزید که چگونه از SQL برای درک ویژگیهای مجموعه داده های مقصد علم داده و یادگیری ماشین استفاده کنید. این دوره با مقدمه ای در تجزیه و تحلیل داده های اکتشافی و تفاوت آن با تجزیه و تحلیل آماری فرضیه محور آغاز می شود. مربی دن سالیوان توضیح می دهد که چگونه پرس و جوهای SQL و محاسبات آماری و ابزارهای تجسم مانند Excel و R می توانند به شما در تأیید کیفیت داده ها و جلوگیری از فرضیات نادرست کمک کنند. در مرحله بعدی ، نحوه انجام بررسی های کیفیت داده ، کشف و بازیابی مقادیر از دست رفته و بررسی منطق کسب و کار را بیابید. نحوه استفاده از نمودارهای جعبه ای را برای درک توزیع غیرعادی داده ها کشف کنید و از هیستوگرام ها برای درک فرکانس مقادیر داده به ویژه ویژگی ها استفاده کنید. دن همچنین نحوه استفاده از آزمون مجذور کای را برای درک وابستگی ها و اندازه گیری همبستگی بین ویژگی ها توضیح می دهد. این دوره با مجموعه ای از نکات و بهترین روش ها برای تجزیه و تحلیل داده های اکتشافی به پایان می رسد.
موضوعات شامل:
  • تجزیه و تحلیل داده های اکتشافی در مقابل تحلیل آماری فرضیه محور
  • انجام بررسی های کیفیت داده
  • محاسبه ربع ها
  • استفاده از طرح جعبه برای درک توزیع مقادیر
  • استفاده از هیستوگرام برای درک فراوانی مقادیر
  • استفاده از مجذور کای برای درک همبستگی بین مقادیر

سرفصل ها و درس ها

مقدمه Introduction

  • خوش آمدی Welcome

  • آنچه باید بدانید What you should know

1. مقدمه ای بر تجزیه و تحلیل داده های اکتشافی 1. Introduction to Exploratory Data Analysis

  • چرا داده ها را کاوش می کنید؟ Why explore data?

  • کاوش داده با آمار Exploring data with statistics

  • آزمون فرضیه با آمار Testing hypothesis with statistics

2. بررسی کیفیت داده ها 2. Data Quality Checks

  • چرا داده ها را بررسی می کنید؟ Why check data?

  • انواع چک با کیفیت Types of quality checks

  • مقادیر گمشده را وارد کنید Imputing missing values

  • شناسایی چک های منطق تجاری Identifying business logic checks

3. محاسبه کوارتیل ها 3. Calculating Quartiles

  • چرا در مورد توزیع داده ها می آموزید؟ Why learn about the distribution of data?

  • حداقل ، حداکثر و ارزش متوسط Minimum, maximum, and median values

  • ترتیب و شمارش Ordering and counting

  • محاسبه کوارتیل ها Calculating quartiles

  • آشنایی با توطئه های جعبه Introduction to box plots

4- هیستوگرام 4. Histograms

  • آشنایی با هیستوگرام Introduction to histograms

  • تقسیم بندی داده ها Partitioning data

  • محاسبه هیستوگرام Calculating histograms

  • تجسم ساده هیستوگرام Simple histogram visualization

5- بررسی ارتباط بین صفات 5. Checking Correlation between Attributes

  • آشنایی با همبستگی Introduction to correlation

  • محاسبه همبستگی با SQL Calculating correlation with SQL

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

SQL برای آموزش تجزیه و تحلیل داده های اکتشافی
جزییات دوره
44m 7s
21
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
32,571
- از 5
ندارد
دارد
دارد
Dan Sullivan
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Dan Sullivan Dan Sullivan

معمار سازمانی ، کارشناس بزرگ داده دان سالیوان ، دکترای علوم ، یک معمار سازمانی و متخصص داده های بزرگ است.

دان متخصص در معماری داده ، تجزیه و تحلیل ، داده کاوی ، آمار ، مدل سازی داده ها ، داده های بزرگ و رایانش ابری است. علاوه بر این ، او دارای دکترای ژنتیک ، بیوانفورماتیک و زیست محاسباتی است. Dan به طور منظم با Spark ، Oracle ، NoSQL ، MongoDB ، Redis ، R و Python کار می کند. وی تجربه نوشتن گسترده ای در موضوعاتی از جمله رایانش ابری ، داده های بزرگ ، Hadoop و امنیت دارد.