SQL برای آموزش تجزیه و تحلیل داده های اکتشافی

SQL for Exploratory Data Analysis Essential Training

در حال بارگزاری نمونه ویدیو، لطفا صبر کنید...
Video Player is loading.
Current Time 0:00
Duration 0:00
Loaded: 0%
Stream Type LIVE
Remaining Time 0:00
 
1x
    • Chapters
    • descriptions off, selected
    • subtitles off, selected
      نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
      نمونه ویدیوها:
      • در حال بارگزاری، لطفا صبر کنید...
      توضیحات دوره: بیاموزید که چگونه از SQL برای درک ویژگیهای مجموعه داده های مقصد علم داده و یادگیری ماشین استفاده کنید. این دوره با مقدمه ای در تجزیه و تحلیل داده های اکتشافی و تفاوت آن با تجزیه و تحلیل آماری فرضیه محور آغاز می شود. مربی دن سالیوان توضیح می دهد که چگونه پرس و جوهای SQL و محاسبات آماری و ابزارهای تجسم مانند Excel و R می توانند به شما در تأیید کیفیت داده ها و جلوگیری از فرضیات نادرست کمک کنند. در مرحله بعدی ، نحوه انجام بررسی های کیفیت داده ، کشف و بازیابی مقادیر از دست رفته و بررسی منطق کسب و کار را بیابید. نحوه استفاده از نمودارهای جعبه ای را برای درک توزیع غیرعادی داده ها کشف کنید و از هیستوگرام ها برای درک فرکانس مقادیر داده به ویژه ویژگی ها استفاده کنید. دن همچنین نحوه استفاده از آزمون مجذور کای را برای درک وابستگی ها و اندازه گیری همبستگی بین ویژگی ها توضیح می دهد. این دوره با مجموعه ای از نکات و بهترین روش ها برای تجزیه و تحلیل داده های اکتشافی به پایان می رسد.
      موضوعات شامل:
      • تجزیه و تحلیل داده های اکتشافی در مقابل تحلیل آماری فرضیه محور
      • انجام بررسی های کیفیت داده
      • محاسبه ربع ها
      • استفاده از طرح جعبه برای درک توزیع مقادیر
      • استفاده از هیستوگرام برای درک فراوانی مقادیر
      • استفاده از مجذور کای برای درک همبستگی بین مقادیر

      سرفصل ها و درس ها

      مقدمه Introduction

      • خوش آمدی Welcome

      • آنچه باید بدانید What you should know

      1. مقدمه ای بر تجزیه و تحلیل داده های اکتشافی 1. Introduction to Exploratory Data Analysis

      • چرا داده ها را کاوش می کنید؟ Why explore data?

      • کاوش داده با آمار Exploring data with statistics

      • آزمون فرضیه با آمار Testing hypothesis with statistics

      2. بررسی کیفیت داده ها 2. Data Quality Checks

      • چرا داده ها را بررسی می کنید؟ Why check data?

      • انواع چک با کیفیت Types of quality checks

      • مقادیر گمشده را وارد کنید Imputing missing values

      • شناسایی چک های منطق تجاری Identifying business logic checks

      3. محاسبه کوارتیل ها 3. Calculating Quartiles

      • چرا در مورد توزیع داده ها می آموزید؟ Why learn about the distribution of data?

      • حداقل ، حداکثر و ارزش متوسط Minimum, maximum, and median values

      • ترتیب و شمارش Ordering and counting

      • محاسبه کوارتیل ها Calculating quartiles

      • آشنایی با توطئه های جعبه Introduction to box plots

      4- هیستوگرام 4. Histograms

      • آشنایی با هیستوگرام Introduction to histograms

      • تقسیم بندی داده ها Partitioning data

      • محاسبه هیستوگرام Calculating histograms

      • تجسم ساده هیستوگرام Simple histogram visualization

      5- بررسی ارتباط بین صفات 5. Checking Correlation between Attributes

      • آشنایی با همبستگی Introduction to correlation

      • محاسبه همبستگی با SQL Calculating correlation with SQL

      نتیجه Conclusion

      • مراحل بعدی Next steps

      نمایش نظرات

      SQL برای آموزش تجزیه و تحلیل داده های اکتشافی
      جزییات دوره
      44m 7s
      21
      Linkedin (لینکدین) Linkedin (لینکدین)
      (آخرین آپدیت)
      32,571
      - از 5
      ندارد
      دارد
      دارد
      Dan Sullivan
      جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

      Google Chrome Browser

      Internet Download Manager

      Pot Player

      Winrar

      Dan Sullivan Dan Sullivan

      معمار سازمانی ، کارشناس بزرگ داده دان سالیوان ، دکترای علوم ، یک معمار سازمانی و متخصص داده های بزرگ است.

      دان متخصص در معماری داده ، تجزیه و تحلیل ، داده کاوی ، آمار ، مدل سازی داده ها ، داده های بزرگ و رایانش ابری است. علاوه بر این ، او دارای دکترای ژنتیک ، بیوانفورماتیک و زیست محاسباتی است. Dan به طور منظم با Spark ، Oracle ، NoSQL ، MongoDB ، Redis ، R و Python کار می کند. وی تجربه نوشتن گسترده ای در موضوعاتی از جمله رایانش ابری ، داده های بزرگ ، Hadoop و امنیت دارد.