SQL برای آموزش تجزیه و تحلیل داده های اکتشافی

SQL for Exploratory Data Analysis Essential Training

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره: بیاموزید که چگونه از SQL برای درک ویژگیهای مجموعه داده های مقصد علم داده و یادگیری ماشین استفاده کنید. این دوره با مقدمه ای در تجزیه و تحلیل داده های اکتشافی و تفاوت آن با تجزیه و تحلیل آماری فرضیه محور آغاز می شود. مربی دن سالیوان توضیح می دهد که چگونه پرس و جوهای SQL و محاسبات آماری و ابزارهای تجسم مانند Excel و R می توانند به شما در تأیید کیفیت داده ها و جلوگیری از فرضیات نادرست کمک کنند. در مرحله بعدی ، نحوه انجام بررسی های کیفیت داده ، کشف و بازیابی مقادیر از دست رفته و بررسی منطق کسب و کار را بیابید. نحوه استفاده از نمودارهای جعبه ای را برای درک توزیع غیرعادی داده ها کشف کنید و از هیستوگرام ها برای درک فرکانس مقادیر داده به ویژه ویژگی ها استفاده کنید. دن همچنین نحوه استفاده از آزمون مجذور کای را برای درک وابستگی ها و اندازه گیری همبستگی بین ویژگی ها توضیح می دهد. این دوره با مجموعه ای از نکات و بهترین روش ها برای تجزیه و تحلیل داده های اکتشافی به پایان می رسد.
موضوعات شامل:
  • تجزیه و تحلیل داده های اکتشافی در مقابل تحلیل آماری فرضیه محور
  • انجام بررسی های کیفیت داده
  • محاسبه ربع ها
  • استفاده از طرح جعبه برای درک توزیع مقادیر
  • استفاده از هیستوگرام برای درک فراوانی مقادیر
  • استفاده از مجذور کای برای درک همبستگی بین مقادیر

سرفصل ها و درس ها

مقدمه Introduction

  • خوش آمدی Welcome

  • آنچه باید بدانید What you should know

1. مقدمه ای بر تجزیه و تحلیل داده های اکتشافی 1. Introduction to Exploratory Data Analysis

  • چرا داده ها را کاوش می کنید؟ Why explore data?

  • کاوش داده با آمار Exploring data with statistics

  • آزمون فرضیه با آمار Testing hypothesis with statistics

2. بررسی کیفیت داده ها 2. Data Quality Checks

  • چرا داده ها را بررسی می کنید؟ Why check data?

  • انواع چک با کیفیت Types of quality checks

  • مقادیر گمشده را وارد کنید Imputing missing values

  • شناسایی چک های منطق تجاری Identifying business logic checks

3. محاسبه کوارتیل ها 3. Calculating Quartiles

  • چرا در مورد توزیع داده ها می آموزید؟ Why learn about the distribution of data?

  • حداقل ، حداکثر و ارزش متوسط Minimum, maximum, and median values

  • ترتیب و شمارش Ordering and counting

  • محاسبه کوارتیل ها Calculating quartiles

  • آشنایی با توطئه های جعبه Introduction to box plots

4- هیستوگرام 4. Histograms

  • آشنایی با هیستوگرام Introduction to histograms

  • تقسیم بندی داده ها Partitioning data

  • محاسبه هیستوگرام Calculating histograms

  • تجسم ساده هیستوگرام Simple histogram visualization

5- بررسی ارتباط بین صفات 5. Checking Correlation between Attributes

  • آشنایی با همبستگی Introduction to correlation

  • محاسبه همبستگی با SQL Calculating correlation with SQL

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

Linkedin (لینکدین)

لینکدین: شبکه اجتماعی حرفه‌ای برای ارتباط و کارآفرینی

لینکدین به عنوان یکی از بزرگترین شبکه‌های اجتماعی حرفه‌ای، به میلیون‌ها افراد در سراسر جهان این امکان را می‌دهد تا ارتباط برقرار کنند، اطلاعات حرفه‌ای خود را به اشتراک بگذارند و فرصت‌های شغلی را کشف کنند. این شبکه اجتماعی به کاربران امکان می‌دهد تا رزومه حرفه‌ای خود را آپدیت کنند، با همکاران، دوستان و همکاران آینده ارتباط برقرار کنند، به انجمن‌ها و گروه‌های حرفه‌ای ملحق شوند و از مقالات و مطالب مرتبط با حوزه کاری خود بهره‌مند شوند.

لینکدین همچنین به کارفرمایان امکان می‌دهد تا به دنبال نیروهای با تجربه و مهارت مورد نیاز خود بگردند و ارتباط برقرار کنند. این شبکه حرفه‌ای به عنوان یک پلتفرم کلیدی برای بهبود دسترسی به فرصت‌های شغلی و گسترش شبکه حرفه‌ای خود، نقش مهمی را ایفا می‌کند. از این رو، لینکدین به عنوان یکی از مهمترین ابزارهای کارآفرینی و توسعه حرفه‌ای در دنیای امروز مورد توجه قرار دارد.

SQL برای آموزش تجزیه و تحلیل داده های اکتشافی
جزییات دوره
44m 7s
21
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
32,571
- از 5
ندارد
دارد
دارد
Dan Sullivan
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Dan Sullivan Dan Sullivan

معمار سازمانی ، کارشناس بزرگ داده دان سالیوان ، دکترای علوم ، یک معمار سازمانی و متخصص داده های بزرگ است.

دان متخصص در معماری داده ، تجزیه و تحلیل ، داده کاوی ، آمار ، مدل سازی داده ها ، داده های بزرگ و رایانش ابری است. علاوه بر این ، او دارای دکترای ژنتیک ، بیوانفورماتیک و زیست محاسباتی است. Dan به طور منظم با Spark ، Oracle ، NoSQL ، MongoDB ، Redis ، R و Python کار می کند. وی تجربه نوشتن گسترده ای در موضوعاتی از جمله رایانش ابری ، داده های بزرگ ، Hadoop و امنیت دارد.