آموزش SQL متوسط برای دانشمندان داده

Intermediate SQL for Data Scientists

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:

نیاز فزاینده ای به دانشمندان و تحلیلگران داده برای درک ذخیره داده های رابطه ای وجود دارد. سازمان ها از دیتابیس های SQL برای ذخیره داده های معاملاتی و همچنین اطلاعات مربوط به هوش تجاری استفاده می کنند. این دوره برای دانشمندان داده که نیاز به کار با پایگاه های داده SQL دارند طراحی شده است. به طور خاص ، این برنامه برای کمک به این متخصصان برای یادگیری نحوه انجام وظایف رایج علم داده ، از جمله اکتشاف و استخراج داده ها در پایگاه های داده رابطه ای ، طراحی شده است.

Dan Sullivan مدرس دوره ای را با مروری کوتاه بر دستکاری داده های SQL و دستورات تعریف داده سپس بر نحوه استفاده از پرس و جوهای SQL برای آماده سازی داده ها برای تجزیه و تحلیل تمرکز می کند. برای درک بهتر آن داده ها از توابع آماری استفاده کنید. و با کل ، عملیات پنجره و موارد دیگر کار کنید.


سرفصل ها و درس ها

معرفی Introduction

  • نیاز به SQL در علم داده The need for SQL in data science

  • آنچه باید بدانید What you should know

1. مبانی SQL برای علم داده 1. Foundations of SQL for Data Science

  • مروری بر عملیات علم داده Overview of data science operations

  • دستورات دستکاری داده Data manipulation commands

  • دستورات تعریف داده Data definition commands

  • استانداردهای SQL SQL standards

  • نصب PostgreSQL Installing PostgreSQL

  • فصل مسابقه Chapter Quiz

2. آمار اولیه با SQL 2. Basic Statistics with SQL

  • بارگیری داده ها Loading data

  • توابع اصلی جمع Basic aggregate functions

  • توابع جمع آماری Statistical aggregate functions

  • گروه بندی و فیلتر کردن داده ها Grouping and filtering data

  • پیوستن و فیلتر کردن داده ها Joining and filtering data

  • چالش: یک ویژگی را برای توزیع عادی آزمایش کنید Challenge: Test an attribute for normal distribution

  • راه حل: یک ویژگی را برای توزیع عادی آزمایش کنید Solution: Test an attribute for normal distribution

  • فصل مسابقه Chapter Quiz

3. Data Munging با SQL 3. Data Munging with SQL

  • تغییر شکل داده ها Reformat character data

  • استخراج رشته ها از داده های کاراکتر Extract strings from character data

  • فیلتر با عبارات منظم Filter with regular expressions

  • اصلاح مجدد داده های عددی Reformat numeric data

  • از SOUNDEX با متن غلط املایی استفاده کنید Use SOUNDEX with misspelled text

  • چالش: یک مجموعه داده برای تجزیه و تحلیل آماده کنید Challenge: Prepare a data set for analysis

  • راه حل: مجموعه داده ها را برای تجزیه و تحلیل آماده کنید Solution: Prepare a data set for analysis

  • فصل مسابقه Chapter Quiz

4. فیلترینگ و تجمیع 4. Filtering and Aggregation

  • برای پیدا کردن زیر گروه ها از بند HAVING استفاده کنید Use the HAVING clause to find subgroups

  • فرعی برای مقادیر ستون Subqueries for column values

  • پرس و جوها در بندهای FROM Subqueries in FROM clauses

  • پرس و جو در بندهای WHERE Subqueries in WHERE clauses

  • از ROLLUP برای ایجاد زیر جمع استفاده کنید Use ROLLUP to create subtotals

  • برای جمع بندی در ابعاد مختلف از CUBE استفاده کنید Use CUBE to total across dimensions

  • برای یافتن نتایج برتر از پرس و جوهای Top-N استفاده کنید Use Top-N queries to find top results

  • چالش: فیلتر کردن و جمع آوری مجموعه داده ها Challenge: Filter and aggregate a data set

  • راه حل: یک مجموعه داده را فیلتر و تجمیع کنید Solution: Filter and aggregate a data set

  • فصل مسابقه Chapter Quiz

5. توابع پنجره و داده های سفارش داده شده 5. Window Functions and Ordered Data

  • آشنایی با توابع پنجره Introduction to window functions

  • NTH_VALUE و NTILE NTH_VALUE and NTILE

  • RANK ، LEAD و LAG RANK, LEAD, and LAG

  • WIDTH_BUCKET و CUME_DIST WIDTH_BUCKET and CUME_DIST

  • چالش: یک مجموعه داده را با استفاده از توابع Window تقسیم بندی کنید Challenge: Segment a data set using Window functions

  • راه حل: یک مجموعه داده را با استفاده از توابع Window تقسیم بندی کنید Solution: Segment a data set using Window functions

  • فصل مسابقه Chapter Quiz

6. عبارات جدول متداول 6. Common Table Expressions

  • آشنایی با عبارات جدول رایج (CTE) Introduction to common table expressions (CTEs)

  • چندین جدول عبارت جدول رایج Multiple table common table expressions

  • جداول سلسله مراتبی Hierarchical tables

  • عبارات جدول رایج بازگشتی Recursive common table expressions

  • چالش: بازنویسی یک پرس و جو پیچیده برای استفاده از CTE ها Challenge: Rewrite a complex query to use CTEs

  • راه حل: برای استفاده از CTE یک پرس و جو پیچیده را بازنویسی کنید Solution: Rewrite a complex query to use CTEs

  • فصل مسابقه Chapter Quiz

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

آموزش SQL متوسط برای دانشمندان داده
جزییات دوره
2h 38m
49
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
-
- از 5
ندارد
دارد
دارد
Dan Sullivan
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Dan Sullivan Dan Sullivan

معمار سازمانی ، کارشناس بزرگ داده دان سالیوان ، دکترای علوم ، یک معمار سازمانی و متخصص داده های بزرگ است.

دان متخصص در معماری داده ، تجزیه و تحلیل ، داده کاوی ، آمار ، مدل سازی داده ها ، داده های بزرگ و رایانش ابری است. علاوه بر این ، او دارای دکترای ژنتیک ، بیوانفورماتیک و زیست محاسباتی است. Dan به طور منظم با Spark ، Oracle ، NoSQL ، MongoDB ، Redis ، R و Python کار می کند. وی تجربه نوشتن گسترده ای در موضوعاتی از جمله رایانش ابری ، داده های بزرگ ، Hadoop و امنیت دارد.