آموزش SQL متوسط برای دانشمندان داده

Intermediate SQL for Data Scientists

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:

نیاز فزاینده ای به دانشمندان و تحلیلگران داده برای درک ذخیره داده های رابطه ای وجود دارد. سازمان ها از دیتابیس های SQL برای ذخیره داده های معاملاتی و همچنین اطلاعات مربوط به هوش تجاری استفاده می کنند. این دوره برای دانشمندان داده که نیاز به کار با پایگاه های داده SQL دارند طراحی شده است. به طور خاص ، این برنامه برای کمک به این متخصصان برای یادگیری نحوه انجام وظایف رایج علم داده ، از جمله اکتشاف و استخراج داده ها در پایگاه های داده رابطه ای ، طراحی شده است.

Dan Sullivan مدرس دوره ای را با مروری کوتاه بر دستکاری داده های SQL و دستورات تعریف داده سپس بر نحوه استفاده از پرس و جوهای SQL برای آماده سازی داده ها برای تجزیه و تحلیل تمرکز می کند. برای درک بهتر آن داده ها از توابع آماری استفاده کنید. و با کل ، عملیات پنجره و موارد دیگر کار کنید.


سرفصل ها و درس ها

معرفی Introduction

  • نیاز به SQL در علم داده The need for SQL in data science

  • آنچه باید بدانید What you should know

1. مبانی SQL برای علم داده 1. Foundations of SQL for Data Science

  • مروری بر عملیات علم داده Overview of data science operations

  • دستورات دستکاری داده Data manipulation commands

  • دستورات تعریف داده Data definition commands

  • استانداردهای SQL SQL standards

  • نصب PostgreSQL Installing PostgreSQL

  • فصل مسابقه Chapter Quiz

2. آمار اولیه با SQL 2. Basic Statistics with SQL

  • بارگیری داده ها Loading data

  • توابع اصلی جمع Basic aggregate functions

  • توابع جمع آماری Statistical aggregate functions

  • گروه بندی و فیلتر کردن داده ها Grouping and filtering data

  • پیوستن و فیلتر کردن داده ها Joining and filtering data

  • چالش: یک ویژگی را برای توزیع عادی آزمایش کنید Challenge: Test an attribute for normal distribution

  • راه حل: یک ویژگی را برای توزیع عادی آزمایش کنید Solution: Test an attribute for normal distribution

  • فصل مسابقه Chapter Quiz

3. Data Munging با SQL 3. Data Munging with SQL

  • تغییر شکل داده ها Reformat character data

  • استخراج رشته ها از داده های کاراکتر Extract strings from character data

  • فیلتر با عبارات منظم Filter with regular expressions

  • اصلاح مجدد داده های عددی Reformat numeric data

  • از SOUNDEX با متن غلط املایی استفاده کنید Use SOUNDEX with misspelled text

  • چالش: یک مجموعه داده برای تجزیه و تحلیل آماده کنید Challenge: Prepare a data set for analysis

  • راه حل: مجموعه داده ها را برای تجزیه و تحلیل آماده کنید Solution: Prepare a data set for analysis

  • فصل مسابقه Chapter Quiz

4. فیلترینگ و تجمیع 4. Filtering and Aggregation

  • برای پیدا کردن زیر گروه ها از بند HAVING استفاده کنید Use the HAVING clause to find subgroups

  • فرعی برای مقادیر ستون Subqueries for column values

  • پرس و جوها در بندهای FROM Subqueries in FROM clauses

  • پرس و جو در بندهای WHERE Subqueries in WHERE clauses

  • از ROLLUP برای ایجاد زیر جمع استفاده کنید Use ROLLUP to create subtotals

  • برای جمع بندی در ابعاد مختلف از CUBE استفاده کنید Use CUBE to total across dimensions

  • برای یافتن نتایج برتر از پرس و جوهای Top-N استفاده کنید Use Top-N queries to find top results

  • چالش: فیلتر کردن و جمع آوری مجموعه داده ها Challenge: Filter and aggregate a data set

  • راه حل: یک مجموعه داده را فیلتر و تجمیع کنید Solution: Filter and aggregate a data set

  • فصل مسابقه Chapter Quiz

5. توابع پنجره و داده های سفارش داده شده 5. Window Functions and Ordered Data

  • آشنایی با توابع پنجره Introduction to window functions

  • NTH_VALUE و NTILE NTH_VALUE and NTILE

  • RANK ، LEAD و LAG RANK, LEAD, and LAG

  • WIDTH_BUCKET و CUME_DIST WIDTH_BUCKET and CUME_DIST

  • چالش: یک مجموعه داده را با استفاده از توابع Window تقسیم بندی کنید Challenge: Segment a data set using Window functions

  • راه حل: یک مجموعه داده را با استفاده از توابع Window تقسیم بندی کنید Solution: Segment a data set using Window functions

  • فصل مسابقه Chapter Quiz

6. عبارات جدول متداول 6. Common Table Expressions

  • آشنایی با عبارات جدول رایج (CTE) Introduction to common table expressions (CTEs)

  • چندین جدول عبارت جدول رایج Multiple table common table expressions

  • جداول سلسله مراتبی Hierarchical tables

  • عبارات جدول رایج بازگشتی Recursive common table expressions

  • چالش: بازنویسی یک پرس و جو پیچیده برای استفاده از CTE ها Challenge: Rewrite a complex query to use CTEs

  • راه حل: برای استفاده از CTE یک پرس و جو پیچیده را بازنویسی کنید Solution: Rewrite a complex query to use CTEs

  • فصل مسابقه Chapter Quiz

نتیجه Conclusion

  • مراحل بعدی Next steps

نمایش نظرات

Linkedin (لینکدین)

لینکدین: شبکه اجتماعی حرفه‌ای برای ارتباط و کارآفرینی

لینکدین به عنوان یکی از بزرگترین شبکه‌های اجتماعی حرفه‌ای، به میلیون‌ها افراد در سراسر جهان این امکان را می‌دهد تا ارتباط برقرار کنند، اطلاعات حرفه‌ای خود را به اشتراک بگذارند و فرصت‌های شغلی را کشف کنند. این شبکه اجتماعی به کاربران امکان می‌دهد تا رزومه حرفه‌ای خود را آپدیت کنند، با همکاران، دوستان و همکاران آینده ارتباط برقرار کنند، به انجمن‌ها و گروه‌های حرفه‌ای ملحق شوند و از مقالات و مطالب مرتبط با حوزه کاری خود بهره‌مند شوند.

لینکدین همچنین به کارفرمایان امکان می‌دهد تا به دنبال نیروهای با تجربه و مهارت مورد نیاز خود بگردند و ارتباط برقرار کنند. این شبکه حرفه‌ای به عنوان یک پلتفرم کلیدی برای بهبود دسترسی به فرصت‌های شغلی و گسترش شبکه حرفه‌ای خود، نقش مهمی را ایفا می‌کند. از این رو، لینکدین به عنوان یکی از مهمترین ابزارهای کارآفرینی و توسعه حرفه‌ای در دنیای امروز مورد توجه قرار دارد.

آموزش SQL متوسط برای دانشمندان داده
جزییات دوره
2h 38m
49
Linkedin (لینکدین) Linkedin (لینکدین)
(آخرین آپدیت)
-
- از 5
ندارد
دارد
دارد
Dan Sullivan
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Dan Sullivan Dan Sullivan

معمار سازمانی ، کارشناس بزرگ داده دان سالیوان ، دکترای علوم ، یک معمار سازمانی و متخصص داده های بزرگ است.

دان متخصص در معماری داده ، تجزیه و تحلیل ، داده کاوی ، آمار ، مدل سازی داده ها ، داده های بزرگ و رایانش ابری است. علاوه بر این ، او دارای دکترای ژنتیک ، بیوانفورماتیک و زیست محاسباتی است. Dan به طور منظم با Spark ، Oracle ، NoSQL ، MongoDB ، Redis ، R و Python کار می کند. وی تجربه نوشتن گسترده ای در موضوعاتی از جمله رایانش ابری ، داده های بزرگ ، Hadoop و امنیت دارد.