لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش SQL متوسط برای دانشمندان داده
Intermediate SQL for Data Scientists
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
نیاز فزاینده ای به دانشمندان و تحلیلگران داده برای درک ذخیره داده های رابطه ای وجود دارد. سازمان ها از دیتابیس های SQL برای ذخیره داده های معاملاتی و همچنین اطلاعات مربوط به هوش تجاری استفاده می کنند. این دوره برای دانشمندان داده که نیاز به کار با پایگاه های داده SQL دارند طراحی شده است. به طور خاص ، این برنامه برای کمک به این متخصصان برای یادگیری نحوه انجام وظایف رایج علم داده ، از جمله اکتشاف و استخراج داده ها در پایگاه های داده رابطه ای ، طراحی شده است.
Dan Sullivan مدرس دوره ای را با مروری کوتاه بر دستکاری داده های SQL و دستورات تعریف داده سپس بر نحوه استفاده از پرس و جوهای SQL برای آماده سازی داده ها برای تجزیه و تحلیل تمرکز می کند. برای درک بهتر آن داده ها از توابع آماری استفاده کنید. و با کل ، عملیات پنجره و موارد دیگر کار کنید.
سرفصل ها و درس ها
معرفی
Introduction
نیاز به SQL در علم داده
The need for SQL in data science
آنچه باید بدانید
What you should know
1. مبانی SQL برای علم داده
1. Foundations of SQL for Data Science
مروری بر عملیات علم داده
Overview of data science operations
دستورات دستکاری داده
Data manipulation commands
دستورات تعریف داده
Data definition commands
استانداردهای SQL
SQL standards
نصب PostgreSQL
Installing PostgreSQL
فصل مسابقه
Chapter Quiz
2. آمار اولیه با SQL
2. Basic Statistics with SQL
بارگیری داده ها
Loading data
توابع اصلی جمع
Basic aggregate functions
توابع جمع آماری
Statistical aggregate functions
گروه بندی و فیلتر کردن داده ها
Grouping and filtering data
پیوستن و فیلتر کردن داده ها
Joining and filtering data
چالش: یک ویژگی را برای توزیع عادی آزمایش کنید
Challenge: Test an attribute for normal distribution
راه حل: یک ویژگی را برای توزیع عادی آزمایش کنید
Solution: Test an attribute for normal distribution
فصل مسابقه
Chapter Quiz
3. Data Munging با SQL
3. Data Munging with SQL
تغییر شکل داده ها
Reformat character data
استخراج رشته ها از داده های کاراکتر
Extract strings from character data
فیلتر با عبارات منظم
Filter with regular expressions
اصلاح مجدد داده های عددی
Reformat numeric data
از SOUNDEX با متن غلط املایی استفاده کنید
Use SOUNDEX with misspelled text
چالش: یک مجموعه داده برای تجزیه و تحلیل آماده کنید
Challenge: Prepare a data set for analysis
راه حل: مجموعه داده ها را برای تجزیه و تحلیل آماده کنید
Solution: Prepare a data set for analysis
فصل مسابقه
Chapter Quiz
4. فیلترینگ و تجمیع
4. Filtering and Aggregation
برای پیدا کردن زیر گروه ها از بند HAVING استفاده کنید
Use the HAVING clause to find subgroups
فرعی برای مقادیر ستون
Subqueries for column values
پرس و جوها در بندهای FROM
Subqueries in FROM clauses
پرس و جو در بندهای WHERE
Subqueries in WHERE clauses
از ROLLUP برای ایجاد زیر جمع استفاده کنید
Use ROLLUP to create subtotals
برای جمع بندی در ابعاد مختلف از CUBE استفاده کنید
Use CUBE to total across dimensions
برای یافتن نتایج برتر از پرس و جوهای Top-N استفاده کنید
Use Top-N queries to find top results
چالش: فیلتر کردن و جمع آوری مجموعه داده ها
Challenge: Filter and aggregate a data set
راه حل: یک مجموعه داده را فیلتر و تجمیع کنید
Solution: Filter and aggregate a data set
فصل مسابقه
Chapter Quiz
5. توابع پنجره و داده های سفارش داده شده
5. Window Functions and Ordered Data
آشنایی با توابع پنجره
Introduction to window functions
NTH_VALUE و NTILE
NTH_VALUE and NTILE
RANK ، LEAD و LAG
RANK, LEAD, and LAG
WIDTH_BUCKET و CUME_DIST
WIDTH_BUCKET and CUME_DIST
چالش: یک مجموعه داده را با استفاده از توابع Window تقسیم بندی کنید
Challenge: Segment a data set using Window functions
راه حل: یک مجموعه داده را با استفاده از توابع Window تقسیم بندی کنید
Solution: Segment a data set using Window functions
فصل مسابقه
Chapter Quiz
6. عبارات جدول متداول
6. Common Table Expressions
آشنایی با عبارات جدول رایج (CTE)
Introduction to common table expressions (CTEs)
چندین جدول عبارت جدول رایج
Multiple table common table expressions
جداول سلسله مراتبی
Hierarchical tables
عبارات جدول رایج بازگشتی
Recursive common table expressions
چالش: بازنویسی یک پرس و جو پیچیده برای استفاده از CTE ها
Challenge: Rewrite a complex query to use CTEs
راه حل: برای استفاده از CTE یک پرس و جو پیچیده را بازنویسی کنید
Solution: Rewrite a complex query to use CTEs
لینکدین: شبکه اجتماعی حرفهای برای ارتباط و کارآفرینی
لینکدین به عنوان یکی از بزرگترین شبکههای اجتماعی حرفهای، به میلیونها افراد در سراسر جهان این امکان را میدهد تا ارتباط برقرار کنند، اطلاعات حرفهای خود را به اشتراک بگذارند و فرصتهای شغلی را کشف کنند. این شبکه اجتماعی به کاربران امکان میدهد تا رزومه حرفهای خود را آپدیت کنند، با همکاران، دوستان و همکاران آینده ارتباط برقرار کنند، به انجمنها و گروههای حرفهای ملحق شوند و از مقالات و مطالب مرتبط با حوزه کاری خود بهرهمند شوند.
لینکدین همچنین به کارفرمایان امکان میدهد تا به دنبال نیروهای با تجربه و مهارت مورد نیاز خود بگردند و ارتباط برقرار کنند. این شبکه حرفهای به عنوان یک پلتفرم کلیدی برای بهبود دسترسی به فرصتهای شغلی و گسترش شبکه حرفهای خود، نقش مهمی را ایفا میکند. از این رو، لینکدین به عنوان یکی از مهمترین ابزارهای کارآفرینی و توسعه حرفهای در دنیای امروز مورد توجه قرار دارد.
معمار سازمانی ، کارشناس بزرگ داده
دان سالیوان ، دکترای علوم ، یک معمار سازمانی و متخصص داده های بزرگ است.
دان متخصص در معماری داده ، تجزیه و تحلیل ، داده کاوی ، آمار ، مدل سازی داده ها ، داده های بزرگ و رایانش ابری است. علاوه بر این ، او دارای دکترای ژنتیک ، بیوانفورماتیک و زیست محاسباتی است. Dan به طور منظم با Spark ، Oracle ، NoSQL ، MongoDB ، Redis ، R و Python کار می کند. وی تجربه نوشتن گسترده ای در موضوعاتی از جمله رایانش ابری ، داده های بزرگ ، Hadoop و امنیت دارد.
نمایش نظرات