آموزش نمایندگی ، پردازش و آماده سازی داده ها

Representing, Processing, and Preparing Data

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره: این دوره شامل ابزارهای مختلف پردازش داده ها - از جمله صفحات گسترده ، پایتون و پایگاه های اطلاعاتی رابطه ای است - و به بحث در مورد کیفیت کیفیت داده ها و تجسم داده ها برای تولید بینش می پردازد. علم داده و مدل سازی داده ها به عنوان قابلیت های اساسی که هر شرکت و هر تکنسینی باید داشته باشد ، به سرعت ظاهر می شوند این روزها. با دموکراتیک شدن روند ساخت واقعی مدل ها ، دیدگاه کلی به سمت استفاده از داده های مناسب و استفاده درست از داده ها سوق پیدا می کند. در این دوره ، نمایندگی ، پردازش و آماده سازی داده ها ، شما توانایی نمایش صحیح اطلاعات از دامنه خود را به عنوان داده های عددی به دست می آورید و آنها را به شکلی در می آورید که از قابلیت های کامل مدل ها استفاده شود. در ابتدا ، شما خواهید آموخت که چگونه می توان با داده های از دست رفته و اطلاعات از دست رفته به روشی کاملاً منطقی برخورد کرد. در مرحله بعدی ، نحوه استفاده از صفحات گسترده ، زبان های برنامه نویسی و پایگاه های داده رابطه ای را برای کار با داده های خود خواهید فهمید. انواع مختلفی از داده ها را که ممکن است در دنیای واقعی با آنها سر و کار داشته باشید و این که چگونه می توانید داده ها را در یک مقصد مشترک برای از بین بردن سیلوها جمع آوری و تلفیق کنید ، مشاهده خواهید کرد. سرانجام ، شما با کار کردن با ابزارهای تجسم که به هر عضوی از شرکت اجازه می دهد با داده ها کار کند و بینش های قابل توجهی استخراج کند ، دوره را دور می زنید. پس از اتمام این دوره ، مهارت و دانش لازم برای استفاده از منابع صحیح داده ، کنار آمدن با مشکلات کیفیت داده و انتخاب فن آوری های مناسب برای استخراج بینش از داده های سازمانی خود را خواهید داشت.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

درک روشهای تمیز کردن و آماده سازی داده ها Understanding Data Cleaning and Preparation Techniques

  • بررسی اجمالی ماژول Module Overview

  • پیش نیازها و طرح کلی دوره Prerequisites and Course Outline

  • یافتن و اتصال نقاط: جمع آوری و تجزیه و تحلیل داده ها Finding and Connecting Dots: Data Collection and Analysis

  • مقابله با مقادیر گمشده: حذف و حذف Dealing with Missing Values: Deletion and Imputation

  • شناسایی و کنار آمدن با Outlier ها Identifying and Coping with Outliers

  • خلاصه Summary

آماده سازی داده ها برای تجزیه و تحلیل با استفاده از صفحه گسترده و پایتون Preparing Data for Analysis Using Spreadsheets and Python

  • بررسی اجمالی ماژول Module Overview

  • اکسل: کار با موارد تکراری و مقادیر گمشده Excel: Working with Duplicates and Missing Values

  • اکسل: شناسایی و حذف موارد دور با استفاده از نمرات Z Excel: Identifying and Eliminating Outliers Using Z-scores

  • اکسل: بستن پره ها Excel: Clamping Outliers

  • پایتون: پر کردن مقادیر از دست رفته Python: Filling Missing Values

  • پایتون: کار با مقادیر گمشده در داده های دنیای واقعی Python: Working with Missing Values on Real World Data

  • پایتون: شناسایی و حذف موارد دور از دسترس Python: Identifying and Removing Outliers

  • Python: آموزش طبقه بندی ML با استفاده از مجموعه داده پاک شده Python: Training an ML Classifier Using the Cleaned Dataset

  • خلاصه Summary

جمع آوری داده ها برای استخراج بینش ها Collecting Data to Extract Insights

  • بررسی اجمالی ماژول Module Overview

  • استاندارد سازی Standardization

  • عادی سازی Normalization

  • بیند Binning

  • پردازش معاملات و تحلیلی Transactional and Analytical Processing

  • مقیاس گذاری عمودی و افقی Vertical and Horizontal Scaling

  • داده های دسته ای و جریانی Batch and Streaming Data

  • زمان رویداد ، زمان بلع و زمان پردازش Event Time, Ingestion Time, and Processing Time

  • خلاصه Summary

بارگیری و پردازش داده ها با استفاده از پایگاه های رابطه ای Loading and Processing Data Using Relational Databases

  • بررسی اجمالی ماژول Module Overview

  • ایجاد پایگاه داده Azure SQL Creating an Azure SQL Database

  • SQL Server Management Studio SQL Server Management Studio

  • بارگیری و سerال کردن داده های CSV Loading and Querying CSV Data

  • بارگذاری داده در Blob Storage و ایجاد یک کارخانه داده Uploading Data to Blob Storage and Creating a Data Factory

  • بارگیری داده ها با استفاده از Azure Data Factory Load Data Using Azure Data Factory

  • خلاصه Summary

نمایندگی بینش های به دست آمده از داده ها Representing Insights Obtained from Data

  • بررسی اجمالی ماژول Module Overview

  • داده های مداوم و دسته ای Continuous and Categorical Data

  • نمایش عددی داده های متنی Numeric Representations of Text Data

  • نمایش داده های تصویر به عنوان ماتریس Representing Image Data as Matrices

  • محصولات Azure Data Azure Data Products

  • نصب و کار با Azure Data Studio Installing and Working with Azure Data Studio

  • تجسم بصیرت با استفاده از Azure Data Studio Visualizing Insights Using Azure Data Studio

  • نصب و تجسم داده ها در Power BI Installing and Visualizing Data in Power BI

  • ایجاد تجسم های مختلف در Power BI Creating Different Visualizations in Power BI

  • خلاصه و مطالعه بیشتر Summary and Further Study

نمایش نظرات

آموزش نمایندگی ، پردازش و آماده سازی داده ها
جزییات دوره
2h 45m
42
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
59
4.5 از 5
دارد
دارد
دارد
Janani Ravi
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Janani Ravi Janani Ravi

معمار و مهندس داده خبره Google Cloud

Janani Ravi یک معمار و مهندس داده خبره Google cloud است.

جنانی مدرک کارشناسی ارشد خود را در رشته مهندسی برق از دانشگاه استنفورد دریافت کرد و برای مایکروسافت، گوگل و فلیپ کارت کار کرده است. او یکی از بنیانگذاران Loonycorn است، یک استودیوی محتوا که بر ارائه محتوای با کیفیت بالا برای توسعه مهارت های فنی متمرکز است، جایی که او عشق خود را به فناوری با اشتیاق خود به تدریس ترکیب می کند.