لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
آموزش چارچوب جامع کیفیت دادهها (TDQ)
- آخرین آپدیت
دانلود The Total Data Quality Framework
نکته:
ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره:
در پایان اولین دوره از تخصص جامع کیفیت دادهها، فراگیران قادر خواهند بود:
۱. تفاوتهای اساسی بین دادههای طراحیشده و جمعآوریشده را شناسایی کرده و ابعاد کلیدی چارچوب جامع کیفیت دادهها (TDQ) را خلاصه کنند؛
۲. سه بعد اندازهگیری در چارچوب کیفیت جامع دادهها را تعریف کرده و تهدیدات احتمالی برای کیفیت دادهها را در هر یک از این ابعاد برای هر دو نوع دادههای جمعآوریشده و طراحیشده شرح دهند؛
۳. سه بعد بازنمایی در چارچوب کیفیت جامع دادهها را تعریف کرده و تهدیدات احتمالی برای کیفیت دادهها را در هر یک از این ابعاد برای هر دو نوع دادههای جمعآوریشده و طراحیشده شرح دهند؛
۴. توضیح دهند که چرا تحلیل دادهها بعد مهمی از چارچوب جامع کیفیت دادهها را تعریف میکند و تهدیدات احتمالی برای کیفیت کلی یک برنامه تحلیلی برای دادههای طراحیشده و/یا جمعآوریشده را خلاصه کنند.
این تخصص در مجموع با هدف بررسی عمیق چارچوب جامع کیفیت دادهها و ارائه اطلاعات بیشتر به فراگیران درباره ارزیابی دقیق کیفیت کل دادهها که باید پیش از تحلیل دادهها انجام شود، طراحی شده است. هدف این است که فراگیران ارزیابی کیفیت دادهها را به عنوان یک جزء حیاتی در تمامی پروژههای خود بگنجانند. ما صمیمانه امیدواریم که دانش کیفیت جامع دادهها را به تمامی فراگیران، از جمله دانشمندان داده و تحلیلگران کمی که آموزش کافی در مراحل اولیه فرآیند علم داده (تمرکز بر جمعآوری و ارزیابی کیفیت دادهها) ندیدهاند، منتقل کنیم. ما معتقدیم که دانش گسترده در مورد تکنیکهای علم داده و روشهای تحلیل آماری، در صورتی که دادههای جمعآوریشده کیفیت لازم را نداشته باشند، کمکی به یک مطالعه پژوهشی کمی نخواهد کرد.
این تخصص بر مراحل ضروری اول در هر نوع تحقیق علمی با استفاده از دادهها تمرکز دارد: تولید یا جمعآوری دادهها، درک منشأ دادهها، ارزیابی کیفیت دادهها و برداشتن گامهایی برای به حداکثر رساندن کیفیت دادهها پیش از انجام هرگونه تحلیل آماری یا به کارگیری تکنیکهای علم داده برای پاسخ به سوالات پژوهشی. با توجه به این تمرکز، مطالب کمی در مورد تحلیل دادهها ارائه خواهد شد، زیرا این موضوع در تخصصهای متعدد دیگر کورسرا پوشش داده شده است. تمرکز اصلی این تخصص بر درک و بهینهسازی کیفیت دادهها پیش از تحلیل خواهد بود.
سرفصل ها و درس ها
مقدمه، انواع مختلف دادهها و چارچوب جامع کیفیت دادهها
Introduction, Different Types of Data and the Total Data Quality Framework
به تخصص و دوره اول خوش آمدید!
Welcome to the Specialization and Course 1!
مقدمهای بر دوره اول: چارچوب جامع کیفیت دادهها
Introduction to Course 1: The Total Data Quality Framework
دادههای طراحیشده چیستند؟
What Are Designed Data?
مثال: ایجاد یک نظرسنجی آنلاین با SurveyMonkey
Example: Developing an Online Survey with SurveyMonkey
دادههای جمعآوریشده چیستند؟
What are Gathered Data?
مثال: استخراج دادهها از وب (Web Scraping)
Example: Scraping Data from the Web
دادههای ترکیبی: طراحیشده و جمعآوریشده
Hybrid Data: Designed and Gathered
چارچوب جامع کیفیت دادهها
The Total Data Quality Framework
مصاحبه: دیدگاههایی درباره معنای کیفیت جامع دادهها
Interview: Perspectives on the Meaning of Total Data Quality
ابعاد اندازهگیری کیفیت جامع دادهها: اعتبار، منشأ دادهها و پردازش دادهها
Measurement Dimensions of Total Data Quality: Validity, Data Origin, and Data Processing
تعریف اعتبار (Validity)
Defining Validity
تهدیدات اعتبار برای دادههای طراحیشده
Threats to Validity for Designed Data
مصاحبه شناختی (فکر کردن با صدای بلند)
Cognitive Interviewing (Think Aloud)
تمرین عملی: استفاده از اپلیکیشن پیشبینی کیفیت نظرسنجی
Try It Out: Using The Survey Quality Predictor Application
تهدیدات اعتبار برای دادههای جمعآوریشده
Threats to Validity for Gathered Data
تعریف منشأ دادهها (Data Origin)
Defining Data Origin
تهدیدات منشأ دادهها برای دادههای طراحیشده
Data Origin Threats for Designed Data
تهدیدات منشأ دادهها برای دادههای جمعآوریشده
Data Origin Threats for Gathered Data
تعریف پردازش دادهها
Defining Data Processing
تهدیدات پردازش دادهها برای دادههای طراحیشده
Data Processing Threats for Designed Data
مطالعه موردی: واریانس بین کدگذاران
Case Study: Between-Coder Variance
تهدیدات پردازش دادهها برای دادههای جمعآوریشده
Data Processing Threats for Gathered Data
مطالعه موردی: ابهام در نام نویسنده در دادههای کتابشناختی
Case Study: Author Name Ambiguity in Bibliographic Data
ابعاد بازنمایی کیفیت جامع دادهها: دسترسی به دادهها، منبع دادهها و دادههای گمشده
Representation Dimensions of Total Data Quality: Data Access, Data Source, and Data Missingness
تعریف دسترسی به دادهها
Defining Data Access
تعریف جمعیتهای هدف
Defining Target Populations
بخش اول از دو بخش: تهدیدات دسترسی به دادهها برای دادههای جمعآوریشده
Part 1 of 2: Data Access Threats for Gathered Data
بخش دوم از دو بخش: تهدیدات دسترسی به دادهها برای دادههای جمعآوریشده
Part 2 of 2: Data Access Threats for Gathered Data
مطالعه موردی: نمونههای تصادفی از APIهای توییتر ممکن است تصادفی نباشند
Case Study: Random Samples from Twitter APIs May Not Be Random
تهدیدات دسترسی به دادهها برای دادههای طراحیشده
Data Access Threats for Designed Data
مطالعه موردی: ارزیابی چارچوبهای نمونهبرداری/دادههای تجاری
Case Study: Evaluating Sampling Frames/Commercial Data
تعریف منبع دادهها
Data Source Definition
تهدیدات منبع دادهها برای دادههای طراحیشده
Data Source Threats for Designed Data
تهدیدات منبع دادهها برای دادههای جمعآوریشده
Data Source Threats for Gathered Data
مطالعه موردی: چگونه ویژگیهای محتوا و کاربر میتواند بر کیفیت دادههای جمعآوریشده تأثیر بگذارد
Case Study: How Content and User Characteristics Can Impact Quality of Gathered Data
مطالعه موردی: چه کسانی در دادههای کاربران توییتر گم شدهاند؟
Case Study: Who is Missing in Twitter User Data?
تعریف دادههای گمشده (Data Missingness)
Defining Data Missingness
تهدیدات دادههای گمشده برای دادههای طراحیشده
Data Missingness Threats for Designed Data
دموی جایگذاری مقادیر گمشده، تخمینهای قبل و بعد
Imputing Missing Values Demo, Before and After Estimates
تهدیدات دادههای گمشده برای دادههای جمعآوریشده
Data Missingness Threats for Gathered Data
تحلیل دادهها به عنوان جنبهای مهم از TDQ
Data Analysis as an Important Aspect of TDQ
چرا تحلیل دادهها بخشی از کیفیت جامع دادهها است؟
Why is Data Analysis Part of Total Data Quality?
تهدیدات کیفیت تحلیل دادهها برای دادههای طراحیشده
Threats to the Quality of Data Analysis for Designed Data
دمو: رویکردهای جایگزین برای تحلیل دادههای نظرسنجی
Demo: Alternative Approaches to Analyzing Survey Data
تهدیدات مربوط به تحلیل دادهها برای دادههای جمعآوریشده
Threats Concerning Data Analysis for Gathered Data
مطالعه موردی: سوگیری الگوریتمی در دادههای جمعآوریشده
Case Study: Algorithm Bias in Gathered Data
نمایش نظرات