لطفا جهت اطلاع از آخرین دوره ها و اخبار سایت در
کانال تلگرام
عضو شوید.
خودکارسازی کیفیت داده ها در محیط های توسعه دهنده
Automating Data Quality in Dev Environments
نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیوها:
توضیحات دوره:
کیفیت داده ها ستون فقرات هوش مصنوعی موفق است، با این حال اکثر رهبران فاقد استانداردهای کیفیتی هستند که می توانند در تولید آنها را خودکار کنند. این دوره به شما می آموزد که چگونه استانداردهای کیفیتی را برای داده های دامنه خود ایجاد کنید، سپس آن استانداردها را در محیط های تولیدی خودکار کنید.
بیشتر سازمان ها با استانداردهای ناکافی برای اندازه گیری کیفیت، داده های بیشتری از آنچه که می توانند به طور مؤثر مدیریت کنند، تولید و دریافت می کنند. از آنجایی که رهبران با فشار فزاینده ای برای استفاده از هوش مصنوعی مواجه می شوند، شرکت هایی که استانداردهای بهتری را اتخاذ و اجرا نمی کنند، عقب خواهند ماند. مربی Lauren Maffeo توضیح می دهد که چگونه استانداردهای کیفیت داده را در هر دامنه تعریف کنید، چه کسی باید این استانداردهای کیفیت را تنظیم کند، از چه ابزارهایی باید برای مقیاس و خودکارسازی این استانداردها استفاده کنید، و چگونه اطمینان حاصل کنید که هر داده جدید با این استانداردها اندازه گیری می شود. درک درستی از افراد، فرآیندها و ابزارهای مورد نیاز برای دانستن کیفیت داده ها به دست آورید و آن استانداردها را در معماری داده خود ادغام کنید.
سرفصل ها و درس ها
مقدمه
Introduction
چرا کیفیت داده ها بسیار مهم است
Why data quality is crucial
1. نقشه راه خود را برای QA داده ها بنویسید
1. Write Your Roadmap for Data QA
کیفیت داده را تعریف کنید
Define data quality
یک نقشه راه برای تحویل محصول داده بنویسید
Write a roadmap for data product delivery
داده های خود را به عنوان یک محصول مدیریت کنید
Manage your data as a product
یک ممیزی داده انجام دهید
Do a data audit
یک نقشه فرآیند وضعیت فعلی ایجاد کنید
Create a current-state process map
یک پروژه با اولویت بالا را انتخاب کنید
Choose a high-priority project
2. توسعه حاکمیت محور را تمرین کنید
2. Practice Governance-Driven Development
پیش نویس نقشه فرآیند آینده
Draft a to-be process map
سیستم(های) منبع داده خود را تأیید کنید
Confirm your data's source system(s)
ردیابی نسب داده را تنظیم کنید
Set up data lineage tracking
حوزه های تبدیل داده را تعریف کنید
Define areas of data transformation
الزامات داده را برای نقشه راه خود بنویسید
Write data requirements for your roadmap
به تیم داده خود فضایی برای شکست بدهید
Give your data team room to fail
سطوح دسترسی به ازای هر کاربر را تعریف کنید
Define levels of access per user
یکپارچه سازی سیستم داده مناسب را ایجاد کنید
Establish the right data system integrations
چند کاربر فوق العاده را برای اعتبارسنجی محصول خود انتخاب کنید
Choose some super users to validate your product
حداقل معیارهای پذیرش داده های منبع خود را تعریف کنید (MAC)
Define your source data's minimum acceptance criteria (MAC)
3. نظارت بر داده ها در تولید
3. Monitor Data in Production
یک ماتریس ردیابی بسازید
Make a traceability matrix
اصول طراحی مش داده را تمرین کنید
Practice data mesh design principles
استانداردهای QA داده های خود را مقیاس و خودکار کنید
Scale and automate your data QA standards
Lauren Maffeo طراح خدمات ارشد در Steampunk، یک شرکت طراحی است که به دولت فدرال خدمت می کند.
لورن یک تحلیلگر و طراح برنده جوایز است که کارش شامل نوشتن و اجرای طرح های تحقیقاتی، مصاحبه های پیشرو با کاربران، میزبانی تست قابلیت استفاده، و ایجاد دارایی هایی مانند پرسونا، نقشه های فرآیند و سفر، نقشه های خدمات، و استراتژی محتوا است. مهاجرت. او نویسنده طراحی حاکمیت داده از سطح زمین است، و مدرس کمکی طراحی در دانشگاه جورج واشنگتن است. لورن یکی از ویراستاران مجله AI and Ethics Springer و یک ویرایشگر منطقه ای سابق برای Data and Policy، یک مجله با دسترسی آزاد با انتشارات دانشگاه کمبریج است. او برای نشریاتی نوشته است که شامل هاروارد، فایننشال تایمز، و گاردین میشود.
نمایش نظرات