آموزش مهندسی قابلیت اطمینان سایت (SRE): تصویر بزرگ

Site Reliability Engineering (SRE): The Big Picture

نکته: آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره: مهندسی قابلیت اطمینان سایت (SRE) چگونگی اجرای سیستم های تولید گوگل توسط Google ، ارتقا availability دسترسی زیاد با سرعت بالا و حذف زحمت عملیاتی است. این اهداف همان DevOps بدون تغییر فرهنگ است. مهندسی قابلیت اطمینان سایت (SRE) مجموعه اصول و روشهایی است که از تحویل نرم افزار پشتیبانی می کند - سیستم های تولید را پایدار نگه می دارد و همچنان ویژگی های جدید را با سرعت ارائه می دهد. در این دوره ، مهندسی قابلیت اطمینان سایت (SRE): The Big Picture ، شما نمای کاملی از نحوه کار SRE و اینکه چرا برای بسیاری از سازمان ها انتخاب خوبی است ، خواهید دید. ابتدا تفاوت بین SRE ، DevOps و عملیات سنتی را یاد خواهید گرفت. در مرحله بعدی ، خواهید فهمید که چگونه شیوه های مهندسی به کاهش زحمت کمک می کند و زمان بیشتری برای تمرکز روی کارهای با ارزش بالا فراهم می کند. سرانجام ، شما می آموزید که SRE چگونه به نظارت و هشدار نزدیک می شود ، و در مورد رویکرد SRE برای مدیریت حوادث یاد می گیرید. پس از پایان این دوره ، می توانید SRE را ارزیابی کنید و ببینید آیا این برای سازمان شما مناسب است یا خیر.

سرفصل ها و درس ها

بررسی اجمالی دوره Course Overview

  • بررسی اجمالی دوره Course Overview

معرفی مهندسی قابلیت اطمینان سایت Introducing Site Reliability Engineering

  • مهندسی قابلیت اطمینان سایت چیست؟ What Is Site Reliability Engineering?

  • مقایسه OPS و SRE سنتی Comparing Traditional Ops and SRE

  • مقایسه DevOps و SRE Comparing DevOps and SRE

  • بررسی اصول اصلی SRE Exploring the Key Tenets of SRE

  • درک اینکه چرا SRE کار می کند Understanding Why SRE Works

  • خلاصه ماژول و رشد SRE Module Summary and the Growth of SRE

اتوماسیون و از بین بردن زحمت Automation and Eliminating Toil

  • درک زحمت Understanding Toil

  • محدود کردن زحمت به 50٪ Restricting Toil to 50%

  • شناسایی و اندازه گیری زحمت Identifying and Measuring Toil

  • مهندسی دور از زحمت Engineering Away Toil

  • اولویت بندی پروژه های کاهش زحمت Prioritizing Toil-reducing Projects

  • مقابله با زحمت باقیمانده Dealing with the Remaining Toil

  • خلاصه ماژول و حداقل زحمت نظری Module Summary and the Theoretical Minimum Toil

سطح خدمات ، نظارت و هشدار Service Levels, Monitoring, and Alerting

  • درک اهداف سطح خدمات و بودجه های خطا Understanding Service Level Objectives and Error Budgets

  • تعریف شاخص های سطح خدمات و اهداف سطح خدمات Defining Service Level Indicators and Service Level Objectives

  • شاخص های سطح سرویس نظارت Monitoring Service Level Indicators

  • هشدار در مورد اهداف سطح خدمات Alerting on Service Level Objectives

  • خلاصه ماژول و بهبود SLO Module Summary and SLO Improvement

مدیریت حوادث: هنگام تماس و پس از مرگ Incident Management: On-call and Postmortems

  • آنچه در تماس به نظر می رسد در SRE است What On-call Looks Like in SRE

  • مدیریت حوادث: کنترل ، هماهنگی ، برقراری ارتباط Managing Incidents: Control, Co-ordinate, & Communicate

  • کار روی حوادث به طور موثر Working on Incidents Effectively

  • تولید و انتشار Postmortems Producing and Publishing Postmortems

  • جلوگیری از اضافه بار: ساختار زمان آماده به کار Avoiding Overload: Structuring On-call Time

  • خلاصه ماژول و مراحل بعدی Module Summary and Next Steps

نمایش نظرات

آموزش مهندسی قابلیت اطمینان سایت (SRE): تصویر بزرگ
جزییات دوره
1h 41m
25
Pluralsight (پلورال سایت) Pluralsight (پلورال سایت)
(آخرین آپدیت)
104
4.8 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Elton Stoneman Elton Stoneman

Docker Captain و Microsoft MVP