نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره:
مهندسی قابلیت اطمینان سایت (SRE) چگونگی اجرای سیستم های تولید گوگل توسط Google ، ارتقا availability دسترسی زیاد با سرعت بالا و حذف زحمت عملیاتی است. این اهداف همان DevOps بدون تغییر فرهنگ است. مهندسی قابلیت اطمینان سایت (SRE) مجموعه اصول و روشهایی است که از تحویل نرم افزار پشتیبانی می کند - سیستم های تولید را پایدار نگه می دارد و همچنان ویژگی های جدید را با سرعت ارائه می دهد. در این دوره ، مهندسی قابلیت اطمینان سایت (SRE): The Big Picture ، شما نمای کاملی از نحوه کار SRE و اینکه چرا برای بسیاری از سازمان ها انتخاب خوبی است ، خواهید دید. ابتدا تفاوت بین SRE ، DevOps و عملیات سنتی را یاد خواهید گرفت. در مرحله بعدی ، خواهید فهمید که چگونه شیوه های مهندسی به کاهش زحمت کمک می کند و زمان بیشتری برای تمرکز روی کارهای با ارزش بالا فراهم می کند. سرانجام ، شما می آموزید که SRE چگونه به نظارت و هشدار نزدیک می شود ، و در مورد رویکرد SRE برای مدیریت حوادث یاد می گیرید. پس از پایان این دوره ، می توانید SRE را ارزیابی کنید و ببینید آیا این برای سازمان شما مناسب است یا خیر.
سرفصل ها و درس ها
بررسی اجمالی دوره
Course Overview
-
بررسی اجمالی دوره
Course Overview
معرفی مهندسی قابلیت اطمینان سایت
Introducing Site Reliability Engineering
-
مهندسی قابلیت اطمینان سایت چیست؟
What Is Site Reliability Engineering?
-
مقایسه OPS و SRE سنتی
Comparing Traditional Ops and SRE
-
مقایسه DevOps و SRE
Comparing DevOps and SRE
-
بررسی اصول اصلی SRE
Exploring the Key Tenets of SRE
-
درک اینکه چرا SRE کار می کند
Understanding Why SRE Works
-
خلاصه ماژول و رشد SRE
Module Summary and the Growth of SRE
اتوماسیون و از بین بردن زحمت
Automation and Eliminating Toil
-
درک زحمت
Understanding Toil
-
محدود کردن زحمت به 50٪
Restricting Toil to 50%
-
شناسایی و اندازه گیری زحمت
Identifying and Measuring Toil
-
مهندسی دور از زحمت
Engineering Away Toil
-
اولویت بندی پروژه های کاهش زحمت
Prioritizing Toil-reducing Projects
-
مقابله با زحمت باقیمانده
Dealing with the Remaining Toil
-
خلاصه ماژول و حداقل زحمت نظری
Module Summary and the Theoretical Minimum Toil
سطح خدمات ، نظارت و هشدار
Service Levels, Monitoring, and Alerting
-
درک اهداف سطح خدمات و بودجه های خطا
Understanding Service Level Objectives and Error Budgets
-
تعریف شاخص های سطح خدمات و اهداف سطح خدمات
Defining Service Level Indicators and Service Level Objectives
-
شاخص های سطح سرویس نظارت
Monitoring Service Level Indicators
-
هشدار در مورد اهداف سطح خدمات
Alerting on Service Level Objectives
-
خلاصه ماژول و بهبود SLO
Module Summary and SLO Improvement
مدیریت حوادث: هنگام تماس و پس از مرگ
Incident Management: On-call and Postmortems
-
آنچه در تماس به نظر می رسد در SRE است
What On-call Looks Like in SRE
-
مدیریت حوادث: کنترل ، هماهنگی ، برقراری ارتباط
Managing Incidents: Control, Co-ordinate, & Communicate
-
کار روی حوادث به طور موثر
Working on Incidents Effectively
-
تولید و انتشار Postmortems
Producing and Publishing Postmortems
-
جلوگیری از اضافه بار: ساختار زمان آماده به کار
Avoiding Overload: Structuring On-call Time
-
خلاصه ماژول و مراحل بعدی
Module Summary and Next Steps
نمایش نظرات