آموزش SRE: مفاهیم و اصول مهندسی قابلیت اطمینان سایت - آخرین آپدیت

دانلود SRE: Concepts and Principles

نکته: ممکن هست محتوای این صفحه بروز نباشد ولی دانلود دوره آخرین آپدیت می باشد.
نمونه ویدیوها:
توضیحات دوره: مهندسی قابلیت اطمینان سایت (SRE) مجموعه‌ای از اصول و متدهایی است که از تحویل نرم‌افزار پشتیبانی می‌کند تا سیستم‌های عملیاتی را پایدار نگه داشته و در عین حال ویژگی‌های جدید را با سرعت بالا ارائه دهد. در این دوره آموزشی (SRE: Concepts and Principles)، شما از طریق دموهای عملی در مورد نحوه عملکرد SRE و ابزارهای پشتیبان آن، آشنایی سریعی با این حوزه خواهید داشت. ابتدا تفاوت‌های بین SRE، DevOps و عملیات سنتی IT را می‌آموزید. سپس کشف خواهید کرد که چگونه متدهای مهندسی به کاهش کارهای تکراری (Toil) کمک کرده و زمان بیشتری برای تمرکز بر وظایف با ارزش بالا فراهم می‌کنند. در نهایت، نحوه رویکرد SRE به مانیتورینگ و سیستم‌های هشدار (Alerting) را بررسی خواهید کرد. در پایان این دوره، شما قادر خواهید بود SRE را ارزیابی کرده و تشخیص دهید که آیا برای سازمان شما مناسب است یا خیر.

سرفصل ها و درس ها

بررسی مشکلات: آن‌کال با یک متخصص SRE Investigating Issues: On-call with an SRE

  • رسیدگی به مشکل تحویل نرم‌افزار Addressing a Software Delivery Problem

  • یک روز از زندگی یک SRE: بخش اول A Day in the Life of an SRE: Part 1

  • دمو: پاسخ به یک هشدار Demo: Responding to an Alert

  • تفاوت SRE با عملیات IT چیست؟ How Is SRE Different from IT Ops?

  • دمو: کاهش اثرات یک مشکل در محیط عملیاتی Demo: Mitigating a Production Issue

  • تفاوت SRE با DevOps چیست؟ How Is SRE Different from DevOps?

  • SRE چیست؟ What Is SRE?

دسته‌بندی و ردیابی عملکرد با سطوح سرویس Classifying and Tracking Performance with Service Levels

  • معرفی اهداف سطح سرویس (SLO) Introducing Service Level Objectives

  • یک روز از زندگی یک SRE: بخش دوم A Day in the Life of an SRE: Part 2

  • دمو: بازتولید یک مشکل عملکردی Demo: Reproducing a Performance Issue

  • درک SLOها و بودجه خطا (Error Budget) Understanding SLOs and the Error Budget

  • دمو: افزودن متریک‌ها و ردیابی (Tracing) Demo: Adding Metrics and Tracing

  • بررسی SLIها و پشته مانیتورینگ Exploring SLIs and the Monitoring Stack

  • چرا SLOها بهتر از SLAها هستند؟ Why SLOs Beat SLAs

مدیریت ریسک و کاهش زمان توقف (Downtime) Managing Risk and Reducing Downtime

  • همسو کردن SLOها با اهداف تجاری Aligning SLOs with Business Goals

  • دمو: تست خودکار بر اساس SLOها Demo: Automated Testing against SLOs

  • استقرار نرم‌افزار در چارچوب بودجه خطا Deploying within the Error Budget

  • دمو: تست یک معماری جدید Demo: Testing a New Architecture

  • SRE و معماری اپلیکیشن SRE and Application Architecture

مدیریت خطاها با مدیریت رخدادها (Incident Management) Handling Failure with Incident Management

  • چه زمانی رویدادها تبدیل به رخداد (Incident) می‌شوند؟ When Events Become Incidents

  • دمو: ایجاد یک رخداد Demo: Triggering an Incident

  • درک مدیریت رخدادها Understanding Incident Management

  • دمو: بررسی فراتر از دفترچه راهنما (Runbook) Demo: Investigating beyond the Runbook

  • کارآمدی در مدیریت رخدادها Working on Incidents Effectively

بازبینی و بهبود متدها با تحلیل‌های پس از حادثه (Postmortems) Reflecting and Improving Practices with Postmortems

  • آیا به تحلیل پس از حادثه نیاز داریم؟ Do We Need a Postmortem?

  • تولید و انتشار گزارش‌های Postmortem Producing and Publishing Postmortems

  • دمو: نوشتن یک گزارش Postmortem Demo: Writing a Postmortem

  • دمو: نوشتن گزارش Postmortem (بخش دوم) Demo: Writing a Postmortem (Part 2)

  • بهره‌برداری موثر از تحلیل‌های پس از حادثه Making Postmortems Count

  • جمع‌بندی دوره Course Summary

نمایش نظرات

آموزش SRE: مفاهیم و اصول مهندسی قابلیت اطمینان سایت
جزییات دوره
1h 59m
30
(آخرین آپدیت)
18
4.9 از 5
دارد
دارد
دارد
جهت دریافت آخرین اخبار و آپدیت ها در کانال تلگرام عضو شوید.

Google Chrome Browser

Internet Download Manager

Pot Player

Winrar

Elton Stoneman Elton Stoneman

Docker Captain و Microsoft MVP