نکته:
آخرین آپدیت رو دریافت میکنید حتی اگر این محتوا بروز نباشد.
نمونه ویدیویی برای نمایش وجود ندارد.
توضیحات دوره:
در این جلسه ، ما به یک مطالعه موردی خواهیم پرداخت که چگونه یک تیم می تواند یک سیستم توزیع شده را پس از یک حادثه مهم بازیابی و بهبود بخشد. در این جلسه ، ما به یک مطالعه موردی خواهیم پرداخت که چگونه یک تیم می تواند پس از یک حادثه بزرگ سیستم های توزیع شده به دلیل پیچیدگی و مقیاس باورنکردنی بیشتر در معرض خرابی نسبت به سایر سیستم ها هستند و حوادث واقعیت زندگی با این سیستم ها است. امسال تیم من با یک هفته حادثه برای سیستم مدیریت آدرس IP ما مواجه شد که مشتریان را تحت تأثیر قرار داد. از این حادثه ، ما مجبور بودیم عملکرد سیستم خود را مورد ارزیابی مجدد قرار دهیم و چندین بخش اصلی از کد ما را مورد بازنگری قرار دهیم و همچنین نظارت ، فرآیندهای آزمایش ، تعاملات پایگاه داده و قابلیت اطمینان را بهبود ببخشیم. بینندگان در مورد این پیشرفت ها و اینکه چگونه می توانند برای دستیابی به قابلیت اطمینان و عملکرد بیشتر آنها را در سیستم های خود اعمال کنند ، یاد خواهند گرفت. علاوه بر این ، بینندگان می آموزند که چگونه از روشهای نظارت برای کشف ناکارآمدی در سیستم خود استفاده کنند ، نکاتی برای ایجاد یک فرآیند آزمایش برای فشار دادن صحیح سیستم شما قبل از استقرار در تولید ، و چگونگی جمع آوری یک تیم در یک حادثه فشار بالا.
سرفصل ها و درس ها
بهبود سیستم توزیع شده پس از حادثه
Improving a Distributed System Post-Incident
-
بهبود سیستم توزیع شده پس از حادثه
Improving a Distributed System Post-Incident
نمایش نظرات