در این جلسه ، ما مختصری از روند جلب مهندسین از آن طرف برای توافق در مورد این اصول و ارائه اصول و درسی را که توافق کردیم ، شرح خواهیم داد.
در این سخنرانی ، مت استراتون زمینه جنگ ، پرواز و یخ زدگی و نحوه اعمال آن را برای سازمان ها توضیح می دهد.
این سخنرانی مورد تجاری برای آموزش ، معاملات بین هزینه و اثربخشی و بهترین روش ها برای طراحی و استقرار آموزش را بسته به اینکه سازمان شما در طیف اندازه و بلوغ کجا قرار دارد ، بررسی خواهد کرد.
در این شرایط بسیار توزیع شده چگونه می توان یک سیستم انعطاف پذیر ساخت؟ پاسخ مهندسی هرج و مرج است: شکستن همه چیز به عمد فقط برای تجربه واکنش کل سیستم.
چگونه در شرکتی با هزاران مهندس در سراسر کره زمین حوادث و مرگ های پس از مرگ را اداره می کنید؟ جیم سورینو آنچه را که برای اطلسیان کار کرده و نکرده است ، به اشتراک می گذارد.
در این گفتار ، ما خواهیم دید که چگونه برخی از ارکان مهندسی مقاومت شما و تیم شما می توانند در برابر تغییراتی که همه ما مجبور به مقابله با آنها هستیم ، کمک کنند.
بیایید با هم برویم شکار قو سیاه. این نوع شکار بسیار متفاوت است و ابزاری که ما به آن نیاز داریم هرج و مرج است. می بینید که قوهایی که شکار می کنیم در یک روز زیبا و آفتابی در یک برکه آرام نشسته اند و یا با شکوه روی دریاچه ای صاف سر نمی خورند.
در این جلسه ، ما نحوه اجرای حملات را به دو روش دستی و خودکار به شما نشان خواهیم داد. این شامل حملاتی است که به عنوان بخشی از خط لوله CI اجرا می شوند ، به طور تصادفی در تولید با استفاده از اتوماسیون اجرا می شوند یا آزمایشات با سیستم عامل های CaaS می توانند در GameDays استفاده شوند
هنگام شروع ساخت برنامه جدید ، شروع با چشم انعطاف پذیری از سردرد در خط جلوگیری می کند. روش های زیادی برای مقابله با این مسئله وجود دارد ، به خصوص در محیط های مختلف زبان و سیستم های زیست محیطی سیستم.
در این سخنرانی ، ما در مورد چگونگی اجرای نظریه SLO ها و آنچه آموختیم که انتظار نداشتیم در این روند بحث خواهیم کرد.
در این جلسه ، داگ کمبل در مورد نحوه استقرار Gremlin در Grubhub و نحوه آموزش و توانایی همه تیم های مهندسی برای استفاده از آن صحبت خواهد کرد.
در این گفتار ، ما بر روی چگونگی بکارگیری اصول مهندسی هرج و مرج در سرورهای بدون سرور ، هم برای توابع بدون سرور و هم برای خدمات مدیریت شده تمرکز می کنیم.
در این گفتار ، ژن کیم پنج ایده و چگونگی ارتباط آنها با مهندسی هرج و مرج را به اشتراک می گذارد. او همچنین نشان خواهد داد که چگونه پنج ایده آل به ایجاد شرکت های قوی تر ، با عملکرد بهتر و در نهایت قابل اطمینان تر کمک می کند.
در این جلسه ، Rahul Arya به اشتراک می گذارد که چگونه آنها یک پلت فرم برای حذف انطباق با انطباق ، ایجاد قابلیت اطمینان با خدمات خودکار مهندسی Chaos ایجاد کرده و توسعه دهندگان را قادر می سازد کد را سریعتر از همیشه ارسال کنند.
تقویت جامعه به همه ما کمک می کند تا شیوه های مهندسی هرج و مرج قوی تری ایجاد کنیم ، مهندسی هرج و مرج را تسریع می کند و در نهایت ، به همه ما کمک می کند تا یک اینترنت قابل اعتماد تر بسازیم.
در این سخنرانی ، ما به طیف اتوماسیون در DevOps ، الگوهای متداول وظایفی که می توانند به صورت خودکار دور شوند ، مانند CI/CD و نظارت و مواردی که می توانند تا حدی با Human-in-the-Loop DevOps خودکار شوند ، مانند پاسخ حادثه.
این گفتار نشان خواهد داد که چگونه می توانیم از تحلیل فرآیند نظری سیستم (STPA) ، همانطور که توسط تیم پروفسور نانسی لوسون در MIT پشتیبانی می شود ، برای تجزیه و تحلیل خطرات شکست استفاده کنیم.
این گفتگو بر این است که بفهمیم در چه مواردی می توانیم از بروز مشکلات جلوگیری کنیم و در چه مواردی می توانیم آنها را کمتر بدتر کنیم و چه نوع ابزاری را می توانیم برای ایجاد یک گاز ناامیدکننده از هر فاجعه ای استفاده کنیم.
این گفتگو نحوه ایجاد الگویی را ارائه می دهد که به هر کسی در Twilio امکان می دهد سیستم خود را بهتر بشناسد ، معیارهای مهم برای تماشای آن را بشناسد و نحوه استفاده از مهندسی آشوب برای تأیید همه این موارد را به اشتراک بگذارد.
در این جلسه ، ما به مطالعه موردی خواهیم پرداخت که چگونه یک تیم می تواند یک سیستم توزیع شده را پس از یک حادثه مهم بازیابی و بهبود بخشد.
در این گفتار ، ما باید کشف کنیم که چگونه این پارادایم های نوظهور می توانند از مهندسی آشوب برای مدیریت درد در مسیر ارائه راه حل استفاده کنند.
امی در مورد اینکه مهندسی انعطاف پذیری چیست ، ارتباط آن با DevOps و اینکه چگونه به ما دانش و تحقیقاتی را می دهد که می خواهیم سازمان های خود را به سطح بعدی قدرت برساند ، در عین چابکی و توانایی مراقبت ، صحبت خواهیم کرد.
در این جلسه کاهش سرعت در مقابل قطره و نیاز به بینش بیش از مشاهده قابل مقایسه است. با درک تفاوت ، شما آماده هدایت برنامه های چابک ، به دست آوردن بودجه برای کاهش بدهی فنی و تمرکز بر حفظ مشتری خواهید بود.
این جلسه توانایی مهندسی هرج و مرج را فراتر از انعطاف پذیری برای پشتیبانی از بهینه سازی ظرفیت می برد. چرا بینش بیشتری از داده ها کسب نمی کنید تا بتوانید اولویت ها را تنظیم کرده و به سرعت پاسخ دهید؟
هرج و مرج و عدم اطمینان در اطراف ماست. تامی باتو Failover Conf را با به اشتراک گذاشتن اینکه چرا قابلیت اطمینان و انعطاف پذیری اکنون بیش از هر زمان دیگری مهم است - و اینکه چگونه می توانید به آن برسید ، شروع می شود.
در این گفتار مروری بر دسته بندی موارد خاموشی که در چند سال گذشته در Uber بر اساس انواع علل ریشه رخ داده است ، ارائه می شود.
بیاموزید که چگونه Honeycomb از طریق خاتمه بخشیدن به گره های عمدی ، قابلیت اطمینان از Zookeeper ، Kafka و سیستم های ذخیره سازی مناسب ما را بهبود می بخشد.
در حالی که فرآیند بازآفرینی سیستم های تحویل در حاشیه H-E-B و تحویل در منزل را طی می کردیم ، ما مجبور بودیم تلاش قابل توجهی برای تثبیت و تقویت سیستم های موجود در مأموریت مهم انجام دهیم.
ما مهندسی هرج و مرج را ابزاری ارزشمند در رفع این نگرانی ها یافته ایم. از مثالهای دنیای واقعی یاد بگیرید که چه چیزی کار می کند ، چه چیزی کار نمی کند و چه آینده ای در انتظار شماست.
Nate Vogel ، VP ، Data Platforms ، در مورد چگونگی رشد تیم مهندسی داده با تأکید بر فرهنگ سازی برای اطمینان ، به اشتراک می گذارد.
بر اساس داده های PagerDuty و مکالمه با هزاران مشتری ، راشل در مورد ساده ترین کارهایی که می توانید انجام دهید برای ایجاد یک تغییر بزرگ در کاهش کار عملیاتی از حوادث صحبت خواهد کرد.
در این گفتار ، ما ابزارها و فرایندهای داخلی AWS را برای مقابله مناسب با خرابی های برنامه های توزیع نشده سرور بررسی خواهیم کرد.