Gremlin

Gremlin یک سرویس مهندسی هرج و مرج است که مأموریت دارد به ساخت یک اینترنت با اطمینان تر کمک کند. راه حل های آنها با ارائه یک پلت فرم کاملاً میزبان SaaS به مهندسان برای آزمایش ایمن روی سیستم های پیچیده ، شکست را به انعطاف پذیری تبدیل می کنند تا نقاط ضعف را قبل از تأثیر آنها بر مشتری و از دست دادن درآمد شناسایی کنند. این شرکت از سال 2016 توسط مدیر عامل شرکت Kolton Andrus و CTO Matthew Fornaciari تاسیس شد و از این پس 26.8 میلیون دلار بودجه از Redpoint Ventures ، Index Ventures و Amplify Partners جمع آوری کرده است. مشتریان موجود شامل JPMorgan Chase ، Mailchimp ، Qualtrics ، Twilio ، Walmart و Workiva هستند.
دوره های این مدرس:

آموزش اصول مهندسی هرج و مرج IBM

IBM's Principles of Chaos Engineering

در این جلسه ، ما مختصری از روند جلب مهندسین از آن طرف برای توافق در مورد این اصول و ارائه اصول و درسی را که توافق کردیم ، شرح خواهیم داد.


آموزش جنگ ، پرواز یا مسدود کردن

Fight, Flight, or Freeze

در این سخنرانی ، مت استراتون زمینه جنگ ، پرواز و یخ زدگی و نحوه اعمال آن را برای سازمان ها توضیح می دهد.


آموزش Swim Don’t Sink: چرا قابلیت اطمینان برای عملکرد مهندسی قابلیت اطمینان سایت اهمیت دارد

Swim Don’t Sink: Why Reliability Matters to a Site Reliability Engineering Practice

این سخنرانی مورد تجاری برای آموزش ، معاملات بین هزینه و اثربخشی و بهترین روش ها برای طراحی و استقرار آموزش را بسته به اینکه سازمان شما در طیف اندازه و بلوغ کجا قرار دارد ، بررسی خواهد کرد.


آموزش شکستن چیزهای بدون سرور در مورد هدف - مهندسی هرج و مرج در محیط های بدون دولت

Breaking Serverless Things on Purpose - Chaos Engineering in Stateless Environments

در این شرایط بسیار توزیع شده چگونه می توان یک سیستم انعطاف پذیر ساخت؟ پاسخ مهندسی هرج و مرج است: شکستن همه چیز به عمد فقط برای تجربه واکنش کل سیستم.


آموزش درسهایی از مدیریت حوادث و موارد مرگ در Atlassian

Lessons from Incident Management and Postmortems at Atlassian

چگونه در شرکتی با هزاران مهندس در سراسر کره زمین حوادث و مرگ های پس از مرگ را اداره می کنید؟ جیم سورینو آنچه را که برای اطلسیان کار کرده و نکرده است ، به اشتراک می گذارد.


آموزش هاله مهندسی تاب آوری

The Halo of Resilience Engineering

در این گفتار ، ما خواهیم دید که چگونه برخی از ارکان مهندسی مقاومت شما و تیم شما می توانند در برابر تغییراتی که همه ما مجبور به مقابله با آنها هستیم ، کمک کنند.


آموزش آیا Chaos می تواند وضوح را از پیچیدگی پیچیده ناشی کند؟ قطعا.

Can Chaos Coerce Clarity from Compounding Complexity? Certainly.

بیایید با هم برویم شکار قو سیاه. این نوع شکار بسیار متفاوت است و ابزاری که ما به آن نیاز داریم هرج و مرج است. می بینید که قوهایی که شکار می کنیم در یک روز زیبا و آفتابی در یک برکه آرام نشسته اند و یا با شکوه روی دریاچه ای صاف سر نمی خورند.


آموزش خودکار حملات هرج و مرج در Expedia

Automating Chaos Attacks at Expedia

در این جلسه ، ما نحوه اجرای حملات را به دو روش دستی و خودکار به شما نشان خواهیم داد. این شامل حملاتی است که به عنوان بخشی از خط لوله CI اجرا می شوند ، به طور تصادفی در تولید با استفاده از اتوماسیون اجرا می شوند یا آزمایشات با سیستم عامل های CaaS می توانند در GameDays استفاده شوند


آموزش انعطاف پذیری برنامه داخلی

Built-in Application Resiliency

هنگام شروع ساخت برنامه جدید ، شروع با چشم انعطاف پذیری از سردرد در خط جلوگیری می کند. روش های زیادی برای مقابله با این مسئله وجود دارد ، به خصوص در محیط های مختلف زبان و سیستم های زیست محیطی سیستم.


آموزش مشکلات در اندازه گیری SLO

Pitfalls in Measuring SLOs

در این سخنرانی ، ما در مورد چگونگی اجرای نظریه SLO ها و آنچه آموختیم که انتظار نداشتیم در این روند بحث خواهیم کرد.


آموزش مهندسی هرج و مرج سلف سرویس: جایگزینی Gremlin در فرهنگ DevOps Grubhub

Self-service Chaos Engineering: Fitting Gremlin into Grubhub's DevOps Culture

در این جلسه ، داگ کمبل در مورد نحوه استقرار Gremlin در Grubhub و نحوه آموزش و توانایی همه تیم های مهندسی برای استفاده از آن صحبت خواهد کرد.


آموزش اجرای هرج و مرج در جهانی بدون سرور

Performing Chaos in a Serverless World

در این گفتار ، ما بر روی چگونگی بکارگیری اصول مهندسی هرج و مرج در سرورهای بدون سرور ، هم برای توابع بدون سرور و هم برای خدمات مدیریت شده تمرکز می کنیم.


آموزش Times Lead و ایمنی روانشناختی در پنج ایده آل

Lead Times and Psychological Safety within the Five Ideals

در این گفتار ، ژن کیم پنج ایده و چگونگی ارتباط آنها با مهندسی هرج و مرج را به اشتراک می گذارد. او همچنین نشان خواهد داد که چگونه پنج ایده آل به ایجاد شرکت های قوی تر ، با عملکرد بهتر و در نهایت قابل اطمینان تر کمک می کند.


آموزش Devs Be Devs: خلاصه ای از انطباق و قابلیت اطمینان برای تسریع در استفاده از ابر در JPMC

Let Devs Be Devs: Abstracting Compliance and Reliability to Accelerate JPMCs Cloud Deployments

در این جلسه ، Rahul Arya به اشتراک می گذارد که چگونه آنها یک پلت فرم برای حذف انطباق با انطباق ، ایجاد قابلیت اطمینان با خدمات خودکار مهندسی Chaos ایجاد کرده و توسعه دهندگان را قادر می سازد کد را سریعتر از همیشه ارسال کنند.


آموزش ایجاد یک جامعه قابل اعتماد

Building a Reliable Community

تقویت جامعه به همه ما کمک می کند تا شیوه های مهندسی هرج و مرج قوی تری ایجاد کنیم ، مهندسی هرج و مرج را تسریع می کند و در نهایت ، به همه ما کمک می کند تا یک اینترنت قابل اعتماد تر بسازیم.


آموزش Dev -ps در حلقه

Human-in-the-Loop DevOps

در این سخنرانی ، ما به طیف اتوماسیون در DevOps ، الگوهای متداول وظایفی که می توانند به صورت خودکار دور شوند ، مانند CI/CD و نظارت و مواردی که می توانند تا حدی با Human-in-the-Loop DevOps خودکار شوند ، مانند پاسخ حادثه.


آموزش شکست خوردن بدون سقوط کردن

Failing over without Falling over

این گفتار نشان خواهد داد که چگونه می توانیم از تحلیل فرآیند نظری سیستم (STPA) ، همانطور که توسط تیم پروفسور نانسی لوسون در MIT پشتیبانی می شود ، برای تجزیه و تحلیل خطرات شکست استفاده کنیم.


آموزش Y2K و سایر بلایای ناامید کننده: کاهش خطر و کاهش آسیب

Y2K and Other Disappointing Disasters: Risk Reduction and Harm Mitigation

این گفتگو بر این است که بفهمیم در چه مواردی می توانیم از بروز مشکلات جلوگیری کنیم و در چه مواردی می توانیم آنها را کمتر بدتر کنیم و چه نوع ابزاری را می توانیم برای ایجاد یک گاز ناامیدکننده از هر فاجعه ای استفاده کنیم.


آموزش هرچه بیشتر می دانید: راهنمای درک سیستم های خود

The More You Know: A Guide to Understanding Your Systems

این گفتگو نحوه ایجاد الگویی را ارائه می دهد که به هر کسی در Twilio امکان می دهد سیستم خود را بهتر بشناسد ، معیارهای مهم برای تماشای آن را بشناسد و نحوه استفاده از مهندسی آشوب برای تأیید همه این موارد را به اشتراک بگذارد.


آموزش بهبود سیستم توزیع شده پس از حادثه

Improving a Distributed System Post-Incident

در این جلسه ، ما به مطالعه موردی خواهیم پرداخت که چگونه یک تیم می تواند یک سیستم توزیع شده را پس از یک حادثه مهم بازیابی و بهبود بخشد.


آموزش همگرایی مهندسی هرج و مرج و تکنیک های انقلابی

Convergence of Chaos Engineering and Revolutionized Technology Techniques

در این گفتار ، ما باید کشف کنیم که چگونه این پارادایم های نوظهور می توانند از مهندسی آشوب برای مدیریت درد در مسیر ارائه راه حل استفاده کنند.


آموزش آینده DevOps مهندسی تاب آوری است

The Future of DevOps Is Resilience Engineering

امی در مورد اینکه مهندسی انعطاف پذیری چیست ، ارتباط آن با DevOps و اینکه چگونه به ما دانش و تحقیقاتی را می دهد که می خواهیم سازمان های خود را به سطح بعدی قدرت برساند ، در عین چابکی و توانایی مراقبت ، صحبت خواهیم کرد.


آموزش کاهش سرعت قطعی جدید است

Slowdown Is the New Outage

در این جلسه کاهش سرعت در مقابل قطره و نیاز به بینش بیش از مشاهده قابل مقایسه است. با درک تفاوت ، شما آماده هدایت برنامه های چابک ، به دست آوردن بودجه برای کاهش بدهی فنی و تمرکز بر حفظ مشتری خواهید بود.


آموزش اطمینان در هرج و مرج

Certainty among the Chaos

این جلسه توانایی مهندسی هرج و مرج را فراتر از انعطاف پذیری برای پشتیبانی از بهینه سازی ظرفیت می برد. چرا بینش بیشتری از داده ها کسب نمی کنید تا بتوانید اولویت ها را تنظیم کرده و به سرعت پاسخ دهید؟


آموزش قابلیت اطمینان بیش از هر زمان دیگری اهمیت دارد

Reliability Matters More Than Ever

هرج و مرج و عدم اطمینان در اطراف ماست. تامی باتو Failover Conf را با به اشتراک گذاشتن اینکه چرا قابلیت اطمینان و انعطاف پذیری اکنون بیش از هر زمان دیگری مهم است - و اینکه چگونه می توانید به آن برسید ، شروع می شود.


آموزش انعطاف پذیری فرهنگ سازی با داده ها: طبقه بندی خاموشی ها

Culturing Resiliency with Data: A Taxonomy of Outages

در این گفتار مروری بر دسته بندی موارد خاموشی که در چند سال گذشته در Uber بر اساس انواع علل ریشه رخ داده است ، ارائه می شود.


آموزش شناسایی وابستگی های پنهان

Identifying Hidden Dependencies

بیاموزید که چگونه Honeycomb از طریق خاتمه بخشیدن به گره های عمدی ، قابلیت اطمینان از Zookeeper ، Kafka و سیستم های ذخیره سازی مناسب ما را بهبود می بخشد.


آموزش تثبیت و تقویت سیستم های تکمیل حاشیه H-E-B در حالی که آنها را دوباره اختراع می کنید

Stabilizing and Reinforcing H-E-B's Curbside Fulfillment Systems While Reinventing Them

در حالی که فرآیند بازآفرینی سیستم های تحویل در حاشیه H-E-B و تحویل در منزل را طی می کردیم ، ما مجبور بودیم تلاش قابل توجهی برای تثبیت و تقویت سیستم های موجود در مأموریت مهم انجام دهیم.


آموزش مهندسی هرج و مرج: راهی برای قابلیت اطمینان

Chaos Engineering: The Path to Reliability

ما مهندسی هرج و مرج را ابزاری ارزشمند در رفع این نگرانی ها یافته ایم. از مثالهای دنیای واقعی یاد بگیرید که چه چیزی کار می کند ، چه چیزی کار نمی کند و چه آینده ای در انتظار شماست.


آموزش مقیاس گذاری فرهنگ انعطاف پذیری در شرکت در ارتباطات چارتر

Scaling Culture of Resiliency in the Enterprise at Charter Communications

Nate Vogel ، VP ، Data Platforms ، در مورد چگونگی رشد تیم مهندسی داده با تأکید بر فرهنگ سازی برای اطمینان ، به اشتراک می گذارد.


آموزش 5 کاری که می توانید برای کاهش بار عملیاتی انجام دهید

Top 5 Things You Can Do to Reduce Operational Load

بر اساس داده های PagerDuty و مکالمه با هزاران مشتری ، راشل در مورد ساده ترین کارهایی که می توانید انجام دهید برای ایجاد یک تغییر بزرگ در کاهش کار عملیاتی از حوادث صحبت خواهد کرد.


آموزش چگونه با Serverless شکست بخوریم

How to Fail with Serverless

در این گفتار ، ما ابزارها و فرایندهای داخلی AWS را برای مقابله مناسب با خرابی های برنامه های توزیع نشده سرور بررسی خواهیم کرد.