Site Reliability Engineering
Site Reliability Engineering или SRE — это дисциплина, которая сочетает в себе эксплуатацию и разработку программного обеспечения. Последняя применяется, в частности, к проблемам инфраструктуры и эксплуатации. То есть вместо разработки функций продукта, SRE-инженеры создают системы для запуска приложений. Этот подход похож на DevOps: DevOps фокусируется на доставке кода в production, SRE обеспечивает надлежащую работу кода, уже запущенного в production.
Какую проблему решает
Для обеспечения надежной работы приложений необходим целый ряд инструментов и процессов, включая мониторинг производительности, систему оповещений, отладку и поиск неисправностей. Без них системные операторы могут только реагировать на возникающие проблемы, вместо того чтобы заблаговременно их предотвращать — простои становятся неизбежными.
Как именно решает проблему
SRE-подход позволяет минимизировать затраты, время и усилия на разработку программного обеспечения за счет непрерывного улучшения базовой системы. Система постоянно измеряет и контролирует состояние инфраструктуры и компонентов приложений. В случае возникновения проблем, система указывает SRE-инженерам, когда, где и как их устранить. Такой подход способствует созданию высокомасштабируемых и надежных программных систем благодаря автоматизации задач по эксплуатации.
Обратная связь
Полезна ли эта страница?
Thank you! Please let us know if you have any suggestions.
Thanks for your feedback. Please tell us how we can improve.