목록Book (1)

Chapter 1 - Introduction📌 Summary시스템의 복잡도와 트래픽이 증가할수록 서비스 관리의 어려움이 커지며, 운영팀과 개발팀 간의 상이한 목표로 인해 갈등이 자주 발생한다. Google은 이를 해결하기 위해 운영을 코드로 해결하는 엔지니어링 접근법을 도입했고, 이를 SRE(Site Reliability Engineering) 라고 명명했다. SRE의 도입으로 인해 제품 개발팀과 SRE팀 간의 손쉬운 업무 전환이 가능해져, 개발팀과 운영팀의 분리에서 발생하는 갈등이 완화되었다. 또한, SRE팀은 반복적인 운영 작업을 자동화하고 혁신적인 운영 방식으로 전환하는 역할을 수행한다.SRE팀은 개발팀의 목표인 빠른 개발 속도와 운영팀의 목표인 서비스 안정성 사이의 균형을 맞추기 위해 SLO(S..
Book
2025. 3. 9. 12:00