Site Reliability Engineering: Tìm hiểu SRE

Docker Cookbook dành cho các nhà phát triển, quản trị viên hệ thống và kỹ sư DevOps muốn sử dụng Docker trong môi trường phát triển, QA hoặc sản xuất của mình.

Mô tả

Qua nội dung sách này bạn sẽ được các thành viên chủ chốt của Nhóm Google Site Reliability Engineering sẽ giải thích cách thức và lý do tại sao cam kết của họ đối với toàn bộ vòng đời sản phẩm, dịch vụ đã cho phép công ty thành công xây dựng, triển khai, giám sát và duy trì một số hệ thống phần mềm lớn nhất trên thế giới. Bạn sẽ tìm hiểu các nguyên tắc và thực tiễn cho phép các kỹ sư của Google tạo ra các bài học có thể mở rộng, đáng tin cậy và hiệu quả hơn trực tiếp với tổ chức của bạn

Giới thiệu ebook

  • Giới thiệu: tìm hiểu về vai trò kĩ sư SRE (site reliability engineering) là gì và tại sao nó khác với thực tiễn CNTT thông thường.
  • Nguyên tắc: kiểm tra các mô hình, hành vi và các mối quan tâm ảnh hưởng đến công việc của một kỹ sư SRE.
  • Thực tiễn: hiểu được lý thuyết và thực tiễn của công việc hàng ngày của SRE: xây dựng và vận hành các hệ thống máy tính phân tán lớn
  • Quản lý: khám phá các phương pháp hay nhất của Google cho việc đào tạo, truyền thông và họp hành mà tổ chức của bạn có thể sử dụng

Nội dung:

Chapter 1 Introduction
Chapter 2 The Production  at Google, from the Viewpoint of an SRE
Chapter 3 Embracing Risk
Chapter 4 Service Level Objectives
Chapter 5 Eliminating Toil
Chapter 6 Monitoring Distributed Systems
Chapter 7 The Evolution of Automation at Google
Chapter 8  Engineering
Chapter 9 Simplicity
Chapter 10 Practical Alerting from Time-Series Data
Chapter 11 Being On-Call
Chapter 12 Effective Troubleshooting
Chapter 13 Emergency Response
Chapter 14 Managing Incidents
Chapter 15 Postmortem Culture: Learning from Failure
Chapter 16 Tracking Outages
Chapter 17  for Reliability
Chapter 18 Software Engineering in SRE
Chapter 19 Load Balancing at the Frontend
Chapter 20 Load Balancing in the Datacenter
Chapter 21 Handling Overload
Chapter 22 Addressing Cascading Failures
Chapter 23 Managing Critical State: Distributed Consensus for Reliability
Chapter 24 Distributed Periodic Scheduling with Cron
Chapter 25 Data Processing Pipelines
Chapter 26 Data Integrity: What You Read Is What You Wrote
Chapter 27 Reliable Product Launches at Scale
Chapter 28 Accelerating SREs to On-Call and Beyond
Chapter 29 Dealing with Interrupts
Chapter 30 Embedding an SRE to Recover from Operational Overload
Chapter 31 Communication and Collaboration in SRE
Chapter 32 The Evolving SRE Engagement Model
Chapter 33 Lessons Learned from Other Industries
Chapter 34 Conclusion

Đánh giá

Chưa có đánh giá nào.

Xong phong đánh giá “Site Reliability Engineering: Tìm hiểu SRE”