Prometheus 4

[책 주요 내용] AlertManager 실습 과제 및 정리

최근에 블로그가 완전 뜸합니다. ^^ 쿠버네티스 관련 책을 쓰고 있어 나름 집중하느라 블로그는 소흘하네요. 하지만 얼마없는 방문수이지만 가끔씩 들어오시는 분들이 있네요. 그분들에게 조금이라도 도움이 될까하여 현재 쓰고 있는 책의 주요 부분을 소개합니다. 책의 19장 AlertManager의 실습 과제와 핵심 내용을 공유합니다. 제 책이 실습 과제 위주라 실습만 잘 하셔도 도움이 될 것 같습니다. 실습과제 프로메테우스, 얼럿매니저 웹서비스에서 경고(Alert) 메뉴의 주요 기능을 확인합니다. 얼럿매니저 연동을 위하여 별도의 슬랙채널과 해당 채널의 웹훅 URL을 생성합니다. 웹훅 URL을 얼럿매니저 설정 파일(alertmanager.yaml)에 등록합니다. 임의의 노드를 전원 오프하여 얼럿매니저에서 정상적으..

18. Kube 교육 - Loki Logging System

실습 Loki Helm 설치 POD 로그 조회 및 Filtering Why Loki kube 로그는 기존 VM legacy 시스템과 다르게 로그가 저장되지 않고, pod 수도 너무 많고 (1,000개 pod 넘는건 일도 아님) 또 여러 pod 로그를 동시에 보아야 하는 제약 사항이 있습니다. 이에, 기존 VM 환경 로그 시스템이 아닌 새로운 통합 log 시스템이 필요 합니다. Loki는 기존에 많이 사용하시는 ELK, FluentD 로그 시스템에 비하여 resource 소비도 작고 설치도 간편하여 최근에 많이 사용하고 있습니다. 저희 고객사도 현재 잘 사용 중인데 적용 시 고려했던 사항 위주로 실습과 함께 알아 보겠습니다. 기존 VM Legacy 로그 시스템 차이점 (VM 환경에 Elastic 사용하시면..

16. Kube 교육 - Grafana Custom 대시보드 생성

실습 Prometheus-stack Helm Chart Built-in + Grafana 공식 홈페이지 모니터링 대시보드 Import 기존 대시보드 nginx active connections graph(panel) 추가 모니터링 Dashboard 이슈 사항 클러스터 운영을 위해서 시스템 운영 현황 대시보드는 필수적입니다. 문제는 모니터링 해야 할 Metric이 너무 많아 선택이 어렵다는 것 입니다. 그리고 신규 Grafana 기반으로 새로운 모니터링 대쉬보드 만들기가 쉽지는 않습니다. 운영에 반드시 필수적인 부문이지만 저도 경험이 많지 않아 자세한 일사이트를 나누기는 어렵습니다. 다만, 간단히 사용 가능하도록 기존 다른 사람들이 잘 만든 대시보드를 Import 하는 방법과 서로 다른 대시보드에서 내가 ..

15. Kube 교육 - Prometheus Stack 설치

실습 prometheus-stack 설치 grafana 기본 모니터링 페이지 확인 Why Prometheus? Kube 환경에서는 Prometheus가 모니터링 표준 입니다. (이미 2018년 CNCF Graduated, Kubernetes 이 후 2번째 CNCF 졸업 Project 입니다.) 다른 툴 비교하지 마시고 그냥 사용하시면 됩니다. ^^ 예산이 있다면 상용 툴 사용하는 것도 나쁘지 않습니다. 모니터링은 정말 Custom 영역이 많이 들어가는 부문이라 각 회사 상황에 따라 시간과 노력이 많이 필요 합니다. 운영 하면서 당연히 끊임없이 개선이 필요한 부문이죠. 그 광활한 부문 중 이번 포스팅에서는 설치 방법과 모니터링 페이지 확인까지 다루겠습니다. Prometheus-stack 설치 다른 모든 a..