프로젝트 배경
서비스 규모가 커지면서 쿠버네티스 환경 내 수많은 마이크로서비스가 통신할 때 발생하는 API 지연 및 에러의 원인을 즉각적으로 파악하기 어려웠습니다. 이에 전체 시스템의 트래픽 흐름을 추적할 수 있는 분산 추적 시스템을 도입하여 서버 다운타임을 방지하는 것이 최우선 목표였습니다.
프로젝트 성과
api 디버깅 시간 획기적 단축 및 트래픽 안정화
AWS X-Ray 연동을 통해 API 호출의 병목 구간과 에러 지점을 즉시 모니터링찾아내는 환경을 구축했습니다. 서비스 오류 해결 시간을 대폭 단축하고 시스템 전체 안정성을 극대화했습니다.
핵심 기능
진행 단계
아키텍처 최적화 설계
2025.08.
시스템 부하 최소화를 위해 노드별로 OpenTelemetry 수집기를 분산 배치하는 MSA 맞춤형 인프라 구조를 기획 및 설계했습니다.
프로젝트 상세
Kubernetes 클러스터 환경에서 구동되는 수많은 마이크로서비스 간의 데이터 흐름을 실시간으로 파악하고, 시스템 가시성을 극대화하기 위한 백엔드 인프라 구축 프로젝트입니다. 각 Kubernetes 노드에 OpenTelemetry Collector를 데몬셋 형태로 분산 배치하는 최적화 아키텍처를 직접 기획 및 설계했습니다. 이를 통해 네트워크 오버헤드를 최소화하면서 마이크로서비스가 생성하는 텔레메트리 데이터






