900만 건 검색 결과가 JVM을 죽인 이유: OOM 장애 분석기
by | TECH_ESSAY | 2026-06-13
#Backend #Architecture 특허 검색 서비스에서 900만 건을 메모리에 통째로 적재하다 OOM으로 서비스가 죽은 실제 프로덕션 장애 회고. 엘라스틱서치와 트래픽 급증을 의심한 오진 단계부터 in-memory 그룹핑이라는 근본 원인까지 추적하고, liveness probe 부재로 쿠버네티스가 장애를 감지조차 못 한 시스템 약점까지 짚는다.