간헐적 API 호출 실패

Incident Report for tosspayments

Postmortem

2026년 04월 28일 15시 10분부터 발생한 온라인 결제 서비스 장애를 아래와 같이 보고드립니다.

1.장애내용

  • 영향 시간 : 2026년 4월 28일 15:10~15:30
  • 영향 내용: api.tosspayments.com 진입점에서 일부 API 요청(약 3%)에 대해 간헐적으로 503 응답이 발생하여 결제 승인 일부 실패
  • 장애 원인: 2026년 04월 28일 15시 10분, 결제 진입점 인프라의 트래픽 처리 용량 조정 작업 진행 중 신규로 투입된 노드 1대(전체 32대 중 1대)에서 후단 서비스로의 연결 오류 발생함.

해당 노드를 경유한 요청에 대해서만 503 응답이 반환됨. 전체 트래픽의 약 3%(1/32 확률)가 간헐적으로 실패.
API 신규 호출 시 다른 정상 노드로 재분배되는 구조로, 새로고침·재시도 시 대부분 정상 처리됨.

2. 조치 사항

  • 2026년 04월 28일 15시 37분 해당 작업 롤백 완료, 해당 노드 API 호출 및 응답 정상화 되었습니다.

3. 재발 방지 대책

  • 진입점 503/504 응답률 실시간 임계 알람 지표 추가 계획입니다.
  • 결제 승인 실패율 임계 알람 기준 조정 계획입니다.
Posted Apr 29, 2026 - 14:25 KST

Resolved

이슈가 해소되었습니다.
Posted Apr 28, 2026 - 15:52 KST

Monitoring

api.tosspayments.com 도메인 간헐적 호출 실패 현상 발생
Posted Apr 28, 2026 - 15:50 KST
This incident affected: 결제 | payment and 상점관리자 | Admin Page.