시스템 진단하기

시스템 상태를 진단한다.

====================================================
DX       RESULT    MESSAGES
----------------------------------------------------
cpu      ok        -
memory   ok        -
inet     ok        -
tcp      ok        -
disk     ok        -
coredump ok        -
====================================================

cpu 사용량 진단

RESULT

MESSAGES

상세

ok

-

모든 CPU가 평균 사용량이 50%미만으로 10초간 유지됨

warn

high usage

max usage

모든 코어가 50%이상 사용 중

특정코어의 점유율이 10초 동안 90%이상으로 유지됨

fail

cannot get usage

CPU 사용량을 얻을 수 없음

memory 사용량 진단

RESULT

MESSAGES

상세

ok

-

시스템 Free, M2 각 컴포넌트 사용량이 안정범위에서 사용 중

warn

high usage

too high

사용량이 높지만 시스템 Free 메모리가 50% 이상 확보되어 있음

메모리 잔여량이 부족하여 죽을 수 있음

fail

cannot get usage

메모리 사용량을 얻을 수 없음

inet 외부통신

RESULT

MESSAGES

상세

ok

-

외부 통신검사 80/443 tcp
  • github.com

  • api.m2live.co.kr

  • svl.m2live.co.kr

  • api.datadoghq.com

  • yum.datadoghq.com

  • keys.datadoghq.com

  • app.datadoghq.com

  • docs.datadoghq.com

fail

{domain}

해당 도메인과 통신할 수 없음

tcp 사용량 진단

RESULT

MESSAGES

상세

ok

-

TCP 소켓 수가 1만개 미만임

warn

high usage

ddos

TCP 소켓 수가 1만개 이상임

24시간 내에 DDOS 흔적이 있음

fail

cannot get usage

TCP 사용량을 얻을 수 없음

disk I/O 검사

RESULT

MESSAGES

상세

ok

-

설정된 경로에 임시파일 I/O가 1초 내에 수행됨
  • env.management.localCacheStorage.disks[].mount

  • functions.operations.log.meta.dir

warn

slow io

I/O속도가 1초를 넘음

fail

io

I/O 실패

coredump 흔적검사

RESULT

MESSAGES

상세

ok

-

coredump 흔적없음

warn

m2 process

unknown process

m2관련 coredump가 있음

알 수 없는 coredump

fail

io

coredump를 확인할 수 없음