boxplot

상자 그림(box plot)을 그리는데 필요한 최소, 최대, 사분위수를 계산합니다.

문법

boxplot EXPR [by GRP_FIELD, ...]
필수 매개변수
EXPR
통계 대상이 되는 계산 수식을 입력합니다.
선택 매개변수
by GRP_FIELD, ...
상자 그림의 대상이 되는 필드 이름을 입력합니다. 그룹 단위로 나누어 최소, 최대, 사분위수를 구하려면 그룹을 구분하는 기준이 될 필드 이름을 쉼표(,)로 구분하여 입력합니다. 이 by 절은 EXPR 바로 뒤에 사용해야 합니다.

설명

출력 필드는 아래와 같습니다:

  • count: GRP_FIELD 그룹별 레코드의 총개수. GRP_FIELD를 지정하지 않은 경우, 전체 레코드의 개수.
  • GRP_FIELD: by 절에 입력된 그룹 키의 값
  • iqr1: 그룹별 제1사분위수. 중앙값을 기준으로 하위 50%의 중앙값, 전체 데이터 중 하위 25%
  • iqr2: 그룹별 제2사분위수(중앙값). 데이터를 순서대로 정렬했을 때 가장 중앙에 위치하는 값
  • iqr3: 그룹별 제3사분위수. 중앙값을 기준으로 상위 50%의 중앙값, 전체 데이터 중 상위 25%
  • max: 그룹별 최대값
  • min: 그룹별 최소값

사용 예

  1. 전체 CPU 부하에 대한 통계 요약

    table sys_cpu_logs
    | eval usage = kernel + user 
    | boxplot usage
    
  2. 일자별 CPU 부하에 대한 통계 요약

    table sys_cpu_logs
    | eval day = string(_time, "yyyy-MM-dd")
    | eval usage = kernel + user
    | boxplot usage by day