summary

입력 레코드의 각 필드에 대한 통계 요약 정보를 출력합니다. 필드 이름, 타입, 레코드 수, 최솟값, 최댓값, 평균값을 한 번에 확인할 수 있어 데이터 탐색과 품질 확인에 활용합니다.

명령어 속성

항목설명
명령어 유형가공 쿼리
필요 권한없음
라이선스 사용량해당 없음
병렬 실행지원
분산 실행수집 노드에서 실행 (mapper)

문법

summary

옵션

해당 사항 없음

출력 필드

필드타입설명
name문자열필드 이름
type문자열필드 데이터 타입
count64비트 정수해당 필드에 null이 아닌 값이 존재하는 레코드 수
min64비트 실수수치 필드의 최솟값. 수치 타입이 아닌 경우 null
max64비트 실수수치 필드의 최댓값. 수치 타입이 아닌 경우 null
avg64비트 실수수치 필드의 평균값. 수치 타입이 아닌 경우 null

오류 코드

파싱 오류

해당 사항 없음

런타임 오류

해당 사항 없음

설명

summary 명령어는 입력 레코드를 모두 소비한 뒤, 각 필드별로 통계 요약 레코드를 생성하여 출력합니다. 출력 레코드는 필드 이름 기준 알파벳 순서로 정렬됩니다.

수치 타입(정수, 실수) 필드에 대해서는 최솟값, 최댓값, 평균값을 계산합니다. 수치 타입이 아닌 필드의 min, max, avgnull로 출력됩니다.

count 필드는 해당 필드에 null이 아닌 값이 존재하는 레코드 수를 나타냅니다. 따라서 전체 레코드 수와 다를 수 있습니다.

사용 예

  1. 테이블 필드 통계 확인

    table duration=1h ACCESS_LOG | summary
    

    ACCESS_LOG 테이블에서 최근 1시간 데이터를 읽어 각 필드의 타입, 건수, 최솟값, 최댓값, 평균값을 확인합니다.

  2. 파싱 결과 검증

    table duration=10m FIREWALL_LOG
    | parsekv
    | summary
    

    방화벽 로그를 키-값 형식으로 파싱한 결과의 필드 목록과 각 필드별 통계를 확인합니다.

호환성

summary 명령어는 소나 4.0 이전 버전부터 제공되었습니다.