summary
입력 레코드의 각 필드에 대한 통계 요약 정보를 출력합니다. 필드 이름, 타입, 레코드 수, 최솟값, 최댓값, 평균값을 한 번에 확인할 수 있어 데이터 탐색과 품질 확인에 활용합니다.
명령어 속성
| 항목 | 설명 |
|---|---|
| 명령어 유형 | 가공 쿼리 |
| 필요 권한 | 없음 |
| 라이선스 사용량 | 해당 없음 |
| 병렬 실행 | 지원 |
| 분산 실행 | 수집 노드에서 실행 (mapper) |
문법
summary
옵션
해당 사항 없음
출력 필드
| 필드 | 타입 | 설명 |
|---|---|---|
| name | 문자열 | 필드 이름 |
| type | 문자열 | 필드 데이터 타입 |
| count | 64비트 정수 | 해당 필드에 null이 아닌 값이 존재하는 레코드 수 |
| min | 64비트 실수 | 수치 필드의 최솟값. 수치 타입이 아닌 경우 null |
| max | 64비트 실수 | 수치 필드의 최댓값. 수치 타입이 아닌 경우 null |
| avg | 64비트 실수 | 수치 필드의 평균값. 수치 타입이 아닌 경우 null |
오류 코드
파싱 오류
해당 사항 없음
런타임 오류
해당 사항 없음
설명
summary 명령어는 입력 레코드를 모두 소비한 뒤, 각 필드별로 통계 요약 레코드를 생성하여 출력합니다. 출력 레코드는 필드 이름 기준 알파벳 순서로 정렬됩니다.
수치 타입(정수, 실수) 필드에 대해서는 최솟값, 최댓값, 평균값을 계산합니다. 수치 타입이 아닌 필드의 min, max, avg는 null로 출력됩니다.
count 필드는 해당 필드에 null이 아닌 값이 존재하는 레코드 수를 나타냅니다. 따라서 전체 레코드 수와 다를 수 있습니다.
사용 예
-
테이블 필드 통계 확인
table duration=1h ACCESS_LOG | summaryACCESS_LOG테이블에서 최근 1시간 데이터를 읽어 각 필드의 타입, 건수, 최솟값, 최댓값, 평균값을 확인합니다. -
파싱 결과 검증
table duration=10m FIREWALL_LOG | parsekv | summary방화벽 로그를 키-값 형식으로 파싱한 결과의 필드 목록과 각 필드별 통계를 확인합니다.
호환성
summary 명령어는 소나 4.0 이전 버전부터 제공되었습니다.