11.그룹 함수

Edit

11.1array()

그룹에 속한 값들의 배열을 생성합니다. 그룹 당 최대 100개의 항목을 수집하여 중복된 값도 포함한 집합으로 배열을 생성합니다.

그룹에 속한 모든 유일한 값의 집합을 추출하고 싶다면 values() 함수를 사용하면 됩니다.

문법

array(FIELD)
FIELD

값의 배열을 생성할 필드 표현식

11.2avg()avg()

그룹에 속한 모든 표현식의 평균을 계산합니다. null이거나 숫자(short, int, long, float, double)가 아닌 표현식은 무시합니다.

문법

avg(FIELD_1[,FIELD_2, ..., FIELD_N)
FIELD_1[,FIELD_2, ..., FIELD_N

평균을 계산할 필드를 반환하는 표현식 목록. 구분자로 쉼표(,)를 사용

사용 예

# 1~100 범위의 숫자로 무작위 100개의 레코드를 갖는 필드를 2개 만들고 평균 계산 
| json "{}" 
| repeat count=100 | eval n1=rand(101), n2=rand(101) 
| stats avg(n1) as n1_avg, avg(n2) as n2_avg

11.3corr()corr()

그룹별 피어슨 상관계수를 계산합니다. X, Y 표현식 중 하나라도 null이거나 숫자(short, int, long, float, double)가 아닌 표현식은 무시합니다.

문법

corr(X_FIELD, Y_FIELD)
X_FIELD, Y_FILED

피어슨 상관계수를 계산할 필드 목록 표현식

사용 예

json "{}" 
| repeat count=100 | eval n1=seq(), n2=sqrt(seq()) 
| stats corr(n1, n2)

11.4count()count()

그룹별로 행 수를 계산합니다. 표현식이 지정되지 않은 경우에는 전체 행 수를 반환합니다. 표현식이 지정된 경우에는 null이 아닌 값으로 평가되는 행 수를 반환합니다.

문법

count
count(FIELD)
FIELD

전체 행 수를 계산할 필드 표현식

11.5cov()cov()

그룹별 공분산을 계산합니다. 2개의 표현식 중 하나라도 null이거나 숫자(short, int, long, float, double)가 아닌 표현식은 무시합니다.

문법

cov(X_FIELD, Y_FIELD)
X_FIELD, Y_FILED

그룹별 공분산을 계산할 필드 목록 표현식

11.6dc()dc()

그룹에 속한 유일한 값들의 개수를 추출합니다.

문법

dc(FIELD)
FIELD

유일한 값들의 개수를 계산할 필드 표현식

11.7estdc()estdc()

그룹에 속한 유일한 값들의 근사치를 추출합니다. 비트수는 4~24 사이 값을 입력할 수 있으며, 기본값은 16입니다. 비트수가 높을수록 정확도와 메모리 사용량이 증가합니다.

문법

estdc(FIELD[, NUMBER])
FIELD

유일한 값들의 개수를 계산할 필드 표현식

NUM

4-24 사이의 비트수

11.8first()first()

그룹에 속한 표현식 중에서 첫번째 표현식의 값을 반환합니다.

first(EXPR)

문법

11.9last()last()

그룹에 속한 표현식 중에서 마지막 표현식의 값을 반환합니다.

문법

last(EXPR)

11.10max()max()

그룹에 속한 표현식 중에서 최대값을 계산합니다. null인 표현식은 무시됩니다. 서로 다른 타입 간의 비교는 정의되지 않은 동작을 수행합니다.

문법

max(EXPR)

11.11min()min()

그룹에 속한 표현식 중에서 최소값을 계산합니다. null인 표현식은 무시됩니다. 서로 다른 타입 간의 비교는 정의되지 않은 동작을 수행합니다.

문법

min(EXPR)

11.12slope()slope()

그룹별 X/Y 선형 회귀선의 기울기를 계산합니다. 2개의 표현식 중 하나라도 null이거나 숫자(short, int, long, float, double)가 아닌 표현식은 무시합니다.

문법

slope(X_FIELD, Y_FILED)
X_FIELD, Y_FILED

선형 회귀선의 기울기를 계산할 필드 목록 표현식

11.13stddev()stddev()

그룹에 속한 모든 표현식의 표준편차를 계산합니다. null이거나 숫자(short, int, long, float, double)가 아닌 표현식은 무시합니다.

문법

stddev(FIELD)
FIELD

표준편차를 계산할 필드 표현식

11.14sum()sum()

그룹에 속한 모든 표현식의 합을 계산합니다. null이거나 숫자(short, int, long, float, double)가 아닌 표현식은 무시합니다.

문법

sum(FIELD_1[,FIELD_2, ..., FIELD_N)
FIELD_1[,FIELD_2, ..., FIELD_N

총합계를 계산할 필드를 반환하는 표현식 목록. 구분자로 쉼표(,)를 사용하며, 전체 레코드의 총 합계를 계산합니다.

11.15values()values()

그룹에 속한 모든 유일한 값의 집합을 추출합니다. 그룹 당 최대 100개의 항목을 수집하여 유일한 값의 집합으로 배열을 생성합니다.

문법

values(FIELD)
FIELD

유일한 값의 배열을 생성할 필드 표현식

11.16var()var()

그룹에 속한 모든 표현식의 분산을 계산합니다. null이거나 숫자(short, int, long, float, double)가 아닌 표현식은 무시합니다.

문법

var(FIELD)
FIELD

분산을 계산할 필드 표현식

Count of comments [0]