forecast
주어진 시계열 데이터에 대해 예측 데이터를 출력합니다.
문법
forecast [OPTIONS] TIME_SERIES_FIELD [by GRP_FIELD, ...]
필수 매개변수
TIME_SERIES_FIELD
- 시계열 데이터를 갖는 필드
선택 매개변수
count=INT
- 출력할 데이터 행 개수(기본값:
5
) period=INT
- 데이터의 시계열 주기. 지정하지 않으면 고속 푸리에 변환(Fast Fourier Transform, FFT)을 이용해 자동으로 주기를 계산합니다.
seed=INT
- 고정 시드 값. 같은 입력에 같은 결과를 유지하고 싶을 때 시드 값을 지정합니다.
time=FIELD
- 시간 레코드로 사용할 필드(기본값: _time 필드).
by GRP_FIELD, ...
by
지시자와 함께 집계에 사용할 그룹핑 필드 목록. 구분자로 쉼표(,
)를 사용합니다. 이 옵션은TIME_SERIES_FIELD
뒤에 지정해야 합니다.
설명
timechart 명령어 등으로 시간 필드의 데이터의 간격이 일정하도록 설정한 후 forecast
명령어를 사용하는 것을 권장합니다. 입력 데이터는 파티션 별로 4건 이상 있어야 하며, period
의 값은 입력 데이터 건 수의 1/2 이하이어야 합니다.
사용 예
-
count 필드의 예측 데이터를 출력
forecast count
-
traffic 필드의 시계열 주기를
5
로 잡고, set_time 필드에 기재된 시간에 따라 시계열 예측 데이터를 출력. 같은 결과를 유지하기 위해 고정 시드 값으로1234
를 할당forecast period=5 time=set_time seed=1234 traffic
-
region 필드를 기준으로 sent_bytes 필드의 시계열 예측 데이터를 10건씩 집계하여 추출
forecast count=10 sent_bytes by region