forecast

주어진 시계열 데이터에 대해 예측 데이터를 출력합니다.

문법

forecast [OPTIONS] TIME_SERIES_FIELD [by GRP_FIELD, ...]
필수 매개변수
TIME_SERIES_FIELD
시계열 데이터를 갖는 필드

선택 매개변수

count=INT
출력할 데이터 행 개수(기본값: 5)
period=INT
데이터의 시계열 주기. 지정하지 않으면 고속 푸리에 변환(Fast Fourier Transform, FFT)을 이용해 자동으로 주기를 계산합니다.
seed=INT
고정 시드 값. 같은 입력에 같은 결과를 유지하고 싶을 때 시드 값을 지정합니다.
time=FIELD
시간 레코드로 사용할 필드(기본값: _time 필드).
by GRP_FIELD, ...
by 지시자와 함께 집계에 사용할 그룹핑 필드 목록. 구분자로 쉼표(,)를 사용합니다. 이 옵션은 TIME_SERIES_FIELD 뒤에 지정해야 합니다.

설명

timechart 명령어 등으로 시간 필드의 데이터의 간격이 일정하도록 설정한 후 forecast 명령어를 사용하는 것을 권장합니다. 입력 데이터는 파티션 별로 4건 이상 있어야 하며, period의 값은 입력 데이터 건 수의 1/2 이하이어야 합니다.

사용 예

  1. count 필드의 예측 데이터를 출력

    forecast count
    
  2. traffic 필드의 시계열 주기를 5로 잡고, set_time 필드에 기재된 시간에 따라 시계열 예측 데이터를 출력. 같은 결과를 유지하기 위해 고정 시드 값으로 1234를 할당

    forecast period=5 time=set_time seed=1234 traffic
    
  3. region 필드를 기준으로 sent_bytes 필드의 시계열 예측 데이터를 10건씩 집계하여 추출

    forecast count=10 sent_bytes by region