- 시계열 데이터(Time series data)
특정한 개체의 자료를 시간이 지남에 따라 순차적으로 얻게 되는 데이터이다.
- 횡단면 데이터(Cross sectional data)
엑셀 자료와 같이 일반적으로 볼 수 있는 데이터 셋이다.
시계열 분석의 목적
- 기술(Description): 과거 자료를 이용하여 시도표를 작성하고, 시계열의 구성 요소를 확인하는 것으로 추세, 순환, 계절성, 특이점을 파악할 수 있다.
* 시도표(Time Plot)
: 시계열 자료를 그림으로 그리는 것으로 시계열의 특성을 파악할 수 있다.
예측 결과를 시도표로 작성할 시에는 신뢰 구간을 함께 표시한다.
2. 예측(Forecasting): 모형화를 통해 미래 시점의 값을 예측한다.
3. 설명(Explanation): 구축된 시계열 모형이 현실과 부합되어야 한다.
4. 제어(Control): 구축된 모형으로부터 예측된 결과를 기반으로 하여 적절한 통제를 수행한다.
시계열 구성 요인
- 추세 요인(Trend factor)
시계열에 영향을 주는 "장기 변동". 반드시 추세가 선형적이지 않아도 감소나 증가로 변화하는 방향을 알 수 있다.
ex) 기술의 변화, 인플레이션
2. 순환 요인(Cycle factor)
시계열에 영향을 주는 "중기 변동". 일정한 빈도가 아닌 모습으로 증가하거나 감수하는 패턴이다.
ex) 경기 순환 주기
3. 계절 요인(Seasonal factor)
1년을 주기로 발생하는 "단기 변동". 일정한 빈도의 형태로 나타난다.
ex) 월, 분기 데이터
4. 불규칙 요인(Irregular factor)
측정 및 예측이 어려운 오차 변동을 의미. 위의 세 가지 요인으로 설명하고 남은 변동이다.
(trend가 남아 있다면 더 분석을 해야 한다.)
[출처: 박유성, 김기환, SAS/ETS를 이용한 시계열 자료분석 1, 자유아카데미(2002)]
'Statistics' 카테고리의 다른 글
[Statistics][Regression] 비선형 회귀모형(로지스틱 회귀모형; Logistic Regression) (0) | 2021.10.14 |
---|---|
[Statistics][ANOVA] 일원 분류 분산분석(One -way ANOVA) (0) | 2021.09.30 |
[Statistics][ANOVA] 분산분석(ANOVA) 기본개념/ 독립 이표본 t-검정(Independent two-sample t-test) (0) | 2021.09.09 |
[Statistics][Time Series Analysis] 2. 시계열 회귀분석 (0) | 2021.07.12 |
댓글