제 3절 시계열 분석
1. 정상성 (stationarity)
- 시계열 자료 ; 시간의 흐름에 따라 관찰된 값들
* 비정상성 시계열 : 시계열 분석하는데 다루기 어려운 시계열 자료, 정상시계열로 만들어 분석
* 정상성 시계열 :
- 약한의미의 정상성 : 모든 시점에 평균일정, 시점과 분산 독립, 공분산은 시차에만 의존
- 비정상-> 정상 : 변환 (transformation), 차분 ( difference)
* 변환 : 부산이 일정하지 않은 비정상 시계열
* 차분 (t1-t0): 평균이 일정하지 않은 비정상 시계열
2.시계열 모형
가. 자기회귀모형(AR모형)
- p 시점 전의 자료가 현재 자료에 영향을 주는 자기회귀모형을 AR(p)모형이라 함.
- 자기회귀모형 판단 조건
*자기상관함수 (ACF) 빠르게 감소하고 부분 자기상관함수 (PACF)는 어느 시점에 절단점 갖음
나. 이동평균모형 (MA모형)
- 유한한 개수의 백색잡음의 결합. 항상 정상성 만족
- ACF에서 절단점 갖고 PACF가 빠르게 감소
다. 자기회귀누적이동평균모형(ARIMA(p,d,q)모형)
- 가장 일반적인 모형으로 비정상 시게열 모형으로 차분이나 변환을 통해 AR/MA/ARMA로 정상화 가능
- p는 AR, q는 MA와 관련있는 차수로 ARIMA에서 ARMA로 정상화 할 때 차분한 횟수 의미
라. 분해 시계열
- 시계열에 영향을 주는 일반적인 요인을시계열에서 분리해 분석하는 방법
* 회귀분석적 방법 주로 사용
- 시계열 구성요소
1) 추세요인(trend factor) : 자료가 어떤 특정한 형태를 취할 때
2) 계절요인(seasonal factor) : 고정된 주기에 따라 자료가 변화
3) 순환요인 (cyclical factor) : 알려지지 않은 주기를 갖고 자료가 변화
4) 불규칙요인 (irregular factor) : 회귀분석에서 오차에 해당하는 요인
- 분해시계열 분석법에서는 각 구성요인을정확히 분리하는것이 중요
* 요인 정확히 분리하기 쉽지않으며 이론적 약점 존재해 그러나 많이 사용됨.
마. 시계열 연습
1) 시계열 자료 읽기
* 시계열 분석 패키지 : TTR. forecast
* ts : 데이터를 시계열 형식으로 변환
2) 그래프
* plot.ts
* log 변환하면 안정적인 패턴의 그래프 얻을 수있음.
3) 분해 시계열
- TTR 패키지 SMA 함수 이용해 시계열 트랜드 보여주는 분해시계열의 MA그래프 그리기
① decompose non- seasonal data
* 비계절성 띄는 시계열 자료 : 트렌드 요소, 불규칙 요소로 구성
② decompose seasonal data
* 계절성 띄는 시계열 자료 : 경향성 요소, 계절성 요소, 불규칙 요소로 구성
③ seasonal adjusting
*계절성 띄는 자료는 계절성 요소를 추정해 그 값을 raw에서 빼면 적절히 adjust 가능
4) ARiMA 모델
① 차분
- ARIMA는 정상시계열에 한해 사용
* 비정상시게열 자료는 차분해 정상성 만족시키는 시계열로 변환
5) 적합한 ARIMA 모델 결정
-ACF와 PACF를 통해 적합한 ARIMA 모델 결정 가능
- 모델링의 기본은 모수(parameter)들이 적을 수록 단순하고 이해 쉬움
* forecast package에 내장된 auto. arima()함수 사용하면 적절한 모형 찾을 수 있음.
- 미세한 차이로 약간의 오차ㅏㄹ생해도 모수 적게 사용한 모델링 보정(fitting) 이 적절하다면 간단하고 이해하기 쉬운 모델 선택이 관례
6) ARIMA 모델을 이용한 예측
- 주어진 시계열에 ARIMA 모델 채택했다면 ARIMA 모델의 모수로 미래 값 예측 가능
- fitting(보정) 후 forecast package의 forecast Arima()함수 이용해 미래값 예측 가능
'AI 관련 > ADsP, ADP' 카테고리의 다른 글
ADSP 요약정리 - 3장 데이터 마트 - 데이터 가공 (0) | 2021.10.03 |
---|---|
ADSP 요약정리 - 3장 데이터 마트 - 데이터 변경 및 요약 (0) | 2021.10.02 |
ADSP 요약정리 - 2장 통계분석 - 기초통계분석 (0) | 2021.10.01 |
ADSP 요약정리 - 2장 통계분석 - 통계분석의 이해 (0) | 2021.10.01 |
ADSP 요약정리 - 1장 데이터 분석 개요 -분석환경 이해와 기본 사용법 (0) | 2021.09.30 |
댓글