본문 바로가기
AI 관련/ADsP, ADP

ADSP 요약정리 - 2장 통계분석 - 시계열 분석

by 팀장일기 2021. 10. 2.

제 3절 시계열 분석 

 1. 정상성 (stationarity) 

   - 시계열 자료 ; 시간의 흐름에 따라 관찰된 값들

    * 비정상성 시계열 : 시계열 분석하는데 다루기 어려운 시계열 자료, 정상시계열로 만들어 분석 

    * 정상성 시계열 : 

     - 약한의미의 정상성 : 모든 시점에 평균일정, 시점과 분산 독립, 공분산은 시차에만 의존 

   - 비정상-> 정상 : 변환 (transformation), 차분 ( difference) 

    * 변환 : 부산이 일정하지 않은 비정상 시계열 

    * 차분 (t1-t0): 평균이 일정하지 않은 비정상 시계열 

 

 2.시계열 모형 

  가. 자기회귀모형(AR모형) 

   - p 시점 전의 자료가 현재 자료에 영향을 주는 자기회귀모형을 AR(p)모형이라 함.

자기회귀모형 

   - 자기회귀모형 판단 조건 

    *자기상관함수 (ACF) 빠르게 감소하고 부분 자기상관함수 (PACF)는 어느 시점에 절단점 갖음

 

  나. 이동평균모형 (MA모형) 

   - 유한한 개수의 백색잡음의 결합. 항상 정상성 만족 

이동평균모형

    - ACF에서 절단점 갖고 PACF가 빠르게 감소

 

  다. 자기회귀누적이동평균모형(ARIMA(p,d,q)모형) 

   - 가장 일반적인 모형으로 비정상 시게열 모형으로 차분이나 변환을 통해 AR/MA/ARMA로 정상화 가능 

   - p는 AR, q는 MA와 관련있는 차수로 ARIMA에서 ARMA로 정상화 할 때 차분한 횟수 의미

 

   라. 분해 시계열 

    - 시계열에 영향을 주는 일반적인 요인을시계열에서 분리해 분석하는 방법 

     * 회귀분석적 방법 주로 사용 

    - 시계열 구성요소 

    1) 추세요인(trend factor) : 자료가 어떤 특정한 형태를 취할 때

    2) 계절요인(seasonal factor) : 고정된 주기에 따라 자료가 변화 

    3) 순환요인 (cyclical factor) : 알려지지 않은 주기를 갖고 자료가 변화 

    4) 불규칙요인 (irregular factor) : 회귀분석에서 오차에 해당하는 요인 

   - 분해시계열 분석법에서는 각 구성요인을정확히 분리하는것이 중요 

    * 요인 정확히 분리하기 쉽지않으며 이론적 약점 존재해 그러나 많이 사용됨. 

불규칙 요인

 

  마. 시계열 연습

   1) 시계열 자료 읽기

    * 시계열 분석 패키지 : TTR. forecast 

    * ts : 데이터를 시계열 형식으로 변환 

   2) 그래프

    * plot.ts 

    * log 변환하면 안정적인 패턴의 그래프 얻을 수있음. 

   3) 분해 시계열 

   - TTR 패키지 SMA 함수 이용해 시계열 트랜드 보여주는 분해시계열의 MA그래프 그리기 

   ① decompose non- seasonal data

    * 비계절성 띄는 시계열 자료 : 트렌드 요소, 불규칙 요소로 구성  

   ② decompose seasonal data

    * 계절성 띄는 시계열 자료 : 경향성 요소, 계절성 요소, 불규칙 요소로 구성 

   ③ seasonal adjusting

    *계절성 띄는 자료는 계절성 요소를 추정해 그 값을 raw에서 빼면 적절히 adjust 가능 

   4) ARiMA 모델 

   ① 차분 

   - ARIMA는 정상시계열에 한해 사용 

    * 비정상시게열 자료는 차분해 정상성 만족시키는 시계열로 변환

   5) 적합한 ARIMA 모델 결정 

   -ACF와 PACF를 통해 적합한 ARIMA 모델 결정 가능 

   - 모델링의 기본은 모수(parameter)들이 적을 수록 단순하고 이해 쉬움 

    * forecast package에  내장된 auto. arima()함수 사용하면 적절한 모형 찾을 수 있음. 

    - 미세한 차이로 약간의 오차ㅏㄹ생해도 모수 적게 사용한 모델링 보정(fitting) 이 적절하다면 간단하고 이해하기 쉬운 모델 선택이 관례 

    6) ARIMA 모델을 이용한 예측 

   - 주어진 시계열에 ARIMA 모델 채택했다면 ARIMA 모델의 모수로 미래 값 예측 가능 

   - fitting(보정) 후 forecast package의 forecast Arima()함수 이용해 미래값 예측 가능 

    

 

댓글