계절형 자기회귀 이동평균모형(SARIMA)

2018. 4. 9. 22:31ML(머신러닝)/Time Series

728x90

보통 SARIMA 형식은  

으로 되어 있다. 승법 계절 모형이라고도 한다.

 

sas에서 estimate 설정해 줄 때  

 형식으로 넣어준다 앞에 있는 ( ) 에는 불규칙 성분을 뒤에 있는 ( )에는 계절 불규칙을 넣어준다.

 

sas output 중에서  autocorrelation check for white noise 부분에서는 자기 상관성을 따지는 부분인데 이 부분에 p-value가 기각을 해야 분석하는 사람들 입장에서는 좋은 것이다. 왜냐하면 상관성이 있어야 분석할 게 있다는 뜻이기 때문이다.

 

그리고 저번에 말한 만약에 확률적 추세가 있다면 -> adf에서 single mean을 고려해야 하고 차분을 결정한다.

                          만약에 결정적추세가 있다면 -> regression OR 차분을 해야 한다.

 

그래서 만약에 ARIMA 식이 

이런 식으로 나오게 되는데 AR(13)은 ARIMA(0,1,1)(0,1,1) 12 보다 더 큰 모델을 뜻하게 된다 

P=13인 AR 모델에서 estimate 값을 1 ,2 ,13 만 포함하면 결국에는 같은 모델이 된다. 이러한 모델을 비 승법 계절 모형이라고 한다.

 

이러한 경우를 사용할 때는 만약에 arma를 돌리고 계절성을 고려했는데 좋지 않은 결과가 나올 시 더 큰 모델인 AR(13)을 돌려서 더 큰 모델에서 FITTING 시키기 때문에 더 폭넓은 선택을 할 수 있게 된다.

 

 

 

이러한 결정은 일단 결론적인 것이고, 그 이전에 일단 이러한 과정을 가기 위해 PLOT을 통해 데이트를 분석한다.

 PLOT을 통해 추세가 있는지(결정적 추세, 확률적 추세) , 평균을 잘 지나치는지 양의 상관성이 있는지 음의 상관성이 있는지, 

변동이 클 경우 LOG를 씌어준다는지를 어느 정도 주관적인 판단을 할 수 있고.  

ACF의 그림을 통해 잔차가 천천히 떨어지는지(차분의 필요성) 아니면 시간대별로 갑자기 ACF가 튀어나오는 현상(계절성 의심)할 게 있는지

계절성이 있다면 그 ACF는 천천히 떨어지는(계절성 차분의 필요성)의 것을 고려할 수 있다.

 

물론 차분을 많이 하게 되면 분산이 더 그만큼 커지게 되어 예측력은 감소하지만 그래도 더 확실한 분석을 위해 필요하면 반드시 해야 한다.

 

이제 그 이후에 AIC를 통해 p, q, sp, sq 등을 여러 조합을 통해 분석할 수 있는데,

sas에서는 Macro를 통해 이 과정을 반복해서 하는 방법이 최선인 것 같고 R에선 autoarima가 있긴 하지만 마찬가지로 반복을 이용해서

AIC가 가장 낮은 것을 고려해볼 수 있다.

 

이렇게 낮은 AIC를 선택한 후 그 모델을 돌려보면 일단 포트 멘토 검정을 통해 잔차의 독립성을 확인한다(귀무가설 기각 X 해야 독립적이라는 의미) 

 그리고 우리의 모델에 나온 estimate 값의 p-value 값을 확인해보고 귀무가설을 기각 x 하는 것은 0이라는 의미로 그런 것들을 만약에 

p=(1,2,3) (= p=3)에서 2 번째 것이 만족하지 않는다고 하면 p=(1,3)을 선택해주면 되고, 평균이 맞지 않다면 noint를 통해 해결한다.

특히 ESTIMATE 값을 잘 봐야 한다.  

 꼴이 estimate 값이 합이 1이 된다던지 하는 경우가 있다. 이러한 경우는 

다시 한번 차분을 통해서 해결을 해야 하고 

 이런 식으로 되는 것은 주의 깊게 봐야 한다.

 

 

또한 우리가 잔차를 정규분포로 가정했는데, 이러한 부분도 잘 맞는지 QQPLOT이나 KERNEL과 정규분포가 잘 매칭이 되는지도 확인한다.

만약 이러한 과정에서 포트 멘토 검정이나 그러한 부분에서 맞지 않는다면, 다시 모델을 확인해본다

728x90