ARIMA 모형의 적합

2018. 3. 25. 13:12ML(머신러닝)/Time Series

모형 적합 절차에서 ARMA 모형 적합 절차라고 하는 것은 ARMA(P, Q)에서 P, Q를 잘 선택해 가장 적절한 모형을 찾는 것이다

 

앞에서 배운 비정상(계절성 제외)하고 다 처리를 한 후에 ARMA 모형에 FITTING 시키고 모형 진단에서 잔차 분석 후 옳지 않으면

 

다시 새로운 P, Q에다가 FITTING 시키고 다시 모형진단 하는 것 반복한다.

 

모형의 식별에서  P,Q 를 간결의 원칙으로 인해 P <3 , Q < 3으로 선택하는 것이 가장 좋다

 

모형 개수가 증가하면 예측 모형이 복잡해질 뿐 아니라 추정의 효율성도 떨어지기 때문이다. 

 

그래서 왠만하면 모수의 개수가 적은 모형이 좋다.

 

모형식별 단계

 

First  시계열 그림, 표본 상관 도표 , ADF를 통해 비정상을 판단한다.

 

시계열 그림 - 추세, 계절성, 분산의 변화 , 이상값 파악 

 

분산이 변하면 -> 안정화 시켜줘야한다 (Log 이용)

 

분산이 일정해도 그 수준이 변하면 -> 적절한 차분 을 해야한다.

차분을 너무 많이 하면 앞에서 말한 듯이 분산이 너무 커져서 -> 쓸모없는 모형 예측이 나온다.

 

언제까지 차분을 하나면 -> 차분을 해도 1. 추세가 계절성이 존재한다.  2. SACF가 천천히 감소한다. 일 때 차분을 더 해줘야 한다.

 

 현실에서는 Box-Jenkins 방법은 제한적인 수준이어서  쓸 수가 없다고 한다.

 

그래서 다른 방법으로 AIC, BIC , SBC 같은 방법을 주로 사용한다.

 

  이 식이 작을수록 좋은데 만약 p, q 가 증가하면 당연히 증가하게 되니 p, q를 제한하는 역할을 해주고

 

 은 작게 해 주려고 노력할 것이다. 이 2개 관의 상호작용을 통해 가장 작은 AIC가 나올 때 그 모형을 선택하면 된다.

 

하지만 바로 쓰는 게 아니라 당연히 차분을 하고 정상성을 만족시켜야 가장 옳게 나온다 차분을 안 하고 쓰게 되면 엉뚱한 것을 택할 수도 있다.

 

그다음에 모수 추정을 하는데

 

모수 추정에 방법은 1. LSE 방법 2. MLE 방법을 통해 한다고 한다. 개인적으로 궁금한 것은 MAP로 하는 것은 어떨까라는 생각이 있다.

MAP 가 오히려 좀 더 확률적으로 좀 더 시계열의 불확실성을 담아서 나올 것 같은데 실력이 부족해 잘은 모르겠다.

 

 

그다음에는 모형 진단 : 잔차 분석 

 

잔차 분석을 하게 되면 우리가 관측한 값 - 모형으로 적합된 값을 통해서 빼게 되면 우리가 옳게 모델을 Fitting 하게 됐다면

 

잔차인 white noise만 남아야 한다. 이 말은 다시 말하면 자기 상관성이 없어지고 서로서로 독립이라는 것이다 

 

-> 그래서 확인법은 ACF 그림을 보고 판단하면 된다 

 

 

 

 

728x90