1. 시계열

  • 시계열(Time Series) 데이터

    • 관측치가 시간적 순서를 가지게 됨

    • 일정 시점에 조사된 데이터는 횡단 자료라 함

      • ex) 소비자물가지수

    • 미래 값을 예측하는 것

    • 시계열 데이터의 특성을 파악 - 경향,주기,계절성,불규칙성

  • 정상성

    • 시계열의 수준과 분산에 체계적인 변화가 없고, 주기적 변동이 없다는 것 -> 미래는 확률적으로 과거와 동일하다는 것을 뜻함

    • 조건

      1. 평균값은 시간 t에 관계없이 일정하다.

      2. 분산값은 시간 t에 관계없이 일정하다

      3. 공분산은 시간 t에 의존하지 않고 오직 시차에만 의존한다.

  • 비정상시계열을 정상시계열로 전환하는 방법

    1. 시계열의 평균이 일정하지 않은 경우에는 원시계열의 차분하면 정상 시계열이 됌

    2. 계절성을 갖는 비정상시계열은 정상시계열로 바꿀 때 계절차분을 사용

    3. 분산이 일정하지 않는 경우에는 원계열에 자연로그를 취하면 정상시계열이 된다

  • 백색잡음 과정 : 시계열 et의 평균이 0 분산이 일정한 값 2σ이고 자기 공분산이 0 인 경우

  • 자기상관은 시점 t와 (t-1) 간의 상관관계를 의미하며 한동안 증가하거나 감소하는 경우 양의 자기상관이 존재

    • 시점마다 증감이 반복되는 경우 음의 자기상관

  • 시계열 모형

    • 자기회귀모형 : 자신의 과거 값을 사용 (Autoregressive)

      • 현시점의 시계열 자료에 몇 번째 전 자료까지 영향을 주는지 알아내는데 있음

      • 현시점의 자료에 과거 1시점 이전의 자료만 영향을 준다면, 이를 1차 자기회귀모형 ( AR(1) 모형 ) 이라함

      • Y_t = α_1Y_1 + ... α_pY_p + ε_t

      • 자기상관함수가 시차가 증가함에 따라 점차적으로 감소, 부분자기상관함수는 시차 이후 급격히 감소하여 절단된 형태를 취함

    • 이동평균모형 : 최근 데이터의 평균(혹은 중앙치)을 예측치로 사용하는 방법

      • Y_t = ε_t - β_1ε_t - ... - β_qε_(t-q)

    • 자기회귀누적이동 모형 (ARIMA)

      • 비정상시계열모형

        • 차분이나 변환을 통해 AR,MA,ARMA 모형으로 정상화할 수 있음

        • AR : 과거시점의 관측자료의 선형결합으로 표현하는 것 - 자기회귀

        • MR : 과거 시점의 백색잡음 선형결합으로 표현하는 것 - 이동평균

        • ARMA : AR,MR 모형을 둘다 합친 것 - 자기회귀이동평균

    • 분해시계열

      • 시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법

        • 추세요인 : 자료가 어떤 특정한 형태를 취할 때

        • 계절요인 : 계절에 따라 고정된 주기에 따라 자료가 변화할 경우

        • 순환요인 : 알려지지 않은 주기를 가지고 자료가 변화할 때

        • 불규칙요인 : 위 세가지로 설명할 수 없을 때

      • decompose() - 시계열 자료를 4가지 요인으로 분해할 수 있음

      • diff() - 차분을 하는 함수

    • ARIMA 모델 적합 및 결정

      • acf() - 자기상관함수

      • pacf() - 부분자기상관함수

      • auto.arima() - 시계열 자료에 적절한 모형 제시

      • forecast() - arima 모형을 가지고 예측

 

'ADSP > 3강) 데이터 분석' 카테고리의 다른 글

[8] 신경망 모형  (0) 2020.02.15
[7] 데이터마이닝  (0) 2020.02.14
[5] 기초 통계분석(2)  (0) 2020.02.12
[4] 기초 통계분석  (0) 2020.02.08
[3] 통계분석  (0) 2020.02.07

+ Recent posts