1. 시계열
-
시계열(Time Series) 데이터
-
관측치가 시간적 순서를 가지게 됨
-
일정 시점에 조사된 데이터는 횡단 자료라 함
-
ex) 소비자물가지수
-
-
미래 값을 예측하는 것
-
시계열 데이터의 특성을 파악 - 경향,주기,계절성,불규칙성
-
-
정상성
-
시계열의 수준과 분산에 체계적인 변화가 없고, 주기적 변동이 없다는 것 -> 미래는 확률적으로 과거와 동일하다는 것을 뜻함
-
조건
-
평균값은 시간 t에 관계없이 일정하다.
-
분산값은 시간 t에 관계없이 일정하다
-
공분산은 시간 t에 의존하지 않고 오직 시차에만 의존한다.
-
-
-
비정상시계열을 정상시계열로 전환하는 방법
-
시계열의 평균이 일정하지 않은 경우에는 원시계열의 차분하면 정상 시계열이 됌
-
계절성을 갖는 비정상시계열은 정상시계열로 바꿀 때 계절차분을 사용
-
분산이 일정하지 않는 경우에는 원계열에 자연로그를 취하면 정상시계열이 된다
-
-
백색잡음 과정 : 시계열 et의 평균이 0 분산이 일정한 값 2σ이고 자기 공분산이 0 인 경우
-
자기상관은 시점 t와 (t-1) 간의 상관관계를 의미하며 한동안 증가하거나 감소하는 경우 양의 자기상관이 존재
-
시점마다 증감이 반복되는 경우 음의 자기상관
-
-
시계열 모형
-
자기회귀모형 : 자신의 과거 값을 사용 (Autoregressive)
-
현시점의 시계열 자료에 몇 번째 전 자료까지 영향을 주는지 알아내는데 있음
-
현시점의 자료에 과거 1시점 이전의 자료만 영향을 준다면, 이를 1차 자기회귀모형 ( AR(1) 모형 ) 이라함
-
Y_t = α_1Y_1 + ... α_pY_p + ε_t
-
자기상관함수가 시차가 증가함에 따라 점차적으로 감소, 부분자기상관함수는 시차 이후 급격히 감소하여 절단된 형태를 취함
-
-
이동평균모형 : 최근 데이터의 평균(혹은 중앙치)을 예측치로 사용하는 방법
-
Y_t = ε_t - β_1ε_t - ... - β_qε_(t-q)
-
-
자기회귀누적이동 모형 (ARIMA)
-
비정상시계열모형
-
차분이나 변환을 통해 AR,MA,ARMA 모형으로 정상화할 수 있음
-
AR : 과거시점의 관측자료의 선형결합으로 표현하는 것 - 자기회귀
-
MR : 과거 시점의 백색잡음 선형결합으로 표현하는 것 - 이동평균
-
ARMA : AR,MR 모형을 둘다 합친 것 - 자기회귀이동평균
-
-
-
분해시계열
-
시계열에 영향을 주는 일반적인 요인을 시계열에서 분리해 분석하는 방법
-
추세요인 : 자료가 어떤 특정한 형태를 취할 때
-
계절요인 : 계절에 따라 고정된 주기에 따라 자료가 변화할 경우
-
순환요인 : 알려지지 않은 주기를 가지고 자료가 변화할 때
-
불규칙요인 : 위 세가지로 설명할 수 없을 때
-
-
decompose() - 시계열 자료를 4가지 요인으로 분해할 수 있음
-
diff() - 차분을 하는 함수
-
-
ARIMA 모델 적합 및 결정
-
acf() - 자기상관함수
-
pacf() - 부분자기상관함수
-
auto.arima() - 시계열 자료에 적절한 모형 제시
-
forecast() - arima 모형을 가지고 예측
-
-
'ADSP > 3강) 데이터 분석' 카테고리의 다른 글
[8] 신경망 모형 (0) | 2020.02.15 |
---|---|
[7] 데이터마이닝 (0) | 2020.02.14 |
[5] 기초 통계분석(2) (0) | 2020.02.12 |
[4] 기초 통계분석 (0) | 2020.02.08 |
[3] 통계분석 (0) | 2020.02.07 |