-
Time Series(시계열)카테고리 없음 2022. 1. 21. 20:34반응형
아래 사이트 보고 정리하는 글
Introduction
시계열은 특정 시간 순서로 되어있는 일련의 numerical 데이터 포인트이다. 시계열에서 시간은 흔히 independent 변수이며 미래를 예측하는 것이 목표이다.
시계열을 다룰 때 고려해야 하는 요소들은 다음과 같다.
stationary / seasonality / autocorrelated
Autocorrelation(자기 상관)
autocorrelation은 시계열에서 서로 다른 지점에 있는 두 관측치 간의 correlation이다.
위 그림을 보면 첫 번째 값과 24번째 값이 높은 autocorrelation을 가지고 있고 12번쨰와 36번째 값도 높은 상관성이 있는 것을 알 수 있다. 이는 24 time unit마다 유사한 값을 찾을 수 있다는 것을 의미한다.
Seasonality
seasonality는 주기적인 변동을 나타낸다. 예를 들어, 전력 소비량은 낮에는 높고 밤에는 낮다.
위 그림을 보면 가장 높은 지점이 저녁쯤이고 가장 낮은 지점이 하루의 시작과 끝을 의미한다.
Stationarity
시계열의 통계적 속성이 시간이 지나도 변하지 않는 것을 시계열이 stationary하다고 말한다. 즉, 일정한 평균과 분산을 가지며 공분산은 시간과 관련 없다.
위 그림을 보면 process가 stationary하다는 것을 알 수 있다. 평균과 분산이 시간이 지남에 따라 변하지 않는다.
흔히, 주식 가격은 증가하는 추세를 보이거나 시간이 지남에 따라 volatility가 증가할 수 있으므로 stationary process가 아니다.
반응형