ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • Time Series(시계열)
    카테고리 없음 2022. 1. 21. 20:34
    반응형

    아래 사이트 보고 정리하는 글

    https://towardsdatascience.com/the-complete-guide-to-time-series-analysis-and-forecasting-70d476bfe775

     

    The Complete Guide to Time Series Analysis and Forecasting

    Understand moving average, exponential smoothing, stationarity, autocorrelation, SARIMA, and apply these techniques in two projects.

    towardsdatascience.com

     

    Introduction

    시계열은 특정 시간 순서로 되어있는 일련의 numerical 데이터 포인트이다. 시계열에서 시간은 흔히 independent 변수이며 미래를 예측하는 것이 목표이다.

     

    시계열을 다룰 때 고려해야 하는 요소들은 다음과 같다.

    stationary / seasonality / autocorrelated

     

    Autocorrelation(자기 상관)

    autocorrelation은 시계열에서 서로 다른 지점에 있는 두 관측치 간의 correlation이다.

    위 그림을 보면 첫 번째 값과 24번째 값이 높은 autocorrelation을 가지고 있고 12번쨰와 36번째 값도 높은 상관성이 있는 것을 알 수 있다. 이는 24 time unit마다 유사한 값을 찾을 수 있다는 것을 의미한다.

     

    Seasonality

    seasonality는 주기적인 변동을 나타낸다. 예를 들어, 전력 소비량은 낮에는 높고 밤에는 낮다.

    위 그림을 보면 가장 높은 지점이 저녁쯤이고 가장 낮은 지점이 하루의 시작과 끝을 의미한다.

     

    Stationarity

    시계열의 통계적 속성이 시간이 지나도 변하지 않는 것을 시계열이 stationary하다고 말한다. 즉, 일정한 평균과 분산을 가지며 공분산은 시간과 관련 없다.

    위 그림을 보면 process가 stationary하다는 것을 알 수 있다. 평균과 분산이 시간이 지남에 따라 변하지 않는다.

    흔히, 주식 가격은 증가하는 추세를 보이거나 시간이 지남에 따라 volatility가 증가할 수 있으므로 stationary process가 아니다.

    반응형

    댓글

Designed by Tistory.