본문 바로가기
AI/Theory_Private

Time Series Regression 1

by floraj 2023. 4. 20.

 

출처: https://youtu.be/7Do_hixXCpc

 

시계열 데이터

시간의 흐름에 따라 순서대로 관측되어 시간의 영향을 받게 되는 데이터

 

시간에 따른 제품의 판매량

시간에 따른 실업자 수

시간에 따른 서울시 오염 정도

 

 

 

구성요소

실제 데이터는 추세 + 순환 + 랜덤으로 구성

 

추세변동 Trend

시간이 경과함에 따라 관측값이 지속적으로 증가하거나 감소하는 "추세"를 갖는 경우.

단시간 보다는 최소 1년 이상 등  장시간

상승, 하강 등

순환변동 Cycle

시작했던 시점으로 다시 돌아오는 구조

주기적인 변화를 가지지만 계절이 아니고, 주기가 긴 경우

 

 

계절 변동 Seasonal variation

주기 변동, 사이클의 한 형태. 사이클의 주기가 계절

주별, 월별, 계절별과 같이 주기적인 요인에 의한 변동

 

우연변동 Random fluctuation

시간에 따른 규칙적인 움직임과는 무관하게 랜덤한 원인에 의해 나타나는 변동

백색잡음: 평균이 0이고 분산이 일정한 데이터

오리지널 데이터에서 추세와 순환을 제외한 것

 

 

Trend with Seasonal pattern

트렌드가 있으면서 계절 변동도 함께 공존하는 형태

 

 

 

 

 

 

 

예측 오차

실제값과 모델의 예측값의 차이

 

t 특정 시점 기준

 

n개의 시점이 있다면 각 시점마다 예측 오차가 나올 것. 이를 요약하기 위한 가장 간단한 방법은 다 더하는 것. 

단순히 더하면 0에 가까운 수가 되고, 예측 오차의 크기가 중요하므로, 이 방법은 예측 오차로서 의미가 없음

따라서 절대값을 씌운 평균절대편차 MAD나, 제곱한 평균제곱편차 MSE 사용 (아래)

 

MAD

평규절대편차

MSE

 

평균제곱편차 MSE

 

둘 다 부호를 없애는 방법. 

2라면 4, 4라면 16. 예측 오차가 크면 클수록 제곱오차가 점점 커짐. 

 

MAD vs MSE

 

MAD 관점에서는 B가, MSE 관점에서는 A가 더 좋음.

MSE의 경우 Error -6과 같이 특별하게 잘못 예측한 값에 대해 더 큰 가중을 주게 됨

 

 

MAPE 

차이를 실제값으로 나눈 것으로 예측 모델값이 얼마나 많이 떨어져 있는지 파악. 

실제값이 0일때는 정의되지 않음 (분모가 0). 

실제값이 굉장히 작으면 값이 너무 커짐.

 

MAPE bias

둘 다 10만큼 틀렸고 전자는 실제값이 더 큰 경우, 아래는 더 작은 경우. 

MAPE가 달라짐. 

예측값이 실제값 보다 작을 경우 MAPE 값이 더 호의적으로 나오는 경향이 있음.

 

이외의 방법들

 

 

'AI > Theory_Private' 카테고리의 다른 글

GRU 게이트 순환 신경망  (0) 2023.05.27
성능최적화_하이퍼파라미터  (0) 2023.05.07
시계열 분석  (0) 2023.04.15
Attention (from seq2seq) Review  (0) 2023.04.11
DeepLabv3 / DeepLabv3+  (0) 2023.04.06