출처: https://youtu.be/7Do_hixXCpc
시계열 데이터
시간의 흐름에 따라 순서대로 관측되어 시간의 영향을 받게 되는 데이터
시간에 따른 제품의 판매량
시간에 따른 실업자 수
시간에 따른 서울시 오염 정도
구성요소
실제 데이터는 추세 + 순환 + 랜덤으로 구성
추세변동 Trend
시간이 경과함에 따라 관측값이 지속적으로 증가하거나 감소하는 "추세"를 갖는 경우.
단시간 보다는 최소 1년 이상 등 장시간
상승, 하강 등
순환변동 Cycle
시작했던 시점으로 다시 돌아오는 구조
주기적인 변화를 가지지만 계절이 아니고, 주기가 긴 경우
계절 변동 Seasonal variation
주기 변동, 사이클의 한 형태. 사이클의 주기가 계절
주별, 월별, 계절별과 같이 주기적인 요인에 의한 변동
우연변동 Random fluctuation
시간에 따른 규칙적인 움직임과는 무관하게 랜덤한 원인에 의해 나타나는 변동
백색잡음: 평균이 0이고 분산이 일정한 데이터
오리지널 데이터에서 추세와 순환을 제외한 것
Trend with Seasonal pattern
트렌드가 있으면서 계절 변동도 함께 공존하는 형태
예측 오차
실제값과 모델의 예측값의 차이
n개의 시점이 있다면 각 시점마다 예측 오차가 나올 것. 이를 요약하기 위한 가장 간단한 방법은 다 더하는 것.
단순히 더하면 0에 가까운 수가 되고, 예측 오차의 크기가 중요하므로, 이 방법은 예측 오차로서 의미가 없음
따라서 절대값을 씌운 평균절대편차 MAD나, 제곱한 평균제곱편차 MSE 사용 (아래)
MAD
MSE
둘 다 부호를 없애는 방법.
2라면 4, 4라면 16. 예측 오차가 크면 클수록 제곱오차가 점점 커짐.
MAD 관점에서는 B가, MSE 관점에서는 A가 더 좋음.
MSE의 경우 Error -6과 같이 특별하게 잘못 예측한 값에 대해 더 큰 가중을 주게 됨
MAPE
차이를 실제값으로 나눈 것으로 예측 모델값이 얼마나 많이 떨어져 있는지 파악.
실제값이 0일때는 정의되지 않음 (분모가 0).
실제값이 굉장히 작으면 값이 너무 커짐.
MAPE bias
둘 다 10만큼 틀렸고 전자는 실제값이 더 큰 경우, 아래는 더 작은 경우.
MAPE가 달라짐.
예측값이 실제값 보다 작을 경우 MAPE 값이 더 호의적으로 나오는 경향이 있음.
'AI > Theory_Private' 카테고리의 다른 글
GRU 게이트 순환 신경망 (0) | 2023.05.27 |
---|---|
성능최적화_하이퍼파라미터 (0) | 2023.05.07 |
시계열 분석 (0) | 2023.04.15 |
Attention (from seq2seq) Review (0) | 2023.04.11 |
DeepLabv3 / DeepLabv3+ (0) | 2023.04.06 |