오늘 끝나면
시계열 분석 (ARIMA)
- ✓시계열 분석 (ARIMA)의 핵심 문제를 한 문장으로 설명한다
- ✓오른쪽 실습에서 시계열이 어떻게 움직이는지 관찰한다
- ✓다음 강의와 이어지는 한계를 말할 수 있다
실습 미션
과거 흐름 보니 미래엔 이렇겠네 이 문장이 실제로 무슨 뜻인지 실습에서 한 번 손으로 확인한다.
성공 조건
- □실습의 기본값을 먼저 관찰
- □입력값이나 모드를 한 번 이상 바꿔 결과 비교
- □왜 결과가 바뀌었는지 한 문장으로 설명
통계 · 22
시계열 분석
(ARIMA)
시간 순서로 쌓인 데이터를 다루는 통계임.
과거 흐름을 읽어 다음 값을 예측함.
매출 · 주가 · 기온 — 다음 달은?
시간순 데이터 = 추세 + 계절성 + 잡음
시계열은 시간 순서가 의미를 갖는 데이터임.
순서를 섞으면 정보가 깨짐.
이걸 세 조각으로 나눠 봄.
추세는 장기 방향 / 우상향·우하향.
계절성은 주기 반복 / 매주·매년 같은 패턴.
잡음은 설명 안 되는 흔들림 / 나머지.
관측값 = 추세 + 계절성 + 잡음.
이렇게 나눠 보면 어디가 진짜 신호고 어디가 흔들림인지 보임.
ARIMA — 과거값과 과거오차로 다음을 예측
ARIMA는 시계열 예측의 기본 모델임.
이름 세 글자가 곧 구조임.
AR(자기회귀)은 과거값으로 다음을 맞춤 / 어제가 오늘에 영향.
MA(이동평균)는 과거 예측오차로 보정 / 빗나간 만큼 반영.
I(차분)은 연속 값의 차이를 봄 / 추세를 빼서 평평하게.
차분이 왜 필요함?
쭉 오르는 데이터는 그대로 못 다룸(평균이 계속 변함).
어제와의 차이로 바꾸면 추세가 사라지고 다루기 쉬워짐.
한 줄 식으로 보기
ARIMA(p, d, q):d번 차분한 값을 p개의 과거값(AR)과 q개의 과거오차(MA)로 설명함.
예: ARIMA(1,1,1) = 1번 차분 + 과거값 1개 + 과거오차 1개.
직접 예측해 보기
오른쪽 검은 선이 과거 관측임.
[예측]을 누르면 미래가 점선으로 그려짐.
추세 슬라이더로 기울기를 바꾸면 예측 방향이 따라 변함.
계절성을 켜면 주기 패턴이 미래에도 이어짐.
파란 깔때기는 신뢰밴드임 / 예측이 들어갈 만한 범위.
잡음을 키우면 깔때기가 더 빨리 벌어짐.
가까운 미래는 좁고, 먼 미래는 넓음.
이게 다음 장의 핵심임.
검은 선이 과거. 추세·계절·잡음을 바꿔 본 뒤 예측을 켜 보셈.
멀수록 불확실 — 신뢰밴드가 넓어진다
예측은 한 점이 아니라 범위로 말해야 함.
그 범위가 신뢰밴드임.
내일 예측은 오늘에서 한 걸음 / 오차 한 번.
모레 예측은 내일 예측 위에 또 한 걸음 / 오차가 쌓임.
그래서 밴드 폭은 대략 시간의 제곱근에 비례해 커짐.
한 걸음마다 불확실성이 누적되기 때문임.
예측 = 평균선(가장 그럴듯한 값) + 밴드(불확실성).
멀리 갈수록 밴드가 깔때기처럼 벌어짐.
정리 — 흐름을 읽어 미래를 말한다
시계열 분석을 세 줄로 압축함.
데이터는 추세 + 계절성 + 잡음으로 쪼갬.
ARIMA는 과거값(AR)과 과거오차(MA)로 다음을 예측하고, 추세는 차분(I)으로 제거함.
예측엔 신뢰밴드를 붙이고, 멀수록 넓어짐.
핵심은 하나임.
미래는 한 점이 아니라 범위로 말하는 것임.
Q. 시계열 예측에서 먼 미래일수록 신뢰구간은?
넓어짐.한 걸음마다 오차가 쌓여 불확실성이 누적되기 때문임.
밴드 폭은 대략 시간의 제곱근에 비례해 커짐.