스킬캠퍼스
22강 · 시계열 분석 (ARIMA)
강의

오늘 끝나면

시계열 분석 (ARIMA)

  • 시계열 분석 (ARIMA)의 핵심 문제를 한 문장으로 설명한다
  • 오른쪽 실습에서 시계열이 어떻게 움직이는지 관찰한다
  • 다음 강의와 이어지는 한계를 말할 수 있다

실습 미션

과거 흐름 보니 미래엔 이렇겠네 이 문장이 실제로 무슨 뜻인지 실습에서 한 번 손으로 확인한다.

성공 조건

  • 실습의 기본값을 먼저 관찰
  • 입력값이나 모드를 한 번 이상 바꿔 결과 비교
  • 왜 결과가 바뀌었는지 한 문장으로 설명

통계 · 22

시계열 분석
(ARIMA)

시간 순서로 쌓인 데이터를 다루는 통계임.
과거 흐름을 읽어 다음 값을 예측함.
매출 · 주가 · 기온 — 다음 달은?

P.01통계 · 22

시간순 데이터 = 추세 + 계절성 + 잡음

시계열은 시간 순서가 의미를 갖는 데이터임.
순서를 섞으면 정보가 깨짐.

이걸 세 조각으로 나눠 봄.

추세는 장기 방향 / 우상향·우하향.
계절성은 주기 반복 / 매주·매년 같은 패턴.
잡음은 설명 안 되는 흔들림 / 나머지.

관측값 = 추세 + 계절성 + 잡음.
이렇게 나눠 보면 어디가 진짜 신호고 어디가 흔들림인지 보임.

한 시계열을 세 조각으로 분해
관측값 = 추세 + 계절성 + 잡음
추세장기 방향
계절성주기 반복
잡음나머지 흔들림
세 줄을 더하면 실제 시계열이 됨
P.02통계 · 22

ARIMA — 과거값과 과거오차로 다음을 예측

ARIMA는 시계열 예측의 기본 모델임.
이름 세 글자가 곧 구조임.

AR(자기회귀)은 과거값으로 다음을 맞춤 / 어제가 오늘에 영향.
MA(이동평균)는 과거 예측오차로 보정 / 빗나간 만큼 반영.
I(차분)은 연속 값의 차이를 봄 / 추세를 빼서 평평하게.

차분이 왜 필요함?
쭉 오르는 데이터는 그대로 못 다룸(평균이 계속 변함).
어제와의 차이로 바꾸면 추세가 사라지고 다루기 쉬워짐.

한 줄 식으로 보기ARIMA(p, d, q):
d번 차분한 값을 p개의 과거값(AR)과 q개의 과거오차(MA)로 설명함.
예: ARIMA(1,1,1) = 1번 차분 + 과거값 1개 + 과거오차 1개.
AR · I · MA 세 글자 풀이
ARIMA = AR + I + MA
AR
자기회귀과거값으로 다음 예측
어제·그제 → 오늘
I
차분추세를 빼서 평평하게
값 → 어제와의 차이
MA
이동평균과거 예측오차로 보정
빗나간 만큼 반영
ARIMA(p, d, q) — 세 개를 몇 차수 쓸지 정하는 것
P.03통계 · 22

직접 예측해 보기

오른쪽 검은 선이 과거 관측임.
[예측]을 누르면 미래가 점선으로 그려짐.

추세 슬라이더로 기울기를 바꾸면 예측 방향이 따라 변함.
계절성을 켜면 주기 패턴이 미래에도 이어짐.

파란 깔때기는 신뢰밴드임 / 예측이 들어갈 만한 범위.
잡음을 키우면 깔때기가 더 빨리 벌어짐.

가까운 미래는 좁고, 먼 미래는 넓음.
이게 다음 장의 핵심임.

추세·계절 바꾸면 예측이 따라옴
시계열 예측 · 추세+계절+잡음
과거 관측 24미래 12
추세 (장기 방향)+0.80/step
잡음 (흩어짐 σ)4
주기 6step마다 반복

검은 선이 과거. 추세·계절·잡음을 바꿔 본 뒤 예측을 켜 보셈.

P.04통계 · 22

멀수록 불확실 — 신뢰밴드가 넓어진다

예측은 한 점이 아니라 범위로 말해야 함.
그 범위가 신뢰밴드임.

내일 예측은 오늘에서 한 걸음 / 오차 한 번.
모레 예측은 내일 예측 위에 또 한 걸음 / 오차가 쌓임.

그래서 밴드 폭은 대략 시간의 제곱근에 비례해 커짐.
한 걸음마다 불확실성이 누적되기 때문임.

예측 = 평균선(가장 그럴듯한 값) + 밴드(불확실성).
멀리 갈수록 밴드가 깔때기처럼 벌어짐.

한 걸음마다 오차가 쌓임
신뢰밴드 — 멀수록 벌어지는 깔때기
가까운 미래먼 미래
밴드 폭 ∝ √(걸음 수) — 오차가 누적됨
P.05통계 · 22

정리 — 흐름을 읽어 미래를 말한다

시계열 분석을 세 줄로 압축함.

데이터는 추세 + 계절성 + 잡음으로 쪼갬.
ARIMA는 과거값(AR)과 과거오차(MA)로 다음을 예측하고, 추세는 차분(I)으로 제거함.
예측엔 신뢰밴드를 붙이고, 멀수록 넓어짐.

핵심은 하나임.
미래는 한 점이 아니라 범위로 말하는 것임.

Q. 시계열 예측에서 먼 미래일수록 신뢰구간은?넓어짐.
한 걸음마다 오차가 쌓여 불확실성이 누적되기 때문임.
밴드 폭은 대략 시간의 제곱근에 비례해 커짐.
3줄 요약
시계열 분석 3줄 요약
1
분해추세 + 계절성 + 잡음
2
예측과거값(AR)·과거오차(MA), 추세는 차분(I)
3
범위신뢰밴드 — 멀수록 넓어짐
미래는 한 점이 아니라 범위로 말함

3줄 요약

  1. 1과거 흐름 보니 미래엔 이렇겠네
  2. 2시계열 분석 (ARIMA)은 분포 → 표본 → 검정 → 회귀 → 모델 선택 흐름 안의 한 칸이다.
  3. 3개념을 외우는 것보다 입력을 바꾸면 무엇이 달라지는지 보는 것이 우선이다.

완료 전 점검

복습 카드

시계열

과거 흐름 보니 미래엔 이렇겠네

분포

데이터가 어떤 모양으로 퍼져 있는지 나타낸 것

표본

전체를 알기 위해 뽑아 본 일부 데이터