10강 · 분산분석 (ANOVA)

오늘 끝나면

분산분석 (ANOVA)

✓분산분석 (ANOVA)의 핵심 문제를 한 문장으로 설명한다
✓오른쪽 실습에서 분산분석이 어떻게 움직이는지 관찰한다
✓다음 강의와 이어지는 한계를 말할 수 있다

실습 미션

세 집단 이상 평균 차이가 진짜인가? 이 문장이 실제로 무슨 뜻인지 실습에서 한 번 손으로 확인한다.

성공 조건

□실습의 기본값을 먼저 관찰
□입력값이나 모드를 한 번 이상 바꿔 결과 비교
□왜 결과가 바뀌었는지 한 문장으로 설명

통계 · 10

분산분석
(ANOVA)

세 집단 이상 평균 차이가 진짜인가?
t검정을 여러 번 하면 거짓 양성이 쌓임.
ANOVA는 분산 하나로 한 번에 판정함.

P.01통계 · 10

셋 이상이면 t검정 반복은 금지

두 집단은 t검정으로 됨. 근데 집단이 셋 이상이면?

A·B·C 세 그룹을 t검정으로 다 비교하려면 쌍이 3개임.
A vs B / A vs C / B vs C.
그룹이 늘수록 비교 쌍은 더 빠르게 늘어남.

문제는 검정 한 번마다 1종 오류(거짓 양성) 확률이 붙는다는 것임.
각 검정 유의수준이 5%면, 셋을 다 보면 적어도 한 번 헛걸릴 확률이 약 14%로 뜀.
비교를 많이 할수록 “사실은 안 다른데 다르다”고 잘못 외칠 위험이 누적됨.

그래서 셋 이상은 t검정을 반복하지 않음.
한 번에 보는 도구가 필요함 → ANOVA.

비교 쌍이 늘면 거짓 양성도 늘어남

t검정 반복 — 거짓 양성 누적

그룹 수	비교 쌍	한 번이라도 헛걸릴 확률
2개	1쌍	5%
3개	3쌍	약 14%
4개	6쌍	약 26%
5개	10쌍	약 40%

각 검정 유의수준 5% 가정 · 비교 늘수록 위험 누적

P.02통계 · 10

질문을 분산으로 바꾼다

ANOVA의 발상: 평균 차이를 직접 묻지 말고 분산 두 개를 비교함.

그룹간 분산은 그룹 평균들이 전체 평균에서 벌어진 정도임.
그룹내 분산은 각 그룹 안에서 점들이 퍼진 정도임.

직관은 간단함.
평균들이 서로 멀고(그룹간 큼) 각 그룹은 촘촘하면(그룹내 작음) → 차이가 진짜 같음.
평균들이 가깝거나 각 그룹이 널뛰면 → 그 차이는 우연일 수 있음.

즉 신호(그룹간)를 잡음(그룹내)으로 견주는 것임.

평균들이 벌어진 정도 vs 각 그룹의 퍼짐

분산 두 개로 보는 눈

차이 진짜

그룹간 큼 · 그룹내 촘촘

우연일 수도

그룹간 작음 · 그룹내 널뜀

P.03통계 · 10

F = 그룹간분산 ÷ 그룹내분산

그 두 분산의 비율이 F값임.

F = MSB ÷ MSW
MSB는 그룹간 평균제곱(between) / 신호.
MSW는 그룹내 평균제곱(within) / 잡음.

분자·분모는 그냥 합이 아니라 자유도로 나눈 평균제곱임.
그룹간 자유도는 그룹 수 빼기 1, 그룹내 자유도는 전체 수 빼기 그룹 수.
이렇게 나눠야 비교가 공정해짐.

F가 1 근처면 신호와 잡음이 비슷함 = 차이가 안 두드러짐.
F가 크면 신호가 잡음을 압도함 = 평균 차이가 두드러짐.

한 줄 수식으로 더 보기

SSB = Σ nⱼ(x̄ⱼ − x̄)² · 그룹 평균과 전체 평균 차이의 가중 제곱합.
SSW = Σ Σ (xᵢⱼ − x̄ⱼ)² · 각 점과 그 그룹 평균 차이의 제곱합.
F = (SSB / (k−1)) ÷ (SSW / (N−k)).
k는 그룹 수, N은 전체 표본 수임.

신호를 잡음으로 나눈 한 개의 숫자

F = 신호 ÷ 잡음

그룹간 (MSB)

평균들이 벌어진 정도

그룹내 (MSW)

각 그룹의 퍼짐

한 개의 숫자

F ≈ 1

신호 ≈ 잡음 · 안 두드러짐

F 큼

신호 ≫ 잡음 · 두드러짐

P.04통계 · 10

직접 F를 만들어 본다

말로 들은 걸 손으로 굴려 봄. 오른쪽에서 직접 해봄.

세 그룹의 점 분포와 각 평균선이 보임.
파란 점선은 전체 평균임.

평균 벌리기 슬라이더를 올리면 그룹 평균들이 멀어짐 → 분자(그룹간)가 커져 F가 올라감.
그룹 내 퍼짐을 키우면 점들이 널뛰어 분모(그룹내)가 커져 F가 내려감.

F가 임계선을 넘으면 막대가 파랗게 바뀜 = 유의함.
평균은 그대로 둔 채 퍼짐만 키워서 F를 떨어뜨려 보면 잡음의 힘이 보임.

평균을 벌리면 F↑ · 퍼짐을 키우면 F↓

세 그룹 분포 · F값 직접 만들기

평균 벌리기 (그룹간) = 8

평균 모임멀리 벌어짐

그룹 내 퍼짐 (그룹내) = 5

촘촘널뛰기

출력 — 점 = 관측값, 굵은 선 = 그룹 평균

파란 점선이 전체 평균임.
그룹 평균선이 점선에서 멀수록 그룹간 분산이 큼.

F = 그룹간분산 ÷ 그룹내분산

568.5

36.4

MSB / MSW

15.61F

임계 3.28

010+

판정 (임계값 3.28 기준)

F 큼 → 적어도 한 그룹이 다름 (유의)

평균을 벌리면 분자(그룹간)가 커져 F↑.
퍼짐을 키우면 분모(그룹내)가 커져 F↓.
어느 그룹이 다른지는 F로는 모름 → 사후검정.

P.05통계 · 10

F가 크면 어딘가 다르다

F가 임계값을 넘으면 결론은 하나임.
“적어도 한 그룹이 다르다.”

근데 ANOVA는 어느 그룹이 다른지는 말해주지 않음.
A가 튄 건지, C가 튄 건지, 둘 다인지 모름.

그걸 찾는 게 사후검정(post-hoc)임.
Tukey HSD, Bonferroni 같은 방법으로 그룹 쌍을 비교하되, 비교를 여러 번 하는 만큼 기준을 더 엄격하게 보정함.
그래서 다시 거짓 양성이 쌓이지 않음.

정리하면 두 단계임.
1단계 ANOVA로 “다른 데가 있나?” 한 번에 판정.
2단계 사후검정으로 “어디가 다른가?” 안전하게 짚음.

Q. ANOVA가 t검정을 여러 번 하는 것보다 나은 이유는?

한 번에 검정해서 1종 오류(거짓 양성)가 누적되는 걸 막아줌.
t검정을 쌍마다 반복하면 비교 횟수만큼 헛걸릴 확률이 쌓이는데, ANOVA는 그룹간·그룹내 분산을 F 하나로 묶어 단 한 번에 판정함.

ANOVA는 다름 여부 · 위치는 사후검정

두 단계 — 여부 다음에 위치

1단계 · ANOVA

다른 데가 있나? → F로 한 번에

결과: 적어도 하나는 다름

↓

2단계 · 사후검정

어디가 다른가? → 쌍 비교

Tukey HSD · Bonferroni (기준 보정)

A vs B

비슷

A vs C

다름

B vs C

다름

보정으로 거짓 양성 다시 안 쌓임