오늘 끝나면
분산분석 (ANOVA)
- ✓분산분석 (ANOVA)의 핵심 문제를 한 문장으로 설명한다
- ✓오른쪽 실습에서 분산분석이 어떻게 움직이는지 관찰한다
- ✓다음 강의와 이어지는 한계를 말할 수 있다
실습 미션
세 집단 이상 평균 차이가 진짜인가? 이 문장이 실제로 무슨 뜻인지 실습에서 한 번 손으로 확인한다.
성공 조건
- □실습의 기본값을 먼저 관찰
- □입력값이나 모드를 한 번 이상 바꿔 결과 비교
- □왜 결과가 바뀌었는지 한 문장으로 설명
통계 · 10
분산분석
(ANOVA)
세 집단 이상 평균 차이가 진짜인가?
t검정을 여러 번 하면 거짓 양성이 쌓임.
ANOVA는 분산 하나로 한 번에 판정함.
셋 이상이면 t검정 반복은 금지
두 집단은 t검정으로 됨. 근데 집단이 셋 이상이면?
A·B·C 세 그룹을 t검정으로 다 비교하려면 쌍이 3개임.
A vs B / A vs C / B vs C.
그룹이 늘수록 비교 쌍은 더 빠르게 늘어남.
문제는 검정 한 번마다 1종 오류(거짓 양성) 확률이 붙는다는 것임.
각 검정 유의수준이 5%면, 셋을 다 보면 적어도 한 번 헛걸릴 확률이 약 14%로 뜀.
비교를 많이 할수록 “사실은 안 다른데 다르다”고 잘못 외칠 위험이 누적됨.
그래서 셋 이상은 t검정을 반복하지 않음.
한 번에 보는 도구가 필요함 → ANOVA.
| 그룹 수 | 비교 쌍 | 한 번이라도 헛걸릴 확률 |
|---|---|---|
| 2개 | 1쌍 | 5% |
| 3개 | 3쌍 | 약 14% |
| 4개 | 6쌍 | 약 26% |
| 5개 | 10쌍 | 약 40% |
질문을 분산으로 바꾼다
ANOVA의 발상: 평균 차이를 직접 묻지 말고 분산 두 개를 비교함.
그룹간 분산은 그룹 평균들이 전체 평균에서 벌어진 정도임.
그룹내 분산은 각 그룹 안에서 점들이 퍼진 정도임.
직관은 간단함.
평균들이 서로 멀고(그룹간 큼) 각 그룹은 촘촘하면(그룹내 작음) → 차이가 진짜 같음.
평균들이 가깝거나 각 그룹이 널뛰면 → 그 차이는 우연일 수 있음.
즉 신호(그룹간)를 잡음(그룹내)으로 견주는 것임.
그룹간 큼 · 그룹내 촘촘
그룹간 작음 · 그룹내 널뜀
F = 그룹간분산 ÷ 그룹내분산
그 두 분산의 비율이 F값임.
F = MSB ÷ MSW
MSB는 그룹간 평균제곱(between) / 신호.
MSW는 그룹내 평균제곱(within) / 잡음.
분자·분모는 그냥 합이 아니라 자유도로 나눈 평균제곱임.
그룹간 자유도는 그룹 수 빼기 1, 그룹내 자유도는 전체 수 빼기 그룹 수.
이렇게 나눠야 비교가 공정해짐.
F가 1 근처면 신호와 잡음이 비슷함 = 차이가 안 두드러짐.
F가 크면 신호가 잡음을 압도함 = 평균 차이가 두드러짐.
한 줄 수식으로 더 보기
SSB = Σ nⱼ(x̄ⱼ − x̄)² · 그룹 평균과 전체 평균 차이의 가중 제곱합.SSW = Σ Σ (xᵢⱼ − x̄ⱼ)² · 각 점과 그 그룹 평균 차이의 제곱합.
F = (SSB / (k−1)) ÷ (SSW / (N−k)).
k는 그룹 수, N은 전체 표본 수임.
직접 F를 만들어 본다
말로 들은 걸 손으로 굴려 봄. 오른쪽에서 직접 해봄.
세 그룹의 점 분포와 각 평균선이 보임.
파란 점선은 전체 평균임.
평균 벌리기 슬라이더를 올리면 그룹 평균들이 멀어짐 → 분자(그룹간)가 커져 F가 올라감.
그룹 내 퍼짐을 키우면 점들이 널뛰어 분모(그룹내)가 커져 F가 내려감.
F가 임계선을 넘으면 막대가 파랗게 바뀜 = 유의함.
평균은 그대로 둔 채 퍼짐만 키워서 F를 떨어뜨려 보면 잡음의 힘이 보임.
파란 점선이 전체 평균임.
그룹 평균선이 점선에서 멀수록 그룹간 분산이 큼.
평균을 벌리면 분자(그룹간)가 커져 F↑.
퍼짐을 키우면 분모(그룹내)가 커져 F↓.
어느 그룹이 다른지는 F로는 모름 → 사후검정.
F가 크면 어딘가 다르다
F가 임계값을 넘으면 결론은 하나임.
“적어도 한 그룹이 다르다.”
근데 ANOVA는 어느 그룹이 다른지는 말해주지 않음.
A가 튄 건지, C가 튄 건지, 둘 다인지 모름.
그걸 찾는 게 사후검정(post-hoc)임.
Tukey HSD, Bonferroni 같은 방법으로 그룹 쌍을 비교하되, 비교를 여러 번 하는 만큼 기준을 더 엄격하게 보정함.
그래서 다시 거짓 양성이 쌓이지 않음.
정리하면 두 단계임.
1단계 ANOVA로 “다른 데가 있나?” 한 번에 판정.
2단계 사후검정으로 “어디가 다른가?” 안전하게 짚음.
Q. ANOVA가 t검정을 여러 번 하는 것보다 나은 이유는?
한 번에 검정해서 1종 오류(거짓 양성)가 누적되는 걸 막아줌.t검정을 쌍마다 반복하면 비교 횟수만큼 헛걸릴 확률이 쌓이는데, ANOVA는 그룹간·그룹내 분산을 F 하나로 묶어 단 한 번에 판정함.
보정으로 거짓 양성 다시 안 쌓임