오늘 끝나면
신뢰구간
- ✓신뢰구간의 핵심 문제를 한 문장으로 설명한다
- ✓오른쪽 실습에서 신뢰구간이 어떻게 움직이는지 관찰한다
- ✓다음 강의와 이어지는 한계를 말할 수 있다
실습 미션
점 하나 말고 범위로 — 95%가 정말 뜻하는 것 이 문장이 실제로 무슨 뜻인지 실습에서 한 번 손으로 확인한다.
성공 조건
- □실습의 기본값을 먼저 관찰
- □입력값이나 모드를 한 번 이상 바꿔 결과 비교
- □왜 결과가 바뀌었는지 한 문장으로 설명
통계 · 08
신뢰
구간
표본평균 하나는 흔들림. 그래서 점 하나로 안 찍음.
참값이 있을 법한 범위를 같이 줌. 그게 신뢰구간임.
점추정은 흔들린다 → 범위로
모평균 μ는 모름. 우리가 가진 건 표본 하나뿐임.
표본평균 x̄로 μ를 추측함. 이게 점추정임.
근데 표본을 다시 뽑으면 x̄가 또 달라짐.
한 점만 찍으면 “딱 맞췄다”고 말할 수가 없음.
그래서 점 하나 대신 범위를 줌.
x̄주변에 폭을 둘러서 “μ는 이 안쯤”이라 말함.
이 범위가 신뢰구간임.
점 = x̄ — μ 근처에서 매번 흔들림
신뢰구간 = 추정값 ± 오차폭
신뢰구간은 한 줄 모양임. 추정값에서 양쪽으로 오차폭만큼 벌림.
σ를 안다고 보면 95% 구간은 이렇게 됨.
x̄ ± 1.96 · σ/√n
x̄는 가운데(점추정)
σ/√n은 표본평균이 흔들리는 정도(표준오차)
1.96은 95%를 담으려고 곱하는 배수
신뢰수준을 99%로 올리면 배수가 2.58로 커짐.
더 확실히 담으려면 더 넓게 벌려야 함 / 폭과 확신은 맞바꾸는 것임.
왜 하필 1.96?
표준정규분포에서 가운데 95%를 담는 양쪽 경계가 ±1.96임.90%면 ±1.645, 99%면 ±2.58.
σ를 모르고 표본으로 추정하면 z 대신 t 분포를 씀(9강).
95%의 진짜 뜻
95% 신뢰구간 = “이 구간 안에 μ가 95% 확률로 있다”가 아님.
같은 방식으로 표본을 계속 뽑아 매번 구간을 만든다고 해보셈.
그렇게 만든 구간 중 약 95%가 모평균을 포함함.
신뢰는 절차에 붙는 것이지, 특정 한 구간에 붙는 게 아님.
오른쪽에서 직접 100번 뽑아봄.
막대 하나 = 표본 하나의 95% 구간임.
파란 선(μ)을 못 지나는 약 5개가 빨강으로 뜸.
이미 만들어진 한 구간은 μ를 담았거나 안 담았거나 둘 중 하나임.
확률 95%는 “이런 구간을 만드는 절차”의 성공률임.
파란 점선이 모평균 μ=50임.
100개 중 평균 약 5개가 μ를 못 지나 빨강이 됨.
n 을 키우면 막대가 짧아짐 = 구간이 좁아짐.
표본이 크면 구간이 좁아진다
구간 폭은 σ/√n이 좌우함. n이 분모에 √로 들어있음.
n이 커지면 √n이 커지고, 오차폭은 줄어듦.
표본이 많을수록 표본평균이 덜 흔들리니 범위를 좁혀도 됨.
단 √n이라 효율이 떨어짐.
폭을 절반으로 줄이려면 n을 4배로 늘려야 함.
정밀도는 비싸게 사는 것임.
폭 절반 = n 4배 (√n이라서)
정리 — 범위로 말하기
오늘 셋만 챙기면 됨.
점추정은 흔들림 → 그래서 범위(신뢰구간)로 말함
95% = 같은 절차를 반복하면 구간들의 95%가 μ를 포함
n 크면 σ/√n이 줄어 구간이 좁아짐
다음 강에서 σ를 모를 때 쓰는 t-검정으로 이어짐.
Q. 95% 신뢰구간이 정확히 뜻하는 것은?
같은 절차를 반복하면 만들어진 구간들의 95%가 참값(μ)을 포함한다는 것임.지금 손에 든 이 구간 하나가 95% 확률로 μ를 담는다는 뜻은 아님.
이미 만든 구간은 담았거나 안 담았거나 둘 중 하나일 뿐임 / 확률은 절차에 붙음.