스킬캠퍼스
8강 · 신뢰구간
강의

오늘 끝나면

신뢰구간

  • 신뢰구간의 핵심 문제를 한 문장으로 설명한다
  • 오른쪽 실습에서 신뢰구간이 어떻게 움직이는지 관찰한다
  • 다음 강의와 이어지는 한계를 말할 수 있다

실습 미션

점 하나 말고 범위로 — 95%가 정말 뜻하는 것 이 문장이 실제로 무슨 뜻인지 실습에서 한 번 손으로 확인한다.

성공 조건

  • 실습의 기본값을 먼저 관찰
  • 입력값이나 모드를 한 번 이상 바꿔 결과 비교
  • 왜 결과가 바뀌었는지 한 문장으로 설명

통계 · 08

신뢰
구간

표본평균 하나는 흔들림. 그래서 점 하나로 안 찍음.
참값이 있을 법한 범위를 같이 줌. 그게 신뢰구간임.

P.01통계 · 08

점추정은 흔들린다 → 범위로

모평균 μ는 모름. 우리가 가진 건 표본 하나뿐임.

표본평균 로 μ를 추측함. 이게 점추정임.
근데 표본을 다시 뽑으면 가 또 달라짐.
한 점만 찍으면 “딱 맞췄다”고 말할 수가 없음.

그래서 점 하나 대신 범위를 줌.
주변에 폭을 둘러서 “μ는 이 안쯤”이라 말함.
이 범위가 신뢰구간임.

표본 바꿔 뽑으면 평균도 매번 달라짐
표본마다 다른 x̄
μ=50
표본1
48.2
표본2
51.6
표본3
49.1
표본4
53.0
표본5
47.4

점 = x̄ — μ 근처에서 매번 흔들림

P.02통계 · 08

신뢰구간 = 추정값 ± 오차폭

신뢰구간은 한 줄 모양임. 추정값에서 양쪽으로 오차폭만큼 벌림.

σ를 안다고 보면 95% 구간은 이렇게 됨.
x̄ ± 1.96 · σ/√n

는 가운데(점추정)
σ/√n은 표본평균이 흔들리는 정도(표준오차)
1.96은 95%를 담으려고 곱하는 배수

신뢰수준을 99%로 올리면 배수가 2.58로 커짐.
더 확실히 담으려면 더 넓게 벌려야 함 / 폭과 확신은 맞바꾸는 것임.

왜 하필 1.96?표준정규분포에서 가운데 95%를 담는 양쪽 경계가 ±1.96임.
90%면 ±1.645, 99%면 ±2.58.
σ를 모르고 표본으로 추정하면 z 대신 t 분포를 씀(9강).
x̄를 가운데 두고 양쪽으로 벌린 폭
신뢰구간 한 줄
x̄ ± 1.96 · σ/√n
점추정 — 가운데
σ/√n표준오차 — 흔들림
1.9695% 담는 배수
P.03통계 · 08

95%의 진짜 뜻

95% 신뢰구간 = “이 구간 안에 μ가 95% 확률로 있다”가 아님.

같은 방식으로 표본을 계속 뽑아 매번 구간을 만든다고 해보셈.
그렇게 만든 구간 중 약 95%가 모평균을 포함함.
신뢰는 절차에 붙는 것이지, 특정 한 구간에 붙는 게 아님.

오른쪽에서 직접 100번 뽑아봄.
막대 하나 = 표본 하나의 95% 구간임.
파란 선(μ)을 못 지나는 약 5개가 빨강으로 뜸.

이미 만들어진 한 구간은 μ를 담았거나 안 담았거나 둘 중 하나임.
확률 95%는 “이런 구간을 만드는 절차”의 성공률임.

100번 뽑아 100개 구간 — 약 95개가 μ 포함
신뢰구간 100개 · 직접 뽑기
입력 — 표본 크기 n = 30
5200
출력 — 막대 1개 = 표본 1개의 95% 신뢰구간
모평균 포함
96 / 100
놓침 (빨강)
4

파란 점선이 모평균 μ=50임.
100개 중 평균 약 5개가 μ를 못 지나 빨강이 됨.
n 을 키우면 막대가 짧아짐 = 구간이 좁아짐.

P.04통계 · 08

표본이 크면 구간이 좁아진다

구간 폭은 σ/√n이 좌우함. n이 분모에 √로 들어있음.

n이 커지면 √n이 커지고, 오차폭은 줄어듦.
표본이 많을수록 표본평균이 덜 흔들리니 범위를 좁혀도 됨.

단 √n이라 효율이 떨어짐.
폭을 절반으로 줄이려면 n을 4배로 늘려야 함.
정밀도는 비싸게 사는 것임.

n 키우면 오차폭 σ/√n 이 줄어듦
n ↑ → 구간 폭 ↓ (σ=10)
n = 10± 6.20
n = 40± 3.10
n = 160± 1.55

폭 절반 = n 4배 (√n이라서)

P.05통계 · 08

정리 — 범위로 말하기

오늘 셋만 챙기면 됨.

점추정은 흔들림 → 그래서 범위(신뢰구간)로 말함
95% = 같은 절차를 반복하면 구간들의 95%가 μ를 포함
n 크면 σ/√n이 줄어 구간이 좁아짐

다음 강에서 σ를 모를 때 쓰는 t-검정으로 이어짐.

Q. 95% 신뢰구간이 정확히 뜻하는 것은?같은 절차를 반복하면 만들어진 구간들의 95%가 참값(μ)을 포함한다는 것임.
지금 손에 든 이 구간 하나가 95% 확률로 μ를 담는다는 뜻은 아님.
이미 만든 구간은 담았거나 안 담았거나 둘 중 하나일 뿐임 / 확률은 절차에 붙음.
세 줄 요약
세 줄 정리
01
점 → 범위
x̄ 하나는 흔들림. 범위로 줌
02
95%의 뜻
반복하면 구간의 95%가 μ 포함
03
n ↑
σ/√n 줄어 구간 좁아짐

3줄 요약

  1. 1점 하나 말고 범위로 — 95%가 정말 뜻하는 것
  2. 2신뢰구간은 분포 → 표본 → 검정 → 회귀 → 모델 선택 흐름 안의 한 칸이다.
  3. 3개념을 외우는 것보다 입력을 바꾸면 무엇이 달라지는지 보는 것이 우선이다.

완료 전 점검

복습 카드

신뢰구간

점 하나 말고 범위로 — 95%가 정말 뜻하는 것

분포

데이터가 어떤 모양으로 퍼져 있는지 나타낸 것

표본

전체를 알기 위해 뽑아 본 일부 데이터