Day 1 · 퍼셉트론과 XOR 문제

오늘 끝나면

퍼셉트론과 XOR 문제

✓퍼셉트론과 XOR 문제의 핵심 문제를 한 문장으로 설명한다
✓오른쪽 실습에서 퍼셉트론과이 어떻게 움직이는지 관찰한다
✓다음 강의와 이어지는 한계를 말할 수 있다

실습 미션

1958 로젠블랫의 환호 → 1969 민스키의 XOR 증명 → 첫 AI 겨울 이 문장이 실제로 무슨 뜻인지 실습에서 한 번 손으로 확인한다.

성공 조건

□실습의 기본값을 먼저 관찰
□입력값이나 모드를 한 번 이상 바꿔 결과 비교
□왜 결과가 바뀌었는지 한 문장으로 설명

AI · Day 1 / 지도학습 · 생성 DL

퍼셉트론과
XOR 문제

1958년 퍼셉트론 나옴. 1969년 XOR 하나 때문에 사형선고 받음. 딥러닝 첫 겨울이 시작된 현장을 오늘 직접 재현함.

P.01AI · Day 1

기계가 스스로 배운다는 충격

1958년 여름, 코넬대 심리학 교수 프랭크 로젠블랫이 방 크기만 한 기계를 세움. 이름은 Mark I 퍼셉트론. 광전지 400개를 망막처럼 깔아 실제로 작동함.

기자들 앞에서 말함. “이 기계는 결국 걷고, 말하고, 스스로를 인식하게 됨.” 다음 날 뉴욕타임즈 1면에 “전자 두뇌가 스스로 학습한다” 실림.

왜 충격이었나? 당시 컴퓨터는 “IF A THEN B”를 사람이 일일이 타이핑하는 논리 기계였음. 근데 로젠블랫은 데이터만 보여주면 기계가 규칙을 스스로 찾는다는 걸 들고 나옴. 오늘날 모든 딥러닝의 출발점임.

1958 → 1986 / 신경망의 흥망성쇠

신경망 연대기

1958퍼셉트론 발표 · NYT 1면

1962수렴 정리 증명 (Novikoff)

1969민스키 · 페이퍼트, XOR 증명

1971로젠블랫 사망 (43세)

1974DARPA 예산 삭감 · AI 겨울

1986역전파 재발견 · 부활

■ 파란칸 = 도약 · □ 흰칸 = 겨울

P.02AI · Day 1

퍼셉트론, 직접 만져 보기

뉴런 하나가 어떻게 ‘판단’을 함? 사실 가중 투표임.

입력마다 가중치(중요도)를 곱해 다 더함. 그 합이 기준선을 넘으면 발화(1), 못 넘으면 침묵(0). 시험 합격선 넘기랑 똑같음. 식으론 z = w·x + b 한 줄임.

오른쪽에서 가중치를 밀어보셈. 평면을 가르는 선이 기울어짐 — 파란 쪽은 발화, 흰 쪽은 침묵. 이제 ‘AND’ 버튼을 눌러보셈. 같은 뉴런이 선만 옮겨서 AND가 됨. 숫자 몇 개가 곧 논리가 됨. 이게 학습의 씨앗임.

마지막으로 ‘XOR 도전’. 어떤 선을 그어도 점 하나는 꼭 틀림. 직선 하나의 한계임. 그래서 다음 강에서 층을 쌓음 → MLP.

선을 움직여 보세요 · AND / OR / XOR

뉴런이 긋는 선= OR 게이트

가중치 w₁1.0가중치 w₂1.0편향 b (기준선)-0.5

프리셋:

지금 이 뉴런은 OR. 가중치만 밀어서 선을 옮긴 게 전부임. 숫자가 곧 논리가 됨.

P.03AI · Day 1

1969년, XOR이라는 폭탄

10년 뒤, MIT의 마빈 민스키가 등장함. 로젠블랫의 고교 동창이자 평생 라이벌이었음. 동료 페이퍼트와 함께 퍼셉트론의 한계를 수학으로 증명한 책을 냄.

가장 유명한 결과가 XOR임. “둘이 다르면 1, 같으면 0”이라는 단순한 논리임. 근데 이 네 점을 직선 하나로 나눌 수 있나? 오른쪽 그림을 봄. 어떤 직선을 그어도 파란 점 하나는 항상 반대편에 끼어듦.

수학적으로도 모순임. 네 조건을 동시에 만족하려면 b 미만 0과 b 초과 0이 함께 성립해야 함. 그런 (w₁, w₂, b)는 존재 불가임. 퍼셉트론 수렴 정리엔 “선형 분리 가능할 때만”이라는 단서가 있었고, XOR이 그 단서를 깸.

XOR — 어떤 직선으로도 못 나눈다

XOR 진리표 · 결정 평면

x1	x2	XOR
0	0	0
0	1	1
1	0	1
1	1	0

● 파랑 = 1 · ○ 흰 = 0 · 점선 = 어떤 직선도 실패

P.04AI · Day 1

numpy로 실패를 재현하다

말로만 들으면 안 와닿음. 그래서 1958년 로젠블랫이 했던 그대로 퍼셉트론을 numpy로 직접 짬. 핵심은 오른쪽 코드 몇 줄임. 틀렸을 때만 가중치를 고치는 규칙임.

AND랑 OR 넣으면 몇 에포크 만에 errors=0으로 깔끔히 수렴함. 근데 같은 코드에 XOR 넣고 1000번 돌려도 오분류 개수가 0으로 안 가고 영원히 진동함. 정확도는 75%를 못 넘음.

이게 1969년 민스키가 칠판에 적었던 현상임. 지금 딥러닝 역사상 가장 유명한 실패를 코드로 다시 살려낸 셈임.

Perceptron — 직접 구현

Perceptron Learning Rule · numpy

파이썬 코드 보기

for epoch in range(n_iter):
    errors = 0
    for xi, yi in zip(X, y):
        z = np.dot(xi, w) + b
        y_pred = 1 if z >= 0 else 0
        update = lr * (yi - y_pred)
        if update != 0:          # 틀렸을 때만!
            w += update * xi
            b += update
            errors += 1
    if errors == 0:
        break                    # 수렴

게이트	수렴?	정확도
AND	예	100%
OR	예	100%
XOR	아니오	75% 미만

P.05AI · Day 1

선형의 한계가 가르쳐 주는 것

민스키의 증명은 수학적으로 옳았음. 단층 퍼셉트론은 정말 XOR을 못 풂. 근데 그를 죽인 건 증명이 아니라 해석이었음.

“다층으로 쌓으면 풀린다”는 뒷부분은 잊히고, “퍼셉트론은 XOR도 못 푼다”는 한 문장만 남음. 연구비 끊기고 신경망은 17년간 얼어붙음. 그래도 1986년 역전파로 부활하고, 2012년 AlexNet, 2017년 트랜스포머로 끝내 왕좌를 되찾음.

비즈니스로 옮기면

기업 AX 프로젝트에서 늘 같은 질문이 나옴. “우리도 LLM 써야 하나요?” 답은 오늘 스토리에 있음. 먼저 우리 문제가 ‘선형으로 풀리는지’부터 확인해야 함. 로지스틱 회귀로 baseline 찍어 충분하면 LLM은 낭비임. 신용평가도 이탈 예측도 선형 모델로 충분한 경우가 90%임.

Q. 다음 중 한 직선으로 분리할 수 없는 함수는? (AND · OR · NAND · XOR)

정답은 XOR임. AND·OR·NAND·NOT은 다 2D 평면에서 직선 하나로 나뉨. XOR만 불가능함. 그래서 다층 네트워크(MLP)가 필요해지고, 그 학습법이 Day 2의 역전파임.

퍼셉트론 vs 로지스틱 회귀

계단함수 vs 시그모이드

Perceptron · step

딱딱한 0/1 · 미분 불가

Logistic · sigmoid

부드러운 확률 · 미분 가능

항목	Perceptron	Logistic
출력	0 / 1	0~1 확률
미분	불가	가능
XOR	실패	실패

미분 가능성이 역전파의 열쇠 → Day 2