8강 · 파인튜닝 vs RAG vs 프롬프트

오늘 끝나면

파인튜닝 vs RAG vs 프롬프트

✓파인튜닝 vs RAG vs 프롬프트의 핵심 문제를 한 문장으로 설명한다
✓오른쪽 실습에서 파인튜닝이 어떻게 움직이는지 관찰한다
✓다음 강의와 이어지는 한계를 말할 수 있다

실습 미션

언제 무엇을 — 비용·정확도·유지보수 이 문장이 실제로 무슨 뜻인지 실습에서 한 번 손으로 확인한다.

성공 조건

□실습의 기본값을 먼저 관찰
□입력값이나 모드를 한 번 이상 바꿔 결과 비교
□왜 결과가 바뀌었는지 한 문장으로 설명

Enterprise LLM · 08

파인튜닝 vs RAG
vs 프롬프트

모델을 우리 일에 맞추는 방법은 세 가지임.
프롬프트 · RAG · 파인튜닝. 셋은 경쟁이 아니라 층위임.
보통 프롬프트 → RAG → 필요할 때만 파인튜닝 순으로 올라감.

P.01Enterprise LLM · 08

모델을 우리 일에 맞추는 세 갈래

“우리 회사에 맞게 LLM 좀 학습시켜줘.” 막상 보면 손댈 자리가 셋임.

프롬프트는 모델은 그대로 두고 지시문만 바꿈.
RAG는 답할 때마다 사내 문서를 검색해 근거로 끼워 줌.
파인튜닝은 모델 가중치를 우리 데이터로 더 학습시킴.

건드리는 깊이가 다름. 프롬프트는 입력만, RAG는 입력 옆에 지식을, 파인튜닝은 모델 자체를 바꿈.
깊이 들어갈수록 효과는 커지지만 비용·갱신 난이도도 같이 커짐.

프롬프트 · RAG · 파인튜닝 — 무엇을 손대나

무엇을 손대나 — 깊이 순

프롬프트지시문

모델은 그대로 · 입력만 바꿈

RAG입력 + 검색 지식

답할 때마다 사내 문서를 끼워 줌

파인튜닝모델 가중치

우리 데이터로 모델을 다시 학습

깊을수록 효과 ↑ · 비용·갱신난이도 ↑

P.02Enterprise LLM · 08

각 방법이 잘하는 것, 못하는 것

셋은 잘하는 결이 다름. 한 방법으로 다 덮으려 하면 비싸거나 안 맞음.

프롬프트는 즉시 · 가장 쌈. 코드 배포도 학습도 없음.
대신 넣을 수 있는 지식이 맥락 창 크기만큼이고, 말투를 강하게 고정하긴 약함.

RAG는 최신·사내 지식을 답에 끌어옴. 문서가 바뀌면 인덱스만 갈면 됨.
출처를 같이 줄 수 있어 환각도 줄임. 단, 검색이 빗나가면 답도 빗나감.

파인튜닝은 말투·형식·출력 포맷을 몸에 새김.
대신 데이터 준비·GPU 학습이 비싸고, 새 사실이 생기면 다시 학습해야 해서 갱신이 느림.

강점 · 약점 한 줄 대조

강점 ↔ 약점

프롬프트

+ 즉시 · 가장 쌈

+ 배포·학습 없음

− 지식 양 제한

− 말투 고정 약함

RAG

+ 최신·사내 지식

+ 문서만 갈면 갱신

+ 출처로 환각 ↓

− 검색 빗나가면 답도

파인튜닝

+ 말투·형식 고정

+ 출력 포맷 일관

− 비쌈 · GPU 학습

− 갱신 느림

P.03Enterprise LLM · 08

언제 무엇을 — 요구가 방법을 정함

방법부터 고르지 않음. 업무가 뭘 요구하는지 보고 거기서 역산함.

최신 사내 정보를 답에 반영해야 하면 RAG임.
가격표·정책·메뉴얼처럼 자주 바뀌는 지식은 파인튜닝으로 못 따라감.

출력 말투·형식을 항상 똑같이 찍어내야 하면 파인튜닝이 강함.
분류·상담 톤·사내 보고서 포맷 같은 정해진 틀이 그런 경우임.

빠르게 일단 써보고 싶으면 프롬프트로 시작함.
대부분의 사내 과제는 프롬프트로 70%를 맞추고, 모자란 부분을 RAG·파인튜닝으로 채움.

요구 → 추천 방법 결정표

요구 → 추천

이 업무가 요구하는 것	추천
최신 사내 정보를 답에가격표 · 정책 · 매뉴얼	RAG
말투·형식을 늘 똑같이분류 · 상담 톤 · 보고서 포맷	파인튜닝
일단 빠르게 써보기초안 · 요약 · 아이디어	프롬프트
최신 + 말투 둘 다사내 챗봇 정식 운영	RAG + 파인튜닝

방법부터가 아니라 요구부터 봄

P.04Enterprise LLM · 08

직접 골라보기

오른쪽에서 직접 정해 보셈.
최신성 · 말투 고정 · 비용 민감도를 슬라이더로 올리면 추천이 바뀜.

최신성을 올리면 RAG가 위로 올라옴.
말투 고정을 올리면 파인튜닝이 따라 올라옴.
비용만 높이면 프롬프트가 1위로 내려옴.

최신성과 말투를 둘 다 높이면 한 방법으로 안 끝남.
그땐 RAG로 지식을 주입하고 파인튜닝으로 말투를 고정하는 조합이 뜸.
실무 결정도 이렇게 점수가 아니라 요구에서 출발함.

요구를 정하면 추천 방식이 뜸

선택 가이드 · 요구를 정해 보셈

이 업무가 뭘 요구하나 — 0 ~ 3

최신성×3

안 바뀜매일 바뀜

말투·형식 고정×1

상관없음딱 고정

비용·속도 민감×2

여유 있음최대한 싸게

이 요구 기준 적합도

1RAG검색 붙여 근거 주입77

2프롬프트지시문만 손봄60

3파인튜닝가중치 추가 학습33

비용·유지보수 — 올라갈수록 무거움

순서가 프롬프트 → RAG → 파인튜닝인 이유는 효과 순이 아니라 무게 순임.

프롬프트는 도입도 갱신도 거의 공짜임. 지시문만 고치면 끝.
RAG는 벡터DB·임베딩 파이프라인을 세워야 하지만, 한 번 세우면 문서 교체로 갱신함.

파인튜닝은 학습 데이터 수천 건 준비 · GPU 학습 · 검증이 들어감.
새 정보가 생길 때마다 재학습이라 운영 부담이 제일 큼.
그래서 파인튜닝은 “프롬프트·RAG로 못 맞추는 게 확인됐을 때”의 마지막 카드임.

Q. 매일 바뀌는 최신 사내 문서를 답에 반영하려면? (프롬프트 · RAG · 파인튜닝 · 모델 교체)

정답은 RAG임.
RAG는 답할 때마다 최신 문서를 검색해 끌어옴. 문서가 바뀌면 인덱스만 갈면 됨.
파인튜닝은 가중치에 지식을 새겨 넣는 방식이라 새 정보가 생길 때마다 재학습해야 함 — 갱신이 느리고 비쌈.
그래서 “자주 바뀌는 지식”은 파인튜닝이 아니라 RAG의 일임.

도입 난이도 · 갱신 비용 사다리

도입·유지보수 무게 — 올라갈수록 무거움

프롬프트

도입 지시문 작성
갱신 문장 고치면 끝

↓

RAG

도입 벡터DB · 임베딩 파이프라인
갱신 문서 인덱스 교체

↓

파인튜닝

도입 데이터 수천 건 · GPU 학습
갱신 재학습 · 재검증

파인튜닝은 못 맞출 때의 마지막 카드