파인튜닝
Fine-tuning
사전학습된 베이스 모델을 내 라벨 예시로 추가 학습시켜 특정 작업·형식·톤·행동에 특화시키는 것. 행동·문체를 바꾸지, 새 지식을 넣는 용도는 아닙니다.
1
파인튜닝(Fine-tuning)은 사전학습된 베이스 모델을 내가 가진 라벨 예시로 추가 학습시켜, 특정 작업·형식·톤·행동에 특화시키는 것입니다.
핵심 포인트
지도 파인튜닝(SFT)이 기본입니다 — 프롬프트에 대한 "올바른 응답 예시"를 주어 모델의 행동을 유도합니다. 분류, 일관된 형식 맞추기, 지시 따르기 교정에 효과적입니다.
워크플로: ① 학습 예시 수집 → ② JSONL 파일로 업로드 → ③ API/대시보드로 파인튜닝 잡 생성 → ④ 결과 모델을 평가하고 일반 모델처럼 사용.
언제 쓰나: OpenAI도 "먼저 프롬프트로 해보라"고 명시합니다. 컨텍스트에 다 못 담을 만큼 예시가 많거나, 매우 일관된 출력 형식이 필요하거나, 더 작고 싸고 빠른 모델을 한 작업에 특화시키고 싶을 때 빛납니다.
행동·문체를 바꾸지 새로운 사실 지식을 넣지는 않습니다 — 최신·비공개 사실 주입은 RAG가 더 적합합니다. SFT 외에 DPO·강화 파인튜닝도 있습니다.
이렇게 쓰여요
라벨된 고객지원 티켓으로 학습해, 항상 브랜드 톤 + 고정 JSON 구조로 답하게 만들기
작은 모델을 큰 모델 수준의 분류 정확도로 끌어올려 비용·지연 절감
주의할 점
파인튜닝은 "행동·형식"을 가르치지 "새로운 사실 지식"을 넣지 않습니다. 프롬프트 엔지니어링와 RAG를 먼저 충분히 시도한 뒤 고려하세요.
함께 보면 좋아요
RAG · 프롬프트 엔지니어링 · 토큰