<aside> 📌
Part 1 · Ch04 — Harness Engineering 개론
모델은 우리가 못 바꾼다. 하지만 모델을 둘러싼 환경(맥락·제한·흐름·검증)은 우리가 설계할 수 있다. 그 환경 설계가 Harness Engineering.
한 줄 요약: 같은 Claude인데 결과가 들쭉날쭉한 이유는 모델이 아니라 하네스다. 본 챕터는 구조 → 맥락 → 계획 → 실행 → 검증 → 개선 6축을 한 바퀴 돈다.
</aside>
<aside> 🎯
같은 모델, 같은 질문인데 어떤 사람은 한 방에 끝내고 어떤 사람은 하루 종일 헤맨다.
차이는 모델이 아니라 모델을 둘러싼 작업 환경 — 무엇을 알려줬고, 어디까지 허용했고, 어떻게 검증하게 했는가.
"말 잘하기"(프롬프트)가 아니라 "일하는 방법 설계하기"(하네스) 가 결과를 가른다.
</aside>
실패했을 때 던지는 질문이 바뀐다:
| 회사 | 하네스 효과 |
|---|---|
| LangChain | 하네스 도입으로 작업 성공률 +14%p |
| OpenAI | 내부 코드베이스 100만 줄을 에이전트가 다룰 수 있게 환경 정비 |
| Anthropic | 같은 작업을 하네스 차이로 $9 vs $200 — 22배 비용 격차 |
| Stripe | 에이전트가 주당 1,000 PR 처리하는 워크플로우 |
<aside> 💡
모델 교체로 얻는 5%보다, 하네스 설계로 얻는 15%가 현실적이다.
모델은 Anthropic이 바꾼다. 하네스는 오늘 내가 바꾼다.
</aside>
① 프롬프트 엔지니어링 "이렇게 말해봐"
↓ (한 번의 대화를 잘 짜기)
② 컨텍스트 엔지니어링 "이 배경을 알아둬"
↓ (필요한 맥락을 미리 깔기)
③ 하네스 엔지니어링 "환경 자체를 설계하자"
(맥락·제한·흐름·검증을 포괄하는 작업 환경)
하네스 = 맥락·제한·흐름·검증을 포괄하는 "작업 환경" 전체. 넓게 보면 가드레일·목적별 툴셋, 그리고 개발 밖의 워크플로우(콘텐츠·리서치)까지 포함한다.