코드를 빠르게 쓰는 것보다,
무엇을 쓸지 정하는 게 더 중요해지는 시대
4명이 파일만으로 길드 운영·컨설팅·콘텐츠·커뮤니티를 돌립니다.
오늘 내용은 이 환경에서 수백 명과 함께 검증한 결과입니다.
이 3개만 들고 돌아가면 됩니다.
무게중심이 어디로 이동하는가
| 단계 | 방식 | 대표 도구 | 사용자 경험 | 한계 |
|---|---|---|---|---|
| Stage 1 | 복사 · 붙여넣기 | ChatGPT · Claude 웹 | 질문 → 답변 → 수동 반영 | 컨텍스트 휘발 · 매번 재입력 |
| Stage 2 | 버튼 클릭 · 인라인 제안 | Cursor · Copilot · v0 | IDE 내 Tab으로 수락 | 파일 단위 · 특정 기능에 한정 |
| Stage 3 | 위임 (Delegation) | Claude Code · Codex · Ralph · OpenClaw | "이 버그 조사해" → 나가서 다른 일 → PR 준비 | 하네스·스킬·Context 설계가 승부 |
사람이 일하는 루프와 똑같은 구조. 그래서 "위임"이 진짜 위임이 됩니다. 컴퓨터 전체에 접근해서 환경을 읽고, 판단하고, 실행하고, 스스로 검증합니다.
| 이름 | 직군 | Before → After |
|---|---|---|
| 안영학 | 이벤터스 CEO | 인사평가 2주, 시간 50% 투입 → 4단계로 단축, 30시간 절감 |
| 정이을 | 토스 플레이스 데이터 | 수동 데이터 요청 처리 → Slack에서 자연어 → SQL 자동 실행 |
| 최현종 | BDR · 영업 | 인바운드 리드 1시간/건 → 완전 자동화, 월 20시간 절감 |
| 이경은 | 전략가 | 정산 수동 → 정산 + 고객사 모니터링 + 인플루언서 플랫폼 3개 자동화 |
| 예건희 | AI 엔지니어 | RAG 개선 7일 예상 → 3시간에 완료 · 성능 향상 |
| Day 1 | CLAUDE.md — AI에게 나를 알려준다 |
| Day 2 | MCP · Context Sync — 내 도구를 연결 |
| Day 3 | Clarify — 모호성을 명확으로 |
| Day 4 | Compound — 인사이트를 문서로 축적 |
| Day 5 | 콘텐츠 소화 파이프라인 |
| Day 6 | GitHub PR — 결과물 공유 |
| Day 7 | 최종 발표 — Before/After 공유 |
| Project | Team | LOC | Done | Prize |
|---|---|---|---|---|
| houseops (Ouroboros) | 이재규·정승아 | 169,553 | 95% | 🥇 $10K |
| cyberthug-screenclone | 허예찬·하도윤 | 45,522 | 85% | 🥈 $5K |
| sansa | 황성현 | 8,483 | 85% | 🥉 $3K |
| tonica | 김우영 | 122,028 | 97.6% | — |
"이걸 어떻게 구현하지?"
엔지니어링 시간의 대부분이 여기에. 기획서와 덱으로 설득한 뒤 개발 착수.
"어느 방향이 맞는가.
무엇을 만들면 해결되지?"
코드가 싸질수록 질문이 비싸진다. 설명하는 사람 → 보여주는 사람.
| 기존 해자 (침식) | 새 해자 (부상) |
|---|---|
| 침식 데이터 전환 비용 | 부상 에이전트 친화 문서 · API |
| 침식 워크플로우 락인 | 부상 도메인 암묵지 · 장기 관계 |
| 침식 버튼 기반 UI | 부상 하네스 · 스킬 카탈로그 |
프레임워크보다 본질이 중요한 시대.
— 고객이 무엇을 원하는지 알아내는 것, 그 자체가 기획이다.
| 프레임워크 | 공식 | 쓰임 |
|---|---|---|
| ICE Score | Impact × Confidence × Ease | 기능 우선순위 |
| RICE | Reach × Impact × Confidence ÷ Effort | 로드맵 순서 |
| Lean Canvas | 9-box 1페이지 | 비즈니스 가설 정리 |
| MoSCoW | Must · Should · Could · Won't | 스콥 축소 |
| Impact × Effort | 2×2 매트릭스 | "Quick Win" 고르기 |
| Kano Model | Basic · Performance · Delighter | 어떤 기능을 뺄지 |
저도 PO 시절 ICE와 Lean Canvas를 가장 자주 썼습니다. 메이아이에서 현대차 PoC를 기획할 때도요.
| 과거 (프레임워크가 태어난 시대) | 지금 | |
|---|---|---|
| 기능 1개 만드는 비용 | 개발자 2명 × 2주 × 수백만원 | 에이전트 몇 개 × 하루 × 수천원 |
| 병목 | 개발 리소스 (희소 자원) | 방향 판단 · 고객 이해 |
| 기획의 역할 | "무엇을 안 할지" 골라내기 | "무엇이 진짜 맞는지" 알아내기 |
| 개발자 설득 | 항상 어려웠다 (비용이 크니까) | 훨씬 쉽다 (싸니까 일단 보여주고 설득) |
과거 기획·제품 개발 방법론은
대부분 리소스를 줄여서 잘 분배하기 위해 만들어졌다.
만드는 비용이 비쌀 때 설계된 도구들이다. 지금은 싸졌다.
→ 다 잊어야 한다.
오해하지 마세요 — 이 도구들이 틀렸다는 게 아닙니다. 그 도구들이 풀려던 문제(리소스 부족)가 지금 여러분 앞엔 없다는 얘기예요. 전제가 사라진 도구는 결론도 바꿉니다.
| 코드 | 169,553 LOC |
| 개발자 참여 | 1박 2일 · 2명 |
| API 비용 | $0.55 (커피값) |
| 사람 개입 | 0회 |
커피 한 잔 값으로 17만 줄. Lean Canvas로 기능을 깎아낼 이유가 없다.
기획의 본질은
"한 번에 더 많이 생산할 수 있다고 가정하고,
더 본질에 다가가는 것"
본질 = 고객이 무엇을 원하는지 알아내는 것, 그 자체.
| 축 | 과거의 기획 (리소스 분배) | 새 기획 (본질 탐색) |
|---|---|---|
| 시작점 | "개발팀이 할 수 있는 게 뭐지?" | "고객이 원하는 게 뭐지?" |
| 스콥 결정 | 만들 수 있는 것 중 우선순위 (ICE/RICE) | 문제를 끝까지 푸는 것 (기능 수 상관없음) |
| 병목 대응 | 기능 축소 · 스콥 삭감 | 더 많이 만들고 · 더 많이 실험 |
| PO의 일 | 요구사항 문서 · 교통정리 | 고객과 대화 · 직접 프로토타이핑 |
| KPI | 릴리즈 건수 · 로드맵 이행률 | 고객과 몇 번 대화했는가 · 문제가 진짜 풀렸는가 |
| 대화 상대 | 본인 (룸메이트 청소 분쟁) |
| 대화 방식 | AI Socratic 인터뷰 133 라운드 |
| 끝낸 시점 | Ambiguity 0.05 이하 |
| 그 뒤에야 | 169K LOC 생성 · 사람 개입 0 |
133 라운드가 길어 보이지만, 고객(본인)과의 대화였습니다. 기획의 본질을 가장 많이 한 팀이 이겼어요.
| 단계 | 과거 방식 (리소스 제약 시대) | 새 방식 (리소스가 거의 무한한 시대) |
|---|---|---|
| ① 출발 | 고객 인터뷰 → 요구사항 리스트 | 고객 관찰 → 진짜 문제 도출 |
| ② 필터 | 개발 리소스 확인 → 할 수 있는 것만 남김 | 리소스 고민 건너뜀 → 해결의 최단 경로 설계 |
| ③ 설계 | MVP 스콥 축소 (MoSCoW) | 문제를 끝까지 푸는 해결책 설계 |
| ④ 검증 | 개발 후 2–4주 뒤 출시 | AI로 프로토타입 → 며칠 안에 고객에게 |
| ⑤ 개발자 설득 | 어려웠다 (비용이 크니까) | 쉬워졌다 — 프로토타입 보여주고 "이거 제품화" |
여러분이 실제로 제출할 템플릿. 각 섹션은 "리소스 분배"가 아니라 "고객 본질 발견" 관점으로 작성합니다.
| 섹션 | 본질 탐색 질문 | Do ✓ | Don't ✗ |
|---|---|---|---|
| ① 문제 정의 및 프로젝트 개요 한 줄 정의·선정 배경·대상·핵심 가치 |
"고객이 진짜 원하는 건?" "내가 직접 본 불편인가?" |
실제 사용자 이름 + 관찰한 장면 묘사 "룸메이트 현수와 청소 분쟁이 주 3회" |
"모든 사용자의 생산성" "MZ세대를 위한..." |
| ② 사용자 · Agent 설계 페르소나·역할·자율성 범위 |
"그 사람과 몇 번 대화했나?" "에이전트는 어디까지 결정하는가?" |
실제 사람 기반 페르소나 자율성 범위 명시 ("정보 수집까지", "실행까지") |
MECE 페르소나 표 "적절히 판단한다" |
| ③ 핵심 기능 · 사용자 흐름 시나리오·기능·워크플로우 |
"고객 문제의 핵심을 직접 치는가?" "기능 수는 줄여도 문제는 끝까지 푸는가?" |
문제 → 해결의 최단 경로 1개 "이거만 되면 문제 끝" |
기능 10개 나열 (나머지는 "추후") 리소스 제약으로 스콥 축소 |
| ④ 기술 구현 설계 스택·아키텍처·프롬프트·메모리·예외 |
"오늘 중 프로토타입 가능한가?" "대화 사이클에 맞는 속도인가?" |
최단 프로토타입 가능한 스택 공통 AGENTS.md에 정리 |
"최적화" 먼저 고민 "MSA로 확장성..." |
| ⑤ 성과 평가 · 실행 계획 KPI·MVP·로드맵·기대효과 |
"고객이 '됐다'라고 말할 수 있는가?" "대화 횟수는 어떻게 추적하는가?" |
고객 언어로 된 성공 지표 "주 1회 고객 미팅" KPI로 |
코드 커버리지 95% "DAU 10% 상승" (근거 없이) |
공통 하네스 · 공통 스킬
| 원인 1 | 각자의 에이전트는 "합리적인" 기본값을 각자 고른다. 합리적 × 5 = 비일관 |
| 원인 2 | 코드가 빨리 나오니 합의를 생략한 채 달리기 시작 |
| 원인 3 | 맞춰야 할 분량이 예전보다 수십 배 많다 (같은 시간에 수만 줄) |
| 도구 | 파일명 | 읽는 시점 |
|---|---|---|
| Claude Code | CLAUDE.md | 매 세션 자동 |
| OpenAI Codex | AGENTS.md | 매 세션 자동 |
| OpenClaw | SOUL.md | 매 세션 자동 |
| Cursor | .cursorrules | 매 세션 자동 |
이름만 다를 뿐 같은 패턴. 마크다운에 쓴 규칙을 에이전트가 세션마다 로드.
처음부터 다 만들 필요 없습니다. 검증된 하네스 위에 여러분의 Skills만 얹으세요.
| 레포 | deep-thought · 1개 |
| CLAUDE.md | 159개 |
| 스킬 | 38개 |
| 6개월 커밋 | 265개 |
실제 운영 중인 스킬: /morning-briefing · /weekly-sync · /compound · /ralphthon-ops
| # | 결정 사항 | 구체적으로 정할 것 | 안 정하면 벌어지는 일 |
|---|---|---|---|
| 01 | Service Spec 1페이지 60분 할애 |
· 실제 사용자 이름 1명 · 대체재 · 10배 나은 1가지 · Unknown-Unknown 3개 이상 · Validation Plan 체크리스트 |
3주 중반에 "근데 우리 뭐 만드는 거지?" 상황 팀원마다 다른 서비스를 머리에 그림 |
| 02 | 공통 AGENTS.md 60분 할애 |
· Stack (FE · BE · DB · 패키지 매니저) · 컨벤션 (네이밍 · 파일 구조) · Validation Gate (lint/test 통과) · 어떤 하네스 위에서 시작할지 (Slide 19 목록) |
3주 마감 2일 전 수동 merge에 하루 소모 "차라리 한 명이 다시 쓰자" 결론 |
| 03 | 역할 분담 60분 할애 |
· 기획 리드 1명 · 에이전트 운영 1–2명 · 검증 1명 (Validation Plan 책임) · 데모 1명 (발표·영상) · 문서 1명 (README · memory/) |
전원이 코딩만 하다 데모 당일 영상 없음 문서가 없어 심사위원이 뭘 본지 모름 |
이 세 개 정하는 데 3시간. 안 정하면 3주가 갑니다.
코드 줄 수가 아니라, 이 질문에
한 문장으로 답할 수 있는 팀이 이깁니다.
"중요한 건 장소가 아니라 문제의 크기입니다.
저는 아직 제 문제의 크기를 모릅니다. 그걸 알아내러 왔습니다."
— SF 체류 기록 중 · 2026.03
Q & A
3주 프로젝트 관련 구체적인 질문 환영합니다.
스펙 깎는 방법 · 팀 합의 · 검증 설계 — 구체적일수록 좋습니다.