“6개월 안에 없어질 것을 오늘 빌드해서 내일 deploy하는 것은 어마어마하게 큰 의미가 있다”
분위기 ·Noam의 "harness 만들지 마라"를 정면으로 반박하면서, 현장 개발자 입장에서 단호하게 보완해주는 톤
→ EP. 58컨텍스트 엔지니어링은 '목발'이다? Noam Brown 팟캐스트 읽어보기25.06.29“6개월 안에 없어질 것을 오늘 빌드해서 내일 deploy하는 것은 어마어마하게 큰 의미가 있다”
Claude Pro, ChatGPT Plus 같은 걸 쓰고 있다면 — 짧게 자주 쓸수록 GPU 배치에 같이 태워지기 쉬워서 회사 입장에선 처리 비용이 낮아. 근데 너한테도 유리해. 맥락을 매번 새로 시작하면 cache 재활용이 안 되지만, 연속으로 작업하면 cache hit가 돼서 응답이 빠르거든. **같은 주제 작업은 한 세션에 몰아서** 해봐.
긴 자료를 AI에게 줄 때, 자료 붙여넣기(prefill)는 한 번만 하고 여러 질문을 이어서 하는 게 훨씬 효율적이야. 매번 새 대화에서 같은 자료를 다시 붙여넣으면 prefill 비용이 반복되거든. "이 기획서 보고 → 1안 짜줘 → 2안 짜줘 → 제목 다듬어줘" 식으로 **한 대화에서 이어가는 게 더 빠르고 싸**.