← 메인으로
EP. 82·26.01.18·⭐⭐⭐·50분 38초

원리를 생각하는 프롬프팅

AI한테 좋은 걸 뽑으려면 "전문가 말투 흉내"가 아니라 그 분야의 진짜 단어들을 앞에 깔아줘야 해 — 그 이유가 트랜스포머의 작동 원리에 있어.

▶ 유튜브에서 원본 보기← 앞: EP 81. DeepSeek이 바꿔버린 모든 것: MoE와 RLVR, 2025년 AI 회고→ 다음: EP 83. 이야기로 읽는 트랜스포머: 윤회하는 토큰의 순례

EP 82. 원리를 생각하는 프롬프팅

🗺️ 이 영상의 위치

⚡ 5분 요약

한 줄

AI한테 좋은 걸 뽑으려면 "전문가 말투 흉내"가 아니라 그 분야의 진짜 단어들을 앞에 깔아줘야 해 — 그 이유가 트랜스포머의 작동 원리에 있어.

핵심 3개

1) 프롬프트 앞에 "전문가 단어" 깔기가 진짜로 성능을 바꿔 "전문가처럼 답해줘"라고 페르소나만 주는 것과, 그 분야 실제 용어·이름·논문 키워드를 앞에 박아주는 것은 결과가 완전히 달라. 마치 유튜브 알고리즘이 제목·해시태그에 반응하듯, 모델은 입력된 토큰 분포에 반응해. 도메인 단어가 들어오면 그쪽 공간이 '불이 켜지는' 거야.

2) 모르는 분야 단어도 "가져다 붙이기"만 해도 효과 있어 내가 이해 못 해도 돼. arXiv 논문 초록, 전문가 이름 목록, 무작위 알파벳 두문자어 같은 걸 넣어주면 모델이 연상 능력을 발휘해서 훨씬 깊은 답을 뱉어. 최승준 표현으로 "의미 있는 토큰을 채운다"는 거야.

3) 이 모든 게 가능한 이유 → 다음 편에서 트랜스포머 해부 예고 왜 특정 단어가 들어가야 능력이 켜지냐? 그건 트랜스포머의 어텐션·MoE 구조 때문이야. 이번 편은 그 질문을 세팅한 편이고, 다음 편이 본론이야.

가장 인상적인 한 마디

"지난 30일 동안만이라도 따라가지 않은 사람들은 이 주제에 대해 이미 deprecated된 세계관을 가지고 있는 거다."

한나야, 이게 무슨 말이냐면 — Andrej Karpathy(AI계의 레전드급 개발자)가 한 말인데, "한 달만 안 봐도 이미 구식 뇌가 된다"는 거야. AI 속도가 그만큼 빠르다는 경고.

한나가 지금 당장 시도해볼 것

다음에 AI한테 콘텐츠 기획 물어볼 때, 그냥 "좋은 콘텐츠 만들어줘" 대신 — 네가 참고하는 유명 크리에이터 이름 3~5명, 그 사람들이 자주 쓰는 업계 용어(예: "후킹", "롱폼", "세계관", "팬덤 참여율"), 최근 잘 된 콘텐츠 제목 2개를 프롬프트 앞에 쭉 나열해봐. 같은 질문인데 답이 완전히 달라질 거야.

📖 시간대별 영상 흐름 (15분 정도 걸려, 시간 있을 때만)

0~10분: 2026년 첫 녹화, 요즘 AI 판 근황 정리

노정석이 "2026년 딱 일주일 됐네요"라며 가볍게 운을 떼는데, 분위기는 생각보다 여유로워. 최승준도 "12월 중순보다 훨씬 견딜 만해서 다행"이라고 안도하는 말투야. 12월에 잠깐 조용하다가 새해 들어서 Claude Code, OpenCode 같은 코딩 툴 관련 생산성 얘기가 커뮤니티를 뒤덮기 시작했다는 근황.

그러다가 METR 50%-time horizon 그래프 얘기가 나와. 쉽게 말하면 "AI가 혼자서 몇 시간짜리 작업을 해낼 수 있냐"를 측정하는 그래프인데, Claude Opus 4.5가 거의 5시간 가까이로 크게 뛰었대. 이게 Andrej Karpathy(테슬라 AI 출신, AI 유튜버로도 유명한 레전드 개발자)가 "한 달 안 따라가면 deprecated된 세계관"이라는 자극적인 말을 남긴 배경이야. Boris Cherny(Claude Code 만든 사람), Igor(xAI 창립 멤버) 이 셋이 트위터에서 티키타카하면서 "뭔가 딸깍 바뀐 것 같다"는 분위기를 만들었던 거야.

10~20분: 스타크래프트처럼 AI 10개 돌리는 시대

노정석이 씩 웃으면서 "요즘 저희 엔지니어들도 타스크를 7~8시간씩 돌린다"고 해. 최승준이 받아서 "Boris는 Claude 탭을 10개씩 띄워 놓는대요. 스타크래프트에서 마린 뿌리는 느낌인가요?"라고 하니까 노정석이 "마우스랑 키보드를 현란하게 왔다 갔다 하는 수준"이라고 빵 터지게 받아치는 장면이 있어.

Ethan Mollick이라는 교수가 "개발자 아닌 사람도 Claude Code 쓸 수 있다"는 글을 썼고, 핵심 결론이 "코딩 도구인 척하는 이거, 사실 모든 지식 작업에 쓸 수 있다. 속지 마라"였다는 것도 소개돼. Claude Code 버전이 하루에도 몇 번씩 올라가는 걸 보면서 최승준이 "이게 인간만 해서 되는 일이 아니잖아요. Claude가 Claude Code를 만들고 있는 거니까"라고 살짝 무섭다는 듯이 얘기해.

20~32분: "스킬"이 뭐야? — 프롬프트 패키지의 등장

최승준이 오늘 진짜 하고 싶었던 얘기를 꺼내기 시작해. Claude의 "스킬(Skill)" 시스템인데, 쉽게 말하면 프롬프트·코드·예시를 하나의 폴더로 묶어서 재활용 가능하게 만든 패키지야. 노정석이 "마크다운 설명 덩어리 + 코드 + 예제가 묶인 폴더 구조"라고 정리해줘.

최승준이 연말에 이 스킬 Github 문서를 꼼꼼하게 읽었대. 그러다가 재밌는 실험을 했는데, 무작위 알파벳 4개 조합 100세트를 만들고 그걸 두문자어(앞 글자만 따서 읽기)로 읽어보라는 거야. 예를 들어 "YUST"를 "Your Understanding of Self is Temporary"로 읽는 것. 이걸 파레이돌리아(구름에서 얼굴 보는 인간 능력)에 비유하는데, 모델도 그런 연상 능력이 있으니까 엉뚱한 알파벳 조합도 의미 있는 토큰으로 읽어내서 대화의 새로운 가지를 열어준다는 거야. 그 실험을 하다가 "스킬 크리에이터" 기능이 자동으로 그걸 스킬로 만들어 줬다고 — 최승준이 "대화 부산물이 제품으로 포장되는 느낌"이라며 꽤 감탄하는 말투였어.

32~42분: 핵심 주장 — "적확한 토큰"이 공간을 열어

여기서 오늘의 진짜 핵심이 나와. 최승준이 RPG 게임 미니맵 비유를 써: "특정 지역에 가야만 그 근방 지도가 밝아지잖아요. 모델도 그 근방 용어가 들어와야 그 공간이 열려요."

노정석이 받아서 "모델이 이미 거의 모든 걸 알고 있는데, 그쪽 도메인으로 주의를 옮겨주고 트리거를 줘야 그 관련된 일을 잘 할 수 있다"고 정리해. 최승준은 실험도 했대 — "전문가 페르소나를 쓰는 것"과 "그 전문가가 실제로 쓸 법한 단어를 넣는 것"은 응답의 질이 확실히 달라진다고.

그 연장선에서 arXiv(논문 사전 공개 사이트) 실험 얘기도 나와. 내가 이해 못 하는 논문 초록을 10개 가져다 프롬프트 앞에 붙이면, 거기 있는 전문 용어들이 맥락을 채워서 훨씬 깊은 연결고리를 모델이 만들어낸다는 거야. "내가 몰라도 된다. 단어만 가져오면 된다"는 게 핵심.

노정석이 솔직하게 반론도 해 — "근데 내가 모르는 도메인에서 모델이 틀리는 것도 되게 많더라고요. SAP·ERP 문서 보면서 했는데 얘가 내가 원하는 방향으로만 따라와서 오히려 이상하게 꼬이던데요." 최승준이 받아서 "그게 모델이 아첨하는 게 아니라, 우리가 부지불식중에 잘못된 맥락을 넣은 거예요. 토큰 입력의 문제"라고 정리해.

42~51분: 오늘은 예고편 — 다음은 트랜스포머 해부

최승준이 CoT(Chain of Thought, 모델이 생각을 단계별로 쓰는 방식) 얘기를 꺼내. "모델이 CoT를 뱉는 게 내부 연산을 그대로 보여주는 게 아닐 수 있다. 근데 길게 생각하면 성능이 오르는 건, CoT가 진실을 말해서가 아니라 계산을 충분히 하기 때문이다"라는 게 그의 주장이야. 노정석이 "면접에서 말 하면서 속으로 논리 구성하는 거랑 비슷하네요"라고 비유해줘.

그러다가 두 사람이 결론에 이르러 — "왜 특정 토큰이 모델 능력을 여냐"를 제대로 이해하려면 트랜스포머 구조, 특히 어텐션·MoE를 알아야 한다. 2024년에 하다가 뉴스에 치여 중단했던 트랜스포머 탐구를 다시 시작하자. 최승준이 "2월·3월 되면 또 일들이 벌어질 거라 지금밖에 없다"면서 약간 긴장감 있게 마무리해.

💡 한나 버전 사전

"METR 50%-time horizon"이 뭐야?

  • 전문가 설명: AI 에이전트가 주어진 작업을 절반 이상 성공적으로 완수할 수 있는 최대 작업 시간 길이를 측정하는 벤치마크
  • 한나 버전: "AI가 혼자서 몇 시간짜리 프로젝트를 버틸 수 있냐" 측정하는 거야. 예전엔 5분짜리 심부름만 됐는데 이제 5시간짜리 기획 작업도 된다는 거지.

"Claude Code / OpenCode"가 뭐야?

  • 전문가 설명: AI가 코딩 작업을 자율적으로 수행하게 해주는 에이전트 기반 개발 도구
  • 한나 버전: AI한테 "이런 앱 만들어줘"라고 던져놓고 자리 비워도 밤새 혼자 코딩하는 도구야. 한나로 치면 "편집 방향 잡아줄게, 영상 편집은 네가 다 해"라고 AI한테 위임하는 느낌.

"스킬(Skill / Claude Skill)"이 뭐야?

  • 전문가 설명: 특정 작업 수행에 필요한 프롬프트·코드·예시를 마크다운 파일 구조로 묶어 재사용 가능하게 패키지화한 것
  • 한나 버전: 유튜브 업로드할 때 쓰는 체크리스트 템플릿 있잖아. 그거랑 비슷해. "섬네일 기준", "제목 공식", "CTA 위치" 같은 걸 한 파일로 묶어서 AI한테 매번 같은 방식으로 일 시키는 패키지야.

"토큰(Token)"이 뭐야?

  • 전문가 설명: AI가 텍스트를 처리하는 최소 단위. 단어나 단어의 일부분으로 쪼개짐
  • 한나 버전: AI한테 보내는 메시지가 단어들로 쪼개지는데 그 하나하나가 토큰이야. AI는 이 토큰들의 조합에 반응해. 어떤 단어를 넣냐에 따라 AI가 완전히 다른 모드로 켜지는 거지.

"파레이돌리아(Pareidolia)"가 뭐야?

  • 전문가 설명: 무작위적인 패턴(구름, 나무 결 등)에서 얼굴이나 의미 있는 형상을 보는 인간의 심리 현상
  • 한나 버전: 구름 보다가 "어, 강아지 같다!" 하는 거. 최승준이 이걸 모델에 비유한 건 — AI도 엉뚱한 알파벳 조합에서 의미 있는 패턴을 찾아내는 능력이 있다는 거야.

"CoT (Chain of Thought)"가 뭐야?

  • 전문가 설명: AI가 최종 답 전에 풀이 과정을 단계별로 서술하게 하는 프롬프팅 기법 및 그 결과물
  • 한나 버전: AI한테 "답만 줘"가 아니라 "생각 과정 보여줘"라고 하는 거야. 콘텐츠로 치면 "결론만 말해"가 아니라 "기획 회의부터 최종 결정까지 다 설명해줘"인 거지. 이렇게 하면 AI 성능이 올라가.

"MoE (Mixture of Experts)"가 뭐야?

  • 전문가 설명: 모델 내부에 여러 전문가 네트워크를 두고 입력에 따라 적합한 전문가만 선택적으로 활성화하는 구조
  • 한나 버전: 한 팀에 패션 전문가, 뷰티 전문가, 먹방 전문가가 있는데, 패션 질문 오면 패션 전문가만 깨우는 식이야. 다 깨우면 낭비니까 해당 전문가만 활성화하는 거지.

"deprecated"가 뭐야?

  • 전문가 설명: 소프트웨어 용어로, 더 이상 지원되지 않거나 구식이 된 상태
  • 한나 버전: 앱 업데이트하면 예전 기능이 "지원 종료" 뜨잖아. Karpathy가 "한 달 안 본 사람 뇌가 지원 종료 상태"라고 한 거야.

"arXiv"가 뭐야?

  • 전문가 설명: 동료 심사 전에 논문을 자유롭게 공개하는 프리프린트 서버 (물리학·AI 등 이공계 중심)
  • 한나 버전: 논문 유튜브 같은 거야. 심사 통과 전에 미리 공개하는 플랫폼. AI 최신 연구가 여기 매일 수천 편씩 올라와.
🔥 노정석 어록 모음

"이젠 이 Harness가 사실은 새로운 소스 코드가 됐습니다."

분위기: 코딩 이야기 하다가 갑자기 본질을 꿰뚫는 한 마디 툭 던지는 톤

한나 풀이: Harness는 AI한테 일 시키는 방식·구조야. 예전엔 코딩 언어가 소프트웨어를 만들었는데 이제는 AI한테 어떻게 지시하냐가 그 자리를 대체했다는 거야. 한나로 치면 "예전엔 편집 스킬이 핵심이었는데 이제는 AI한테 어떻게 브리핑하냐가 핵심이 됐다"는 말이야.


"진짜 영어가 새로운 programming language네요."

분위기: 최승준이 "자연어로 스킬 만든다" 얘기 하자마자 노정석이 눈 빛나면서 치는 한 마디

한나 풀이: 코딩 몰라도 돼. 말로 AI한테 일 시키는 게 이미 프로그래밍이야. 한나가 인스타 캡션 쓰는 것도 사실 일종의 AI 지시문이 될 수 있다는 거지.


"모델이 나를 도우려면 내가 모델을 도와야 된다는 그런 맞물린 고리가 생기거든요."

분위기: 최승준이 조금 철학적으로, 근데 진지하게 자기 AI 사용 철학을 고백하는 장면

한나 풀이: AI를 잘 쓰려면 AI가 어떻게 작동하는지 알아야 해. 협업이야. 인플루언서가 알고리즘을 이해할수록 더 잘 탈 수 있는 것처럼, AI 원리를 조금만 알면 훨씬 잘 뽑아쓸 수 있다는 거.

🎬 한나 적용 포인트

📌 유명 크리에이터 이름을 프롬프트 앞에 나열해봐 최승준이 "알파벳 글자들로 인물 이름을 연상시키면 그 사람들 관련 전문 용어들이 딸려 나온다"고 했잖아. 한나도 "MrBeast, Emma Chamberlain, Alex Hormozi 식으로 이 3명이 공통으로 쓰는 콘텐츠 전략을 분석해줘" 이렇게 이름을 직접 박아 넣으면 훨씬 날카로운 분석이 나와. "성공한 크리에이터처럼 해줘"보다 훨씬 효과 좋아.

📌 잘 된 콘텐츠 텍스트를 통째로 붙여넣기해 최승준의 arXiv 실험 원리야 — 논문 초록을 모르면서 붙여도 효과가 있듯이, 한나가 벤치마킹하고 싶은 바이럴 영상의 자막이나 잘 된 인스타 캡션 5개를 "이것들의 공통 패턴을 분석하고 내 콘텐츠에 적용해줘" 앞에 그냥 붙여봐. AI가 그 언어 패턴에서 힌트를 뽑아낼 거야.

📌 "피상적이다"를 마법어로 써봐 최승준이 직접 쓰는 단어야. 모델이 너무 뻔한 답 줄 때 "이건 너무 피상적이야, 더 깊이 들어가줘"라고 치면 모델이 다음 단계 깊이의 응답으로 전환해. 콘텐츠 기획할 때 첫 답이 뻔하면 이 한 마디만 쳐봐. 생각보다 효과 꽤 좋거든.

🏷️ 태그