EP 50. 마인크래프트로 배우는 AI 에이전트 코딩

🗺️ 이 영상의 위치

시간순: 전체 115편 중 60번째 · 2025-05-03
시기 배경: 2025상 (AI 에이전트 실전 코딩 러시 / 마인크래프트로 멀티에이전트 협업 실험 붐)
난이도: ⭐⭐⭐ (어려운 개념 10개)
⬅️ 앞 영상: EP 49. openAI O3 출시 그리고 구글의 역습
➡️ 다음 영상: EP 51. AI Agent 개발의 어려운 점, Browser Use 를 중심으로
- 연결 이유: 이번 화에서 브라우저를 AI가 조작하는 실험을 살짝 언급했는데, 다음 화에서 그 Browser Use를 본격적으로 파고듦

⚡ 5분 요약

한 줄

마인크래프트에서 Claude랑 Gemini를 동시에 굴려봤더니 — AI 에이전트가 얼마나 강력하고, 동시에 얼마나 아직 삐걱대는지 한눈에 보였어.

핵심 3개

1) AI 두 명이 마인크래프트에 들어오면 생기는 일 최승준이 Claude(MCP 방식)랑 Gemini(MINDcraft 방식)를 동시에 마인크래프트 서버에 접속시켰어. 그런데 둘이 서로를 몰라. Gemini가 수족관을 부수는데 Claude는 거기에 물을 쏟아붓는 상황이 벌어짐. 서로 소통이 안 되는 두 인플루언서가 같은 스튜디오에서 동시에 촬영하다가 장비 충돌하는 꼴이야.

2) 에이전트를 만드는 게 왜 이렇게 힘드냐면 AI한테 "이럴 땐 A 해, 저럴 땐 B 해"라고 지시했는데 멋대로 C를 하거나 아예 안 하거나야. 이 애매한 행동을 잡아주는 잡일에 개발 시간의 대부분을 써. 지금은 꼼수 코드를 잔뜩 끼워 넣어야 겨우 작동하는데, 6개월 뒤에 AI가 알아서 하면 그 코드는 다 쓸모없어짐. 노정석 왈: "닥치고 뛰는 수밖에."

3) 자동형 과로 — AI가 일을 줄여줄 것 같지만 오히려 더 바빠짐 AI 덕분에 1시간에 5개 일을 할 수 있게 됐는데, 그러니까 5개를 다 시키잖아. 혼자인데 팀장이 돼서 AI 팀원 여럿을 동시에 관리하는 느낌. 최승준 표현: "예전엔 한 개 만들까 말까 했는데 이제 5개 해야 한다는 압박."

가장 인상적인 한 마디

"핵심은 소프트웨어에 대한 백과사전적 지식을 갖췄지만 과도한 자신감으로 허풍을 떨며 좋은 코드에 대한 안목이 거의 없는 새로운 junior intern 신동에게 단단한 목줄을 채우는 것입니다."

한나야, 이게 무슨 말이냐면 — AI는 뭐든 할 수 있다고 자신하는데 결과물이 엉터리일 때가 많아. 그러니까 네가 보스로서 범위를 딱 잡아주고 단계별로 확인하면서 써야 한다는 거야. 방치하면 산으로 감.

한나가 지금 당장 시도해볼 것

ChatGPT나 Claude한테 콘텐츠 기획 하나를 맡길 때, 한 번에 다 시키지 말고 "이번엔 제목 10개만 써줘 → 확인 → 그중 1개로 스크립트 초안만 써줘" 이렇게 단계를 쪼개봐. 앤드레이 카르파시가 말한 '목줄 채우기'가 바로 이 방식이거든. 한 번에 몰아붙이는 것보다 결과물이 훨씬 좋아지는 걸 바로 느낄 수 있어.

📖 시간대별 영상 흐름 (15분 정도 걸려, 시간 있을 때만)

0~12분: 마인크래프트에 AI를 집어넣어 봤더니

최승준이 화면을 켜자마자 마인크래프트 영상을 틀어. 분위기가 딱 "유튜브 실험 채널"처럼 들떠 있는데, 내용은 꽤 진지해. MINDcraft라는 오픈소스 프레임워크에 Gemini를 연결해서 "근사한 집 지어줘"라고 명령했더니, 오른쪽 터미널 창에 코드가 줄줄 생성되면서 블록이 하나씩 쌓이기 시작해. "이리 와"라고 하니까 AI 캐릭터가 걸어오는 장면도 보여줬고.

근데 재미있는 건, 이게 단순히 명령어를 실행하는 게 아니라는 거야. Gemini가 집을 짓고 나서 "마구간도 옆에 만들어줘"라고 하면, 이미 지어놓은 집이 어디 있는지 스스로 기억을 꺼내서 그 옆 공간을 계산해야 해. 마치 크리에이터가 이전 콘텐츠 스타일을 기억해두고 다음 콘텐츠에 톤을 맞추는 것처럼. 근데 주변 환경 정보를 다 불러오면 용량이 터지니까 "어떻게 요약해서 가져올 것인가"가 진짜 과제라고 최승준이 짚어.

12~25분: Claude랑 Gemini가 같은 세계에서 충돌하다

여기서 영상이 제일 웃기고 동시에 뼈아파. Claude는 MCP 방식, Gemini는 MINDcraft 방식으로 각자 같은 마인크래프트 서버에 들어왔어. 근데 둘은 서로를 인식 못 해.

최승준이 뭘 시켰냐면 — Claude한테는 수족관을, Gemini한테는 기린 동상을 만들라고 했는데. Gemini가 기린 동상을 짓다가 Claude가 만들어놓은 수족관 벽을 날려버렸어. Claude는 그걸 모르고 열심히 물을 채움. 당연히 물이 새어나오지. 노정석이 "그렇죠, 걸 볼 수 있죠" 하면서 웃는데, 웃음 뒤에 "이게 지금 에이전트 협업의 현실이구나"라는 공기가 깔려 있어.

그러면서 두 사람이 진짜 핵심을 꺼내: 에이전트끼리 공유되는 컨텍스트(=맥락)가 없으면, 같은 공간에 있어도 협업이 아니라 방해야. 연결고리를 만들어주는 게 지금 가장 필요한 작업이라는 것.

25~38분: 에이전트 코딩의 진짜 고통 — "화딱지 많이 나요"

노정석이 솔직하게 털어놔. 표정이 진지해지면서 말하는데, 에이전트 프레임워크(Pydantic AI, OpenAI Agent SDK 같은 것들)로 뭔가 만들 때 가장 시간을 많이 쓰는 게 뭔지 아냐고. AI가 "이럴 땐 이렇게 해" 지시를 받아도 엉뚱한 타이밍에 딴 행동을 해버리는 것, 그 애매함을 잡는 데 개발 시간이 쏠린다는 거야.

그리고 가장 씁쓸한 얘기도 나와. "이 노가다를 6개월, 1년 뒤에 AI가 다 알아서 하면 지금 쓴 시간이 아까워서 어쩌나"라고. 근데 최승준이 받아치길, "2년 전에 function calling(=AI가 특정 기능을 골라 실행하는 것)도 처음엔 안 됐잖아요. 지금은 잘 되잖아요. 그때 해봤던 사람이 지금 잘 쓰는 거죠." 노정석이 "그래, 닥치고 뛰는 수밖에"라고 정리.

38~50분: MVK, ARIA, 리모트 MCP — 요즘 개발자가 배우는 것들

여기서 최승준이 요즘 공부하는 것들을 쭉 꺼내. 좀 빠르게 지나가는 파트인데 핵심만 추리면 세 가지야.

첫째, MVK(Minimum Viable Knowledge) — MVP(최소 기능 제품)처럼, 최소한으로 알아야 할 지식이 뭔지를 먼저 파악하라는 개념. 에단 몰릭이 쓴 용어인데, 바이브 코딩(=일단 AI 시켜서 대충 만들어보기)을 할 때도 시스템을 평가할 눈은 있어야 한다는 거야.

둘째, ARIA — 시각 장애인도 웹을 쓸 수 있게 만드는 접근성 기술인데, 알고 보니 AI가 웹 페이지를 이해할 때도 이게 제일 효율적이야. 페이지의 모든 코드(DOM)를 AI한테 주면 너무 길어서 터지거든. 핵심 의미 정보만 뽑아주는 게 ARIA 방식이야. "장애인 배려 기술이 AI 활용 기술이 됐다"는 최승준의 코멘트가 인상적이었어.

셋째, 리모트 MCP — Claude에 Slack이나 Jira 같은 외부 서비스를 USB-C처럼 그냥 꽂아서 쓰게 해주는 새로운 연결 방식. 최승준 왈: "저도 꼼꼼히 못 봤어요, 오류 있으면 댓글로"라고 솔직하게 인정하면서 넘어감.

50~63분: 자동형 과로, 그리고 마인크래프트 라이브 시연

앤드레이 카르파시가 쓴 'AI 지원 코딩' 글 얘기를 하다가, 최승준이 "자동형 과로"라는 신조어를 꺼내. AI로 일이 빨라졌으니까 더 많이 시키는 거잖아. 예전에 혼자 1개 만들던 게 이제 5개 만들어야 한다는 압박으로 바뀐 거야. 각자가 AI 팀원을 거느린 팀장이 되는 건데, 팀장이 되면 책임도 더 커지잖아.

노정석도 여기서 한 발짝 뒤로 빼서 큰 그림을 봐. "이거 받아들이기로 한 사람이랑 안 한 사람이 이제 갈리고 있는 것 같아. 산업혁명 때 부르주아가 새로 생겼던 것처럼 '테크 부르주아'가 생기는 거 아니겠냐"고.

마지막엔 실제로 마인크래프트를 켜서 라이브로 해봐. Claude한테 "cozy한 집 지어줘"라고 했더니 AI가 광물 찾으러 혼자 멀리 떠나버려. 최승준이 약간 황당한 표정으로 "creative 모드라 스스로 자원 줄 수 있어"라고 다시 지시해. Gemini도 따로 명령해야 하는데, 두 AI를 동시에 관리하면서 최승준이 "생각보다 내가 동시에 못 다루겠더라"라고 털어놓는 장면이 이 화의 정직한 결론이야.

💡 한나 버전 사전

"MINDcraft"가 뭐야?

전문가 설명: 마인크래프트 안에서 여러 AI 에이전트가 협업할 수 있게 해주는 오픈소스 연구 프레임워크. 각 에이전트가 메모리를 가지고 서로 소통할 수 있어.
한나 버전: 인스타 협업 콘텐츠를 만들 때 두 크리에이터가 같은 방향으로 일할 수 있게 해주는 공유 기획 문서 같은 거야. 이게 없으면 각자 딴 얘기함.

"MCP (Model Context Protocol)"가 뭐야?

전문가 설명: AI 모델이 외부 도구나 서비스(캘린더, Slack, 파일 시스템 등)를 표준화된 방식으로 연결해서 사용할 수 있게 해주는 통신 규약. Anthropic이 만들었고 이제 업계 표준처럼 퍼지는 중.
한나 버전: 스마트폰의 USB-C 포트야. 규격이 통일되면 어떤 충전기든 꽂을 수 있잖아. MCP가 있으면 AI에 어떤 서비스든 그냥 꽂아서 쓸 수 있어.

"멀티에이전트 (Multi-Agent)"가 뭐야?

전문가 설명: AI 한 명이 아니라 여러 AI가 각자 역할을 맡아 동시에 일하는 구조. 서로 소통하거나, 각자 따로 돌기도 해.
한나 버전: 유튜브 채널 운영할 때 편집 담당, 썸네일 담당, 댓글 담당을 따로 두는 것처럼, AI도 역할별로 쪼개서 굴리는 거야. 근데 담당자들끼리 소통이 안 되면 서로 겹치고 충돌해.

"컨텍스트 (Context)"가 뭐야?

전문가 설명: AI가 대화하거나 작업할 때 참고하는 배경 정보 전체. 길이에 제한이 있어서 너무 많은 정보를 넣으면 터지거나 앞 내용을 잊어버려.
한나 버전: AI의 단기 기억이야. 대화창에 올라와 있는 내용이 많을수록 AI가 더 잘 기억하지만, 창이 꽉 차면 오래된 내용부터 까먹어. 마치 화이트보드 꽉 찼을 때 지워야 하는 것처럼.

"바이브 코딩 (Vibe Coding)"이 뭐야?

전문가 설명: 코딩 지식 없이 AI한테 "이런 거 만들어줘"라고 말로 시켜서 프로그램을 만드는 방식. 앤드레이 카르파시가 처음 쓴 용어.
한나 버전: 영상 편집할 때 편집 기술 없이 "이 부분 자르고 자막 넣어줘"라고 편집자한테 말로만 시키는 것과 비슷해. 빠르게 결과가 나오는데, 퀄리티 조정은 결국 네가 눈으로 봐야 해.

"MVK (Minimum Viable Knowledge)"가 뭐야?

전문가 설명: MVP(최소 기능 제품)에서 따온 개념으로, 어떤 작업을 시작하기 위해 최소한으로 갖춰야 할 지식의 범위. 에단 몰릭이 AI 시대 학습법으로 소개.
한나 버전: 유튜브 시작할 때 촬영·편집·업로드 방법 이 세 가지만 알면 일단 시작할 수 있잖아. 조명 이론이나 색보정 전문 지식은 나중에 배워도 돼. 그 '일단 시작하기 위한 최소 세트'가 MVK야.

"ARIA (Accessible Rich Internet Applications)"가 뭐야?

전문가 설명: 시각 장애인 등이 웹사이트를 스크린 리더로 이용할 수 있도록 페이지의 의미 구조를 표준화한 기술. 스타일 정보 제외하고 핵심 정보만 담겨 있어.
한나 버전: 인스타 게시물에 ALT 텍스트 다는 거 있잖아. 이미지 못 보는 사람한테 "이건 강아지 사진이에요"라고 설명해주는 것. 근데 이게 AI한테도 딱 필요한 방식이야. 쓸데없는 꾸밈 빼고 핵심만 전달하니까.

"CDP (Chrome DevTools Protocol)"가 뭐야?

전문가 설명: 크롬 브라우저 내부를 코드로 제어할 수 있는 통신 프로토콜. 버튼 클릭, 페이지 정보 수집 등을 자동화할 때 써.
한나 버전: 크롬 브라우저의 리모컨 코드야. 이걸 AI한테 주면 AI가 직접 브라우저를 켜고 검색하고 클릭하는 걸 할 수 있어. 사람이 마우스로 하는 걸 AI가 대신하는 거.

"시스템 3 (System 3)"가 뭐야?

전문가 설명: 심리학의 시스템1(빠른 직관)·시스템2(느린 논리) 개념을 AI에 확장한 것. 시스템3는 비동기적으로 오래 생각하다가 나중에 갑자기 인사이트를 내놓는 방식 — AI가 바로 답하지 않고 백그라운드에서 작업하다가 결과를 알려주는 형태.
한나 버전: 샤워하다가 갑자기 콘텐츠 아이디어가 떠오르는 그 느낌. AI도 "지금 당장 답 줘"가 아니라 좀 생각하다가 "이런 인사이트 나왔어요" 알림 주는 방식이 될 수도 있다는 거야.

"function calling"이 뭐야?

전문가 설명: AI가 대화 중에 스스로 판단해서 특정 기능(날씨 검색, 파일 열기 등)을 골라 실행하는 능력. 처음 나왔을 때는 불안정했지만 지금은 잘 작동해.
한나 버전: 매니저한테 "오늘 일정 체크해줘"라고 했을 때, 매니저가 스스로 캘린더 앱을 열어서 확인하는 것처럼 — AI가 필요한 도구를 알아서 꺼내 쓰는 능력이야.

🔥 노정석 어록 모음

"어제 단톡방에서 오고 갔던 대화가 생각납니다. 그냥 지금은 닥치고 뛰는 수밖에 없다."

분위기: 쓴웃음을 참으면서, 그래도 결론은 이거다 하는 체념 반 확신 반의 톤.

한나 풀이: 지금 에이전트 코딩은 불완전하고 노가다가 많아. 6개월 뒤에 다 필요 없어질 수도 있어. 근데 지금 안 하면 그때 가서도 모르는 거야. 콘텐츠도 똑같잖아 — 알고리즘이 바뀔 거 알면서도 지금 올려야 하는 것처럼.

"한 6개월, 1년 지나서 다 쓸데없는 짓 되면 이 쓴 시간들은 아까워서 어쩌나..."

분위기: 반쯤 진지하고 반쯤 농담처럼 말하는데, 현업 개발자의 진짜 딜레마가 그대로 녹아 있어.

한나 풀이: AI 시대에 공통된 불안이야. 지금 배운 이 툴이 내년에 사라지면? 근데 노정석이 결론 내린 거, 그때 것들을 다 해봐야 다음 것도 더 빨리 잡는다는 거야. 써봤던 사람이 바뀐 것도 금방 파악해.

"새로운 어떤 계층, 테크 부르주아, 예전에는 산업혁명 시대의 부르주아처럼 그런 계층들이 생겨나고 또 뒤처진 계층은 뒤처진 계층대로 또 다음 살길을 찾고 반복되는 것 같아요."

분위기: 조용하고 차분한데, 듣다 보면 묵직하게 꽂히는 톤. 흥분 없이 담담하게 역사적 패턴으로 얘기해.

한나 풀이: 산업혁명 때 기계를 먼저 쓴 사람이 공장주가 됐잖아. 지금 AI를 적극적으로 쓰는 사람이 새로운 그 자리를 차지하는 흐름이 이미 시작됐다는 거야. 한나 입장에서는 — 크리에이터 중에도 AI 먼저 쓰는 사람이랑 안 쓰는 사람 사이에 격차가 이미 벌어지고 있거든.

🎬 한나 적용 포인트

1) AI 팀원 두 명 동시에 굴리기 실험해봐 인스타 캡션 쓰는 AI랑 해시태그 뽑는 AI를 따로 써봐. 근데 이번 화의 교훈처럼 — 얘들한테 서로의 결과물을 공유해줘야 해. "A가 쓴 캡션을 보고 거기에 어울리는 해시태그 뽑아줘" 이런 식으로. 공유 없으면 마인크래프트 수족관처럼 서로 방해함.

2) "자동형 과로" 체크리스트 만들어봐 AI 쓰고 나서 일이 줄었어, 늘었어? 솔직하게 적어봐. 최승준 말처럼 빠른 만큼 더 많이 시키게 되거든. 주간 단위로 AI한테 맡긴 일 목록이랑 내가 직접 한 일 목록 비교해봐. 어디서 시간이 새는지 보여.

3) 새 기능 배울 때 MVK부터 정해봐 새 플랫폼이나 도구 쓸 때 "이것만 알면 일단 시작 가능한 세 가지"를 먼저 AI한테 물어봐. "틱톡 숍 처음 시작하려는 인플루언서가 반드시 알아야 할 최소 지식 3가지 알려줘" 이런 식으로. 전부 다 공부하려다 지쳐서 시작도 못 하는 것보다 훨씬 나아.

🏷️ 태그

시기: #2025상
주제: #AI에이전트 #멀티에이전트 #코딩실험 #자동화한계
인물: #앤드레이 카르파시 #에단몰릭
자유: #마인크래프트실험 #자동형과로 #MVK