EP.9 META 가 던진 소심한 승부수, LLAMA-2 는 왜 하필 지금 공개됐을까(?)

🗺️ 이 영상의 위치

시간순: 전체 115편 중 9번째 · 2023-07-19
시기 배경: 2023하 (AI 춘추전국시대 개막 / ChatGPT 7개월차, 오픈소스 vs 클로즈드 모델 대격돌 시작)
난이도: ⭐⭐⭐ (어려운 개념 10개)
⬅️ 앞 영상: EP.8 현존최강 AI, GPT-4 의 숨겨진 유출정보 읽어보기
➡️ 다음 영상: EP.10 가난한 자의 ChatGPT(?), TinyStories
- 연결 이유: Llama-2 공개로 오픈소스 모델 생태계가 폭발하면서, 다음 편에서는 더 작고 효율적인 모델(TinyStories)의 가능성을 탐구함

⚡ 5분 요약

한 줄

Meta가 Llama-2를 공개한 건 기술 자랑이 아니라, OpenAI에 맞서는 세력 규합을 위한 정치적 선언이야.

핵심 3개

1) Llama-2 공개는 "기술 쇼"가 아니라 "세력 모으기"였어 Meta는 성능으로 OpenAI를 이기겠다는 게 아니야. 오히려 30B 모델도 빠진 채로 발표했어. 목적은 딱 하나 — OpenAI가 싫은 스타트업들한테 "우리 편 먹자" 손 내민 거야. 인플루언서로 치면, 내 콘텐츠가 1위는 아닌데 라이벌 유튜버 싫어하는 크리에이터들 다 모아서 연합 채널 만드는 느낌이지.

2) AI 시장의 "현실적 sweet spot"이 30~70B 모델로 좁혀지고 있어 GPT-4 같은 초대형 모델은 너무 비싸. 그래서 기업들이 현실적으로 감당 가능한 30~70B 규모 모델로 수렴하고 있어. 완벽하진 않지만 일단 탑승 안 하면 걸어가야 하는 기차야. 지금 탑승이 먼저야.

3) AI가 가장 먼저 바꿀 건 "언어 장벽"이야 — 한나 이건 완전 너 얘기 신정규 대표가 콕 집어서 말했어. 번역, 자막, 현지화(localization)가 AI로 폭발적으로 좋아질 거라고. 한국 콘텐츠가 AI 번역 타고 전 세계로 퍼지는 속도가 급격히 빨라진다는 얘기야.

가장 인상적인 한 마디

"3등석이라도 타지 않으면 걸어가야 된다"

한나야, 이게 무슨 말이냐면 — AI 기술이 완벽하지 않아도 지금 올라타야 한다는 거야. 완벽한 타이밍 기다리다간 그냥 도태돼.

한나가 지금 당장 시도해볼 것

지금 유튜브 영상이나 인스타 캡션 하나 골라서, ChatGPT한테 "이걸 일본어/영어권 감성으로 자막 스크립트 바꿔줘, 캐릭터 말투는 이렇고 타겟은 이런 사람이야"라고 프롬프트 줘봐. 신정규 대표가 말한 "맥락 프롬프트" 번역이 이거야. 생각보다 결과물이 괜찮을 걸?

📖 시간대별 영상 흐름 (15분 정도 걸려, 시간 있을 때만)

0~15분: Llama-2 발표 당일, 신정규 대표가 직접 돌려본 생생 후기

노정석이 "오늘 아침에 전격 발표됐어요!" 하면서 영상을 열어. 흥분이 역력한데, 옆에 최승준은 좀 더 차분하게 "어디 보자…" 분위기. 오늘의 게스트는 신정규 대표 — 노정석이 "저희 팟캐스트의 영원한 히어로"라고 소개할 만큼 자주 나오는 AI 실무 전문가야.

신정규 대표가 말하길, 모델 신청하니까 34분 만에 링크가 왔고, 풀 모델 사이즈가 330GB인데도 엄청 빠르게 받아졌대. 근데 문제가 있어. 모델 라인업이 7B, 13B, 70B인데 30B짜리가 빠져 있어. 실제로 기업들이 서비스에 쓰기 딱 좋은 크기가 3045B인데, 그게 없는 거야. 일부러 뺐을 수도 있고, 아직 준비가 안 됐을 수도 있다는 거지. 신정규 대표는 "준비가 안 됐는데도 지금 발표한 거면, 이 타이밍이 되게 중요한 이유가 있다는 뜻"이라고 날카롭게 짚어.

15~30분: 왜 하필 지금? Meta의 정치적 계산

신정규 대표가 핵심을 꺼내. "이건 기술적 breakthrough가 아니야. 정치적 발표야." 1년 전인 2022년 11월, Meta는 ChatGPT 나오기 딱 한 달 전에 AI팀을 대규모 감원했어. 메타버스 간다고. 그러다 ChatGPT 터지고 나서 저커버그가 LinkedIn에 "AI팀 다시 모을게요" 공고 냈던 거야. 아찔한 타이밍이지.

노정석이 "적의 적은 친구"라고 한마디로 정리해. OpenAI가 혼자 너무 튀니까, OpenAI가 싫은 애들이 Meta 주변으로 모이는 구조야. Meta는 모델을 무료로 풀어서 "우리 편 합시다" 손 내밀고, 그 맹주 포지션을 가져가는 전략이지. 구글이 Android로 iPhone에 맞섰던 것처럼.

여기서 충격적인 뉴스가 하나 터져. 신정규 대표가 "GPU 가장 많이 주문한 회사가 TikTok"이라고 꺼내거든. NVIDIA H100을 10만 대 주문했대. 최승준이 "10만 대?!" 하고 눈이 커지는 게 느껴져. Inflection(AI 스타트업)이 2만 2천 대로 화제였는데, TikTok이 그 다섯 배를 샀다는 거야. 미중 반도체 수출 금지 직전에 당겨 산 거라 더 충격적이고.

30~45분: AI 시장의 지형도 — 누가 어디서 싸울 건가

노정석이 전체 판을 정리하기 시작해. 여유 있게 말하는 것 같지만 사실 굉장히 구조적인 얘기야.

초거대 모델(GPT-4급) 시장은 OpenAI·Google이 먹고, 그 아래 30~~70B 시장은 기업(B2B) 고객 대상으로 치열하게 자리 잡는 중이야. 신정규 대표는 "이 30~~70B sweet spot은 스스로 선택한 게 아니라 강제로 만들어진 거"라고 해. 돈이 없어서, 감당이 안 되서 그 크기에 몰린 거라고. 기차 3등석 비유가 여기서 나와.

신정규 대표가 미래 전망도 제시해. 2년 안에 두 가지 중 하나가 온다 — ① 같은 크기 모델이 더 똑똑해지거나, ② 지금 비싼 큰 모델 돌리는 비용이 지금의 작은 모델 수준으로 싸지거나. 결론은 "기술과 비용은 무조건 좋아진다"야.

45~60분: 한나야, 이건 완전 네 얘기 — 언어 장벽이 무너진다

신정규 대표가 "AI가 가장 먼저, 가장 크게 바꿀 분야"로 콘텐츠 번역·현지화를 꼽아. 봉준호 감독이 수상 소감에서 "1인치 자막의 장벽"을 넘으면 더 넓은 세상이 펼쳐진다고 했잖아. 그 장벽이 AI로 무너지고 있다는 거야.

구체적으로 이런 얘기가 나와. 마블 영화 '토르'를 번역할 때, 영어 원문은 고풍스러운 옛날 말투인데 그냥 한국어로 직역하면 그 느낌이 안 살잖아. 근데 GPT한테 "이 캐릭터는 선비 말투야, 캐릭터 관계도는 이래"라고 프롬프트로 먼저 설명해주면 진짜로 선비 말투 번역이 나온대. 신정규 대표 회사 내부에서 이미 쓰고 있고, 여러 언어를 쓰는 직원들이 AI 번역 덕에 회의 때 말이 훨씬 많아졌다고 해. 두 번째로 혜택 볼 분야로는 영상 편집 툴, 복잡한 소프트웨어들 — "말로 하면 프로그램이 알아서 해주는 시대"가 온다는 거야.

노정석도 "지금은 time gap이 사라졌다"고 거들어. 예전엔 미국에서 뜬 걸 한국에서 따라 하는 비즈니스 모델이 있었는데, 지금은 미국이 뜨면 실시간으로 전 세계가 동기화돼. 시간차 게임이 없어진 거야.

60~75분: GetGPT 데모 & Microsoft의 정체

신정규 대표가 갑자기 재밌는 사이트를 꺼내. GetGPT라는 곳인데, 초등학교 선생님들한테 필수 사이트가 됐대. 학부모 문자 생성기, 생활기록부(세특) 작성 도우미 같은 걸 선생님들이 직접 만들어서 올려놨어. 심지어 시즌에 API 콜이 너무 많이 와서 OpenAI한테 "해킹당한 거 아니냐"고 ban당한 적도 있었대.

노정석이 "학생 이름: 신정규, 오늘 수업 시간에 좀 떠들었어요"를 입력하니까 진짜로 공손한 학부모 문자가 뽑혀나와. 셋이 빵 터짐. 노정석이 정리해 — "사람들이 AI를 쓰는 방식의 80~90%는 이런 거야. 어려운 코딩이나 논문 분석이 아니라."

이어서 Microsoft 얘기가 나와. Microsoft는 자기가 만든 AI 언어모델이 없어. Azure(클라우드)라는 인프라를 갖고, 거기에 OpenAI 모델도, Llama-2도 다 올리게 해주는 "플랫폼 장사"를 하는 거야. 노정석이 비유를 딱 쳐. "청바지 골드러시 때 청바지 파는 사람." GPU 사면 전부 팔리는 시대에 인프라 제공자가 되는 전략이지.

75분~끝: 최승준의 Llama-2 vs GPT-4 직접 대결 테스트

최승준이 직접 테스트한 결과를 보여줘. 논리학 문제("p이면 q이다" 진리표 만들기)를 Llama-2 70B에 시켰는데, 진리표는 만들었지만 역·이·대우 명제 구하기에서 완전히 무너졌어. 같은 걸 GPT-3.5에 시키니까 잘 해냄. 격차가 명확하게 보이는 순간.

최승준이 GPT-4한테는 좀 더 심술궂게 질문해. "뻔한 답 말고 진짜 이유 말해봐"를 반복해서 끌어올리니까 처음에 "학습 데이터" 하던 게 "일반화 능력" "경험을 쌓습니다" "analogy 능력"까지 나와. 자기가 못한다고 했다가, 지적하면 인정하고, 또 끌어올리면 다른 말 해. 최승준이 "이게 GPT-4의 현재 한계이자 능력"이라고 담담하게 정리해.

마지막에 노정석이 "ChatGPT 나온 지 7개월인데 한 달이 1년처럼 지나갔다"고 마무리. 올 연말엔 또 무슨 얘기를 하게 될지 모르겠다며 웃음.

💡 한나 버전 사전

"Llama-2"가 뭐야?

전문가 설명: Meta(페이스북 모회사)가 만든 오픈소스 대형 언어 모델. 누구나 무료로 가져다 쓸 수 있어.
한나 버전: 유튜브가 독점 플랫폼이라면, Llama-2는 영상 파일 자체를 누구한테나 공개해버린 거야. "우리 영상 편집 소스 다 가져가서 써요" 하는 느낌. 플랫폼 의존 없이 자기 채널에 세팅할 수 있는 AI야.

"오픈소스(Open Source)"가 뭐야?

전문가 설명: 소프트웨어의 설계도(코드)를 누구나 볼 수 있고 수정해서 쓸 수 있게 공개한 것.
한나 버전: 레시피 공개형 식당이야. 그냥 음식 파는 게 아니라 "우리 비법 소스 레시피 다 공개할게요, 가져다 써요"라고 하는 거. 반대말은 클로즈드(Closed) — ChatGPT는 레시피 절대 안 알려주는 블랙박스야.

"B(Billion) 파라미터"가 뭐야?

전문가 설명: AI 모델이 학습한 숫자 덩어리의 개수. 많을수록 더 많은 걸 배웠다고 보면 돼. 70B = 700억 개.
한나 버전: 팔로워 수 같은 거야. 팔로워 많을수록 더 많은 사람 반응 봤고 더 똑똑해지는 느낌. 근데 팔로워 많다고 콘텐츠가 무조건 잘 되는 건 아니잖아. 그것처럼 파라미터 많다고 무조건 좋은 AI인 건 아니야.

"Fine-tuning"이 뭐야?

전문가 설명: 이미 학습된 AI 모델에 특정 용도에 맞는 추가 데이터로 재학습시키는 것.
한나 버전: 이미 요리 잘하는 셰프한테 "우리 가게는 한식만 해요"라고 집중 교육시키는 거야. 한나 스타일에 맞게 AI를 커스터마이징하는 과정이지.

"합종연횡"이 뭐야?

전문가 설명: 강한 공통의 적에 맞서기 위해 경쟁 관계에 있던 세력들이 연합하는 전략. 중국 전국시대 용어.
한나 버전: 유튜브 대형 채널 하나가 너무 독보적으로 크면, 중간 규모 채널들이 뭉쳐서 "콜라보 연합" 만드는 거랑 똑같아. 지금 IT판에서 OpenAI가 너무 크니까 나머지가 Meta 주변으로 뭉치는 중이야.

"GPU"가 뭐야?

전문가 설명: AI 학습과 실행에 쓰이는 고성능 반도체 칩. NVIDIA가 거의 독점.
한나 버전: AI판의 스튜디오 장비야. 영상 크리에이터한테 카메라·조명이 필수이듯, AI 회사한테 GPU가 없으면 아무것도 못 해. 지금 전 세계가 이 장비 품귀 대란 중이야.

"on-prem(온프레미스)"이 뭐야?

전문가 설명: 클라우드(인터넷)가 아니라 회사 내부 서버에 직접 설치해서 쓰는 방식.
한나 버전: 스트리밍 말고 내 하드디스크에 직접 저장해서 쓰는 거야. 보안이 중요한 기업들이 "우리 AI, 우리 서버에서만 돌릴게요" 하는 경우.

"hallucination(할루시네이션)"이 뭐야?

전문가 설명: AI가 그럴듯하게 들리지만 사실이 아닌 내용을 자신 있게 말하는 현상.
한나 버전: 협찬 받지도 않은 브랜드를 "이거 협찬이에요~" 하고 자신 있게 소개하는 뒷광고 크리에이터 느낌. AI가 모르면 모른다고 안 하고, 지어내서 말해버리는 거야.

"quantization(양자화)"이 뭐야?

전문가 설명: AI 모델의 데이터 정밀도를 낮춰서 파일 크기와 메모리 사용량을 줄이는 기술. 4-bit, 8-bit 등.
한나 버전: 영상 화질 낮추는 거야. 4K → 1080p → 720p. 용량은 줄지만 화질이 좀 떨어지는 대신 더 가볍게 돌아가. AI 모델도 이렇게 압축해서 작은 컴퓨터에서 돌릴 수 있어.

"localization(현지화)"이 뭐야?

전문가 설명: 콘텐츠나 서비스를 특정 언어·문화권에 맞게 번역하고 수정하는 과정.
한나 버전: 한나 인스타를 일본 시장용으로 바꾼다면 — 언어만 번역하는 게 아니라 말투, 유머, 감성까지 일본 팔로워한테 맞게 튜닝하는 거야. AI가 이 과정을 엄청나게 싸고 빠르게 만들어줄 거야.

🔥 노정석 어록 모음

"적의 적은 친구죠."

분위기: 신정규 대표가 "IT에서 한 회사가 너무 튀면 나머지가 다 모여서 합종연횡을 한다"고 하자 노정석이 가볍게, 근데 딱 떨어지게 던진 말.

한나 풀이: 유튜브판으로 치면, 한 크리에이터가 너무 독주하면 그 아래 크리에이터들이 자기들끼리 묶여서 콜라보 연합을 만드는 거야. 지금 Meta가 딱 그 역할 하고 있어. 성능이 1등이 아니어도 "우리 다 같이 OpenAI 막자" 기치 들고 뭉치는 거지.

"3등석이라도 타지 않으면 걸어가야 된다. 어떡할래?"

분위기: 신정규 대표가 30~70B 모델의 한계를 인정하면서도, "그래도 지금 올라타야 한다"고 할 때 나온 비유. 약간 쓴웃음 섞인, 현실적인 충고 톤.

한나 풀이: AI가 완벽하지 않아도 지금 써야 한다는 뼈 때리는 말이야. "ChatGPT가 아직 완벽하지 않은데요"라고 기다리다간, 이미 올라탄 경쟁자들이 저만치 가 있어. 콘텐츠 플랫폼이 처음 나왔을 때도 "아직 불안정해, 좀 기다리자"했던 사람들 생각해봐.

"한 달이 거의 1년만큼 지나갑니다."

분위기: ChatGPT 나온 지 7개월 됐다는 말 나오면서, 노정석이 실감 나게 던진 한마디. 놀라움 반 피로함 반.

한나 풀이: AI 업계의 변화 속도가 콘텐츠 알고리즘 변화보다 훨씬 빠르다는 거야. 인스타 알고리즘 바뀌어도 적응할 시간이 몇 주는 있었는데, AI는 매주 새 모델, 새 뉴스가 터져. 한나도 이 속도감에 익숙해지는 게 먼저야.

🎬 한나 적용 포인트

1) 나만의 "GetGPT" 만들어봐 GetGPT처럼, 내가 자주 쓰는 콘텐츠 패턴을 프롬프트 템플릿으로 만들어봐. 예를 들어 "콜라보 제안 DM 템플릿", "협찬 거절 메시지 템플릿", "팔로워 댓글 답변 템플릿"을 GPT에 세팅해두면 매번 새로 쓸 필요가 없어. 선생님들이 학부모 문자를 자동화한 것처럼, 한나도 반복 업무부터 자동화해봐.

2) 글로벌 진출, 지금 실험해볼 타이밍이야 신정규 대표가 "언어 장벽이 가장 먼저 무너진다"고 했잖아. 한나 콘텐츠 중 반응 좋은 거 하나 골라서, 영어·일어·스페인어 자막을 GPT로 만들어서 올려봐. 완벽할 필요 없어. 지금은 실험해보는 게 먼저야. 노정석도 그랬어 — 일단 3등석이라도 타는 거야.

3) "맥락 프롬프트"로 번역 퀄리티 확 올리기 그냥 "번역해줘"가 아니라 "내 채널 캐릭터는 이런 말투야, 타겟 팔로워는 20대 여성이야, 유머 코드는 이런 거야"라고 먼저 설명하고 번역 시켜봐. 신정규 대표가 토르 번역 예시로 말한 게 이거야. 맥락을 먼저 주면 번역 퀄리티가 완전히 달라져.

🏷️ 태그

시기: #2023하
주제: #오픈소스AI #AI생태계 #모델경쟁 #기업전략
인물: #신정규 #Yann LeCun
자유: #Llama2출시 #합종연횡 #오픈vs클로즈드