본문 바로가기
비즈니스/스타트업

🚀 AI 스타트업이 반드시 넘어야 할 첫 번째 관문, MMF

by DrKo83 2026. 3. 22.
300x250
반응형

 

"시장이 크면 성공한다"는 말, 이제 절반만 맞아요

AI 스타트업 창업자들이 가장 많이 하는 실수가 뭔지 아세요?

"우리 시장은 엄청 커요. 고객도 원하고, 돈도 낼 준비가 되어 있어요."

맞아요. 근데 그게 충분하지 않은 시대가 됐어요.

2025년 글로벌 스타트업 투자에서 AI 및 테크 분야가 전체 투자의 46%에 달했다는 통계가 있을 정도로, AI 시장 자체는 폭발적으로 성장하고 있거든요. 그런데도 수많은 AI 스타트업이 투자를 받고도 제대로 된 제품을 못 만들어내고 있어요.

이유가 뭘까요?

PMF(제품-시장 적합성)보다 먼저 확인해야 하는 게 하나 더 생겼기 때문이에요. 바로 MMF, 모델-시장 적합성(Model-Market Fit)이라는 개념이에요.

오늘은 이게 뭔지, 왜 중요한지, 그리고 어떻게 확인하는지를 같이 살펴볼게요.

PMF만 알던 시대는 끝났다, MMF란 무엇인가

2007년 마크 앤드리슨이 "시장이 가장 중요하다"고 했을 때, 그 말은 진리처럼 받아들여졌어요. 훌륭한 시장이 제품을 끌어낸다는 이야기였죠.

그런데 AI 스타트업에는 변수가 하나 추가됐어요. 바로 '모델 능력'이에요.

아무리 시장이 크고, 고객이 원하고, 투자자가 돈을 부어도, AI 모델이 핵심 작업을 제대로 수행하지 못하면 아무 의미가 없다는 겁니다.

예를 들어볼게요. 법률 AI 분야는 2023년 이전까지만 해도 투자 유치가 정말 어려웠어요. 시장이 너무 작아 보였고, 모든 회사가 규모 이하였거든요.

그런데 GPT-4가 등장하자마자 상황이 완전히 바뀌었어요. 18개월 만에 실리콘밸리 법률 AI 스타트업들이 수억 달러를 유치하고, 톰슨로이터는 케이스텍스트를 6,500억 원이 넘는 금액에 인수했어요.

시장이 바뀐 게 아니에요. 모델 능력이 임계값을 넘어선 거예요.

이전 모델들은 문서를 분류하는 건 잘했지만, 법률 업무의 핵심인 '생성'과 '추론'은 못했거든요. 특정 법조항이 왜 무효인지 설명하는 브리핑을 작성하는 건 불가능했던 거죠.

그게 바로 MMF예요. 모델이 그 시장이 필요로 하는 핵심 작업을 수행할 수 있냐 없냐의 문제.

코딩 도구 Cursor가 갑자기 폭발한 이유

직접 경험한 이야기를 드릴게요.

클로드 3.5 소네트가 나오기 전에 Cursor를 써봤는데, 솔직히 별로였어요. 설치했다가 며칠 써보고 지우고, 한 달 뒤에 다시 깔아봐도 마찬가지였거든요. 흥미로운 데모 정도였지, 실제 업무 흐름에 쓸 수 있는 도구가 아니었어요.

그런데 클로드 3.5 소네트가 등장한 뒤, 일주일 만에 Cursor 없이는 일을 못하게 됐다는 개발자들이 속출했어요. 단순히 AI 보조 도구를 쓰는 게 아니라, 전체 코드베이스를 이해하는 파트너와 페어 프로그래밍을 하는 느낌이었다는 거예요.

2026년에도 Cursor는 기업 인수 대상으로 거론될 만큼 성장을 이어가고 있어요. 새로운 기능이 추가된 게 아니에요. 기반 모델이 임계값을 넘어서 제품이 실제로 '작동'하게 됐기 때문이죠.

이게 바로 MMF를 확보한 순간이에요.

MMF가 없으면 이렇게 된다, 금융 AI의 현실

반대 사례도 명확해요.

금융 분야를 봐볼게요. 투자은행과 헤지펀드는 포괄적인 재무 분석을 할 수 있는 AI를 정말 원해요. 단 하나의 성공적인 M&A 딜로 수백억 원의 수수료를 버는 거대한 시장이거든요.

그런데 실제 벤치마크를 보면 상황이 달라요.

법률 추론 과제(LegalBench)에서 최상위 모델들은 87% 정확도를 기록해요. 이 정도면 변호사가 가볍게 검토만 하고 신뢰할 수 있는 수준이에요.

반면 핵심 재무 애널리스트 과제(Finance Agent)에서는 최상위 모델도 56% 수준에 그쳐요. 절반 정도는 틀린다는 거잖아요.

무려 30%포인트 차이예요. 법률은 MMF를 확보했고, 금융은 아직이라는 거죠.

수학 증명도 마찬가지예요. 연구 기관들이 수억 원을 낼 준비가 되어 있지만, 현재 모델들은 일관된 수준으로 해내지 못해요. GPT-5, o1, o3 세대를 거치며 조금씩 나아지고 있긴 하지만, 아직 미해결 추측에 대한 엄밀한 증명은 기대하기 어려운 수준이에요.

사람 개입이 '기능'인가 '지팡이'인가

MMF가 있는지 없는지 판단하는 가장 확실한 신호가 있어요.

Human-in-the-loop, 즉 사람 개입이 어떻게 포지셔닝되는지 보는 거예요.

MMF가 있으면 사람 개입은 기능이에요. AI가 작업을 하고, 사람은 품질을 유지하고 엣지 케이스를 처리해요. 감독자 역할을 하는 거죠.

MMF가 없으면 사람 개입은 지팡이예요. AI가 핵심 작업을 수행하지 못한다는 사실을 숨기는 거예요. 사람이 보완하는 게 아니라 보상하고 있는 거죠.

테스트는 간단해요. 사람의 수정을 모두 제거했을 때도 고객이 돈을 낼까요?

답이 아니오라면, MMF는 없는 거예요. 데모만 있는 거예요.

이 질문 하나가 투자 수십억 원을 날릴 수도 있는 결정을 바꿔놓을 수 있어요.

지금 만들 것인가, 미래를 위해 준비할 것인가

이게 가장 잔인한 전략적 딜레마예요.

현재의 MMF에 맞춰 만들 건가요, 아니면 예상되는 미래 MMF를 위해 지금부터 준비할 건가요?

기다리는 것의 위험은 명확해요. MMF가 오늘 없다면, 남의 로드맵에 베팅하는 거예요. Anthropic과 OpenAI가 당신의 운명을 결정하는 동안 런웨이(자금)를 태우게 되는 거죠.

하지만 일찍 시작하는 논리도 설득력 있어요.

MMF가 열릴 때, 모델 능력만으로는 부족해요. 도메인별 데이터 파이프라인, 규제 관계, 수년간 쌓인 고객 신뢰, 깊은 워크플로우 통합이 필요하거든요.

법률 AI 스타트업들이 GPT-4가 나왔을 때 바로 달릴 수 있었던 건, 그 전부터 뼈대를 구축해왔기 때문이에요. 모델이 임계값을 넘는 순간, 준비된 팀이 압도적으로 앞서나가는 거죠.

가장 위험한 구간은 MMF가 24~36개월 후에 올 것 같은 경우예요. 너무 가까워 보여서 준비하고 싶지만, 여러 번의 투자 라운드를 소진할 만큼 먼 거리예요.

이 구간에서 살아남는 건 오직 확신과 충분한 런웨이뿐이에요.

80%와 99% 사이의 무한한 간격

규제가 없는 분야에서는 80% 정확도로도 충분할 수 있어요. 마케팅 카피 초안을 쓰는 AI는 편집이 좀 필요해도 가치를 만들어내거든요.

그런데 금융, 법률, 의료 같은 규제 분야에서는 80% 정확도가 종종 쓸모없어요.

중요한 조항의 20%를 놓치는 계약 검토 도구는 변호사를 돕는 게 아니라 법적 책임을 만들어내요. 다섯 번 중 한 번 틀리는 의료 진단은 제품이 아니라 소송감이죠.

80%와 99% 정확도 사이의 간격은 실무적으로 무한대인 경우가 많아요.

많은 AI 스타트업이 이 간격에 갇혀 있어요. 데모로 투자를 받으면서 제품을 실제로 작동시킬 모델 능력이 오기를 기다리는 거죠.

이걸 인식하는 것, 그리고 솔직하게 인정하는 것이 출발점이에요.

에이전트 임계값, AI 스타트업의 다음 관문

대부분의 MMF 논의가 놓치는 게 하나 더 있어요. 장기간 자율적으로 작동하는 능력, 에이전트 임계값이에요.

지금까지 MMF를 확보한 사례들, 법률 문서 검토나 코딩 보조는 근본적으로 단기 작업이에요. 프롬프트 입력하고, 결과 나오고, 도구 호출 몇 번. 몇 초나 몇 분 안에 끝나요.

하지만 가장 가치 있는 지식 노동은 그렇지 않아요. 재무 애널리스트는 며칠을 들여 모델을 만들고, 가정을 검증하고, 수십 개 소스의 정보를 종합해요. 전략 컨설턴트는 몇 주에 걸쳐 조사하고, 인터뷰하고, 반복 분석을 해요.

마이크로소프트는 2026년을 AI 에이전트가 조직 내에서 디지털 팀원처럼 기능하는 전환점으로 보고 있어요. 그런데 현재 에이전트들은 몇 분 단위 작업을 처리하는 수준이에요. 며칠 단위 작업을 처리하려면 지속성, 복구, 조정, 판단이라는 네 가지 능력이 필요한데, 이게 아직 안정적이지 않아요.

이건 점진적 개선이 아니라 능력의 위상 변화예요. 에이전트 임계값은 현재 MMF의 다음 관문이에요.

MMF를 측정하는 단 하나의 테스트

MMF가 있는지 없는지 확인하는 방법은 생각보다 단순해요.

이 질문에 답해보세요.

"모델이 인간 전문가가 받는 것과 동일한 입력을 받았을 때, 큰 인간 수정 없이 고객이 돈을 낼 만한 결과물을 만들어낼 수 있나요?"

세 가지 요소로 구성돼요.

동일한 입력. 마법 같은 전처리 없이, 실제 워크플로우에서 받을 것을 그대로 줘야 해요.

고객이 돈을 낼 만한 결과물. 데모가 아니라, 실제 문제를 해결하는 프로덕션급 작업이어야 해요.

큰 인간 수정 없이. 결과물의 절반을 다시 쓴다면, 모델이 일을 하는 게 아니에요.

이 세 가지를 모두 충족하면 MMF가 있는 거예요. 하나라도 빠지면 아직 준비가 안 된 거고요.

마무리

AI 스타트업 성공의 공식은 이제 MMF → PMF → 성공이에요. 첫 단계를 건너뛰면 두 번째는 불가능해져요.

아무리 크고 열망하는 시장이라도, 작동하지 않는 제품을 끌어낼 수는 없어요. 그리고 AI에서 작동하지 않는다는 건 모델이 결정해요. 가장 아름다운 인터페이스, 가장 정교한 데이터 파이프라인을 만들어도, 기반 모델이 핵심 작업을 수행하지 못하면 아무 의미가 없어요.

창업자라면 능력이 실제로 어디에 있는지, 어디에 있기를 바라는지를 냉정하게 구분해야 해요. 투자자라면 시장 규모와 팀 품질뿐만 아니라, 지금 모델 능력과 시장이 요구하는 것 사이의 간격을 직접 측정해야 해요.

핵심 질문은 하나예요. 시장이 당신이 만드는 걸 원하는지가 아니라, 모델이 그걸 제공할 수 있는지예요. 지금 당신의 AI 스타트업은 MMF를 확보했나요?

300x250
반응형