본문 바로가기
IT/AI

🎬 AI가 기획부터 영상까지 혼자 다 한다고? 루마 AI 에이전트 정체 공개

by DrKo83 2026. 6. 5.
300x250
반응형

도구는 넘쳐나는데 왜 아직도 힘들까요?

이미지 생성 AI, 영상 만드는 AI, 카피 써주는 AI. 2025년부터 크리에이티브 도구가 폭발적으로 늘었죠. 근데 막상 실무에서 써보신 분들은 다 아실 거예요. 각각의 결과물은 그럴싸한데, 이걸 하나의 캠페인으로 엮으려면 결국 사람이 전부 연결해야 한다는 걸요.

챗GPT로 카피 초안 뽑고, 그걸 복사해서 미드저니에 붙이고, 거기서 나온 이미지를 런웨이에 넣어 영상 만들고, 다시 일레븐랩스로 보이스오버. 매 단계마다 "이 캠페인은 20대 여성 타깃이고, 봄 시즌 제품이에요."를 처음부터 반복 설명해야 합니다.

도구는 늘었는데 일은 줄지 않는 역설. 크리에이티브 업계가 공통으로 겪어온 고통이었어요. 루마 AI 에이전트는 바로 이 지점을 정조준합니다.

루마 AI, 사실 영상 생성 회사였습니다

루마 AI는 원래 Dream Machine, Ray 시리즈로 유명한 미국 팔로알토의 영상 생성 스타트업이에요. 업계에서 꽤 인정받는 영상 AI였는데, 2025년 11월 약 9,000억 원 규모의 시리즈 C 투자를 유치하면서 본격적으로 판을 키웠습니다. 앤드리슨 호로위츠, AWS, 엔비디아 같은 굵직한 투자자들이 참여했고요.

그리고 2026년 3월, 루마는 단순한 영상 생성 도구를 넘어 크리에이티브 에이전트 플랫폼으로의 진화를 선언했습니다. 이번에 공개한 루마 에이전트의 핵심 기술은 Uni-1이라는 자체 개발 모델인데요, 텍스트와 이미지 토큰을 하나의 공간에서 처리하는 구조입니다.

쉽게 말하면, 언어로 생각하면서 동시에 픽셀로 그릴 수 있는 모델이에요. 기존 방식이 글 쓰는 AI와 그림 그리는 AI를 따로 붙이는 것이었다면, 루마는 처음부터 하나로 설계한 겁니다.

많은 분들이 이렇게 오해합니다. "그냥 챗GPT랑 미드저니 묶은 거 아닌가요?"

아니에요. 차이는 구조에서 나옵니다.

챗GPT로 카피 뽑고 그걸 복사해서 미드저니 프롬프트에 넣는 방식은 수동 연결입니다. 사람이 컨텍스트 전달자 역할을 하는 거예요. 루마의 Uni-1 모델은 텍스트와 이미지 토큰을 같은 공간에서 처리하기 때문에, 언어 추론과 시각 생성이 동일한 흐름 안에서 이루어집니다.

외부 모델도 함께 연동합니다. Ray3.14, Google Veo 3, Sora 2, ByteDance Seedream, ElevenLabs 등 8개 이상의 외부 모델을 오케스트레이션하는 구조예요. 하나의 모델이 모든 걸 다 하는 게 아니라, 하나의 두뇌가 여러 도구를 지휘하는 형태입니다.

루마 에이전트의 진짜 핵심, 컨텍스트가 끊기지 않는다

루마 에이전트의 가장 큰 강점은 단 하나예요. 브리프를 한 번 입력하면 그 맥락이 전체 프로젝트에 걸쳐 유지됩니다.

이미지를 만들고, 그 이미지 기반으로 영상을 만들고, 영상에 맞는 보이스오버를 제작하는 과정이 하나의 프로젝트 안에서 끊김 없이 연결되는 거예요. 타깃 연령대도, 브랜드 컬러도, 채널 특성도 처음에 한 번만 설명하면 됩니다.

실제 사례를 보면 차이가 와 닿아요. 한 글로벌 브랜드가 기존에 200억 원짜리 연간 광고 캠페인을 다국어 현지화 버전으로 전환하는 데, 루마 에이전트로는 40시간에 약 2,700만 원 미만이 들었다고 합니다. 기존 방식과 비교하면 비용 차이가 압도적이죠.

실제로 어떻게 작동하나요? 브레인스톰 모드와 생성 모드

루마 에이전트는 크게 두 가지 흐름으로 작동합니다.

첫 번째는 브레인스톰 모드입니다. 아이디어나 간단한 브리프를 입력하면 에이전트가 구체화 질문을 던집니다. "타깃 연령대는요?", "어떤 채널에 올릴 건가요?", "이미 가지고 있는 브랜드 에셋이 있나요?" 이런 대화를 통해 초기 기획안, 필요한 에셋 목록, 제작 순서를 잡아줘요.

두 번째는 생성 모드입니다. 기획안이 잡히면 실제 결과물을 만들어냅니다. 배너 이미지, 룩북 사진, 숏폼 영상, 보이스오버까지 한 프로젝트 안에서 처리되고요. 에이전트가 결과물을 내고, 스스로 평가한 뒤, 품질을 높이는 방향으로 반복 수정하는 자기비판(self-critique) 루프도 갖추고 있습니다.

코딩 에이전트가 코드를 작성하고 에러를 고치는 것처럼, 크리에이티브 에이전트도 결과물을 검토하고 개선하는 방식이에요.

어떤 사람에게 가장 쓸모가 있을까요?

퍼블리시스 그룹, 아디다스, 마쓰다 같은 대형 브랜드들이 이미 도입했지만, 사실 가장 빛을 발하는 건 소규모 팀이나 1인 사업자 환경입니다.

크리에이티브 디렉터 한 명이 캠페인 전체를 기획하고 실행해야 하는 상황, 스타트업 마케터가 동시에 여러 채널 콘텐츠를 만들어야 하는 상황, 에이전시 담당자가 클라이언트 프레젠테이션용 시안을 빠르게 뽑아야 하는 상황. 이런 경우에 "기획 맥락을 잃지 않고 실제 결과물까지 빠르게 내는" 루마 에이전트의 가치가 제대로 살아납니다.

2025년 IAB(미국 인터랙티브 광고국) 조사에 따르면, 광고 구매자의 86%가 이미 영상 광고 제작에 생성 AI를 사용하거나 도입을 계획하고 있다고 해요. AI 보조 광고 제작이 기존 대비 타임라인을 수 주에서 약 10일로 단축하고, 비용을 최대 60% 절감할 수 있다는 연구 결과도 있습니다.

한계도 솔직하게 말씀드릴게요

루마 에이전트가 완벽한 건 아니에요.

고도로 커스텀된 브랜드 가이드라인을 엄격하게 지켜야 하거나, 기존 디자인 시스템과의 연동이 필수인 환경이라면 아직 한계가 있습니다. 작업 흐름을 시각적으로 보여주는 기능도 다소 부족해서, 팀원들과 협업할 때 "이 에셋이 어떤 과정에서 만들어진 건지" 파악하기 어려운 경우도 있어요.

대형 에이전시 수준의 정밀한 브랜드 관리가 필요한 환경보다는, 속도와 비용 효율을 최우선으로 두는 소규모 팀에 더 적합합니다.

요금은 어떻게 되나요?

2026년 기준 Dream Machine 구독 플랜 기반으로 제공됩니다. 플러스(Plus)는 월 30달러(약 4만 2천 원), 프로(Pro)는 월 90달러(약 12만 6천 원), 울트라(Ultra)는 월 300달러(약 42만 원) 수준이에요. 연간 결제 시 약 20% 할인됩니다.

무료 플랜으로 기본 기능을 체험해볼 수 있고, API도 공개되어 있어서 자체 서비스에 루마 에이전트를 연동하고 싶은 개발자라면 API 방식으로 접근하는 것도 가능해요.

이게 크리에이티브 업계를 어떻게 바꿀까요?

구글도 2025년 9월 Asset Studio를, 아마존도 Creative Agent를 내놨습니다. 다만 이들은 자사 광고 인벤토리 최적화에 초점을 맞춰요. 루마는 에이전시와 크리에이티브 스튜디오, 즉 원본 결과물을 만드는 팀을 타깃으로 한다는 점에서 포지션이 다릅니다.

AI 도구의 진화 방향이 점점 뚜렷해지고 있어요. 텍스트 생성에서 멀티미디어 실행으로, 개별 기능에서 컨텍스트 유지 에이전트로 빠르게 이동하고 있습니다. 도구를 얼마나 잘 쓰느냐보다, 어떤 방향으로 기획하느냐가 결과물의 질을 결정하는 시대가 오고 있는 거예요.

사람이 할 일은 점점 "어떤 도구를 쓸까"가 아니라 "어떤 방향으로 갈까"로 바뀌고 있습니다. 이 흐름을 먼저 체감한 팀이 다음 단계에서 유리한 위치를 가져가게 됩니다.

마무리

루마 AI 에이전트는 크리에이티브 워크플로우의 파편화 문제를 컨텍스트 유지라는 방식으로 실제로 해결하려는 진지한 시도입니다. 아이디어에서 결과물까지의 흐름을 빠르게 검증해야 하는 1인 기획자, 소규모 마케팅팀, AI 도구 도입을 검토 중인 에이전시라면 무료 플랜으로 직접 경험해볼 가치가 충분합니다. AI가 도구가 아닌 협업자로 진화하는 시대, 일하는 방식이 근본적으로 바뀌고 있어요. 지금이 그 변화를 먼저 체감할 수 있는 타이밍입니다.

300x250
반응형