🤖 GPT-5 출시했는데, AGI는 언제 올까요?

2025년 8월 7일, OpenAI가 드디어 GPT-5를 발표했어요. 많은 분들이 "드디어 AGI가 왔다!"고 기대하셨을 텐데요. 하지만 막상 써보니 뭔가 아직 부족하다는 느낌, 여러분도 받으셨죠?

사실 이런 현상에는 과학적인 근거가 있어요. 오늘은 AI 연구 기관 METR의 최신 분석 결과와 GPT-5의 실제 성능 데이터를 바탕으로, AGI까지 가는 길이 생각보다 복잡하고 험난한 이유를 자세히 알아보겠습니다.

GPT-5, 정말 대단하긴 한데...

먼저 GPT-5의 실제 성능부터 살펴볼게요. OpenAI가 발표한 공식 데이터는 정말 인상적이에요:

코딩 능력: SWE-bench Verified에서 74.9% 달성했어요. 이는 실제 GitHub 이슈를 해결하는 테스트인데, Claude Opus 4.1의 74.5%를 근소하게 앞섰죠.

수학 실력: AIME 2025 수학 문제에서 94.6%를 기록했어요. 도구 없이 말이에요!

환각 현상 개선: 이전 모델들이 20% 이상의 환각 발생률을 보였다면, GPT-5는 4.8%로 대폭 줄였어요.

멀티모달 이해: MMMU에서 84.2%를 달성하며 시각적 추론 능력도 크게 향상됐죠.

숫자만 보면 정말 대단하죠? 하지만 실제 업무에서 사용해보면 여전히 한계가 뚜렷하게 느껴져요. 왜 그럴까요?

"AGI가 아닌 이유"를 정확히 말할 수 없는 딜레마

정말 흥미로운 점은 현재 AI가 왜 AGI가 아닌지 정확히 설명하기 어렵다는 거예요. 우리는 보통 "메모리 부족", "지속 학습 불가", "판단력 부족" 같은 이유를 대죠.

하지만 ChatGPT는 이미 어느 정도의 메모리 기능을 가지고 있거든요. 개인 설정을 기억하고, 대화 맥락을 유지하는 능력도 있어요. 그럼에도 뭔가 부족함을 느끼는 이유는 뭘까요?

MIT Technology Review에서도 언급했듯이, GPT-5는 "더 나은 사용자 경험"을 제공하지만 "진정한 변혁적 AI"와는 거리가 멀어요. 마치 애플의 레티나 디스플레이처럼 더 선명하고 부드럽지만, 근본적인 패러다임 변화는 아니라는 거죠.

METR 연구가 밝힌 놀라운 사실

Model Evaluation & Threat Research(METR)에서 발표한 연구 결과가 정말 놀라워요.

AI가 완수할 수 있는 작업의 길이가 7개월마다 2배씩 증가하고 있다는 겁니다. 이 추세는 2019년부터 무려 6년간 지속되고 있어요.

구체적인 데이터를 보면:

2019년: 몇 초 분량의 작업
2025년 현재: 약 50분 분량의 작업을 50% 확률로 성공
2024-2025년만 보면: 118일마다 2배 증가 (더 빠른 속도!)

이 추세가 계속된다면:

2027년: 몇 시간짜리 작업을 안정적으로 처리
2029-2030년: 며칠에서 몇 주짜리 프로젝트 독립 수행

하지만 여기서 재미있는 반전이 있어요. METR의 또 다른 연구에서는 경험 많은 개발자들이 AI 도구를 사용했을 때 오히려 19% 더 오래 걸렸다는 결과가 나왔거든요.

벤치마크 성능과 실제 업무 효율성 사이의 이런 괴리는 왜 생길까요?

샘플 효율성의 거대한 벽

인간은 정말 놀라운 "샘플 효율성"을 가지고 있어요.

10대가 운전을 배우는데 100시간도 안 걸리죠. 하지만 웨이모 자율주행차는 수백만 시간을 학습했는데도 여전히 눈길이나 복잡한 고속도로에서 어려움을 겪어요.

ARC-AGI 퍼즐을 보면 이 차이가 더 극명해져요. 인간은 몇 개의 예시만 봐도 패턴을 파악하지만, AI는 여전히 어려워해요. GPT-5도 ARC-AGI-1에서 65.7%를 기록했는데, 이는 인간의 85% 수준에는 못 미치는 결과예요.

더 어려운 ARC-AGI-2에서는 GPT-5가 9.9%에 그쳤어요. 반면 Grok 4는 16%를 기록했지만, 작업당 비용이 133만 원에서 267만 원(2-4달러)이나 들었죠.

크기의 역설과 깊이의 차이

흥미롭게도 GPT-4 이후 2년 반 동안 공개된 모델들의 크기는 더 이상 커지지 않고 있어요. GPT-4의 1.8조 개 파라미터가 여전히 최고 수준이죠.

반면 인간의 뇌는 100조 개의 연결을 가지고 있는데, 어떻게 AI가 인간보다 더 많은 사실을 기억할 수 있는 걸까요?

답은 "깊이의 차이"에 있을 것 같아요. AI는 얕고 넓게 학습하는 반면, 인간은 깊고 연결된 방식으로 학습하죠. 인간은 새로운 정보를 기존 지식과 연결하면서 의미 있는 구조를 만들어내요.

연속 학습의 절대적 필요성

현재 AI의 가장 큰 한계 중 하나는 "연속 학습"이 불가능하다는 점이에요.

GPT-5는 훈련 단계에서 모든 학습이 끝나고, 그 이후에는 새로운 것을 배울 수 없어요. 매일 첫 출근하는 신입사원과 같은 상태로 모든 작업을 수행해야 하죠.

Sam Altman도 GPT-5 발표에서 연속 학습이 AGI의 핵심이라고 언급했어요. 하지만 이를 구현하기 위해서는:

샘플 효율적 학습 능력
개인정보 보호 메커니즘
대용량 동적 메모리 시스템

이 모든 것이 필요해요. 기술적으로 매우 복잡한 문제들이죠.

벤치마크와 현실의 간극

GPT-5의 벤치마크 성능은 정말 인상적이에요. 하지만 실제 업무에서는 이런 성능이 그대로 나타나지 않아요. 왜 그럴까요?

벤치마크의 한계:

깔끔하게 정리된 입력 사용
명확한 정답/오답 구분
단일 과제 중심

현실 업무의 복잡성:

복잡하고 얽힌 맥락들
품질의 스펙트럼 존재
다중 과제의 동시 처리

METR의 연구에 따르면, AI가 기능적으로 정확한 코드를 작성해도 테스트 커버리지, 포맷팅, 코드 품질 등의 문제로 실제 사용하기 어려운 경우가 많다고 해요. 이것이 벤치마크와 실제 성능의 차이를 만드는 주요 원인이죠.

위상 변화의 가능성

정말 흥미로운 관점은 AI가 도구에서 주역으로 바뀔 때 일어날 "위상 변화"예요.

현재는 인간이 AI를 관리하고 조율하는 구조지만, AI가 대부분의 고차원 작업을 담당하게 되면 어떻게 될까요?

하루 자고 일어났더니 AI 팀이 2주치 일을 해놓은 상황을 상상해보세요. 우리는 더 이상 일의 중심이 아니라 관찰자가 될 수도 있어요.

이런 변화는 단순히 기술적 성능의 문제가 아니라, 사회적, 경제적 구조 전체의 변화를 의미해요.

비용 효율성의 현실

현재 AI의 실용성을 가로막는 큰 장벽 중 하나는 비용이에요.

실제 비용 비교 (작업당):

인간: 약 6,700원(5달러) + 에너지 비용 몇십 원
GPT-5 (저성능): 약 2만 7천원(17-20달러)
o3 모델 (고성능): 최대 133만 원(1,000달러)

기술적 돌파구가 있어도 경제적 실용성이 따라주지 못하면 널리 활용되기 어려워요. 다만 이런 비용은 향후 몇 개월, 몇 년에 걸쳐 급격히 개선될 것으로 예상돼요.

한국 기업들의 대응 방향

럿거스대학교의 이장선 교수는 흥미로운 관점을 제시했어요. "AGI가 2-3년 안에 빠르게 인간의 지능을 따라잡으면서 AI에 대한 기대와 우려가 나오는 가운데, AI를 사용하는 인간의 태도가 더 중요하다"고 말했거든요.

특히 교육 현장에서 이미 관찰되는 현상인데, ChatGPT 사용으로 학생들의 학습 능력이 떨어지고 있다고 해요. AI는 발전하는데 인간은 "생각의 자동화"로 인해 오히려 퇴보할 수 있다는 우려죠.

한국 기업들은:

AI 도구를 단순히 사용하는 것을 넘어서
AI와 함께 성장할 수 있는 인재 양성
창의적 사고력 유지와 발전에 집중해야 해요

미래 전망: 언제쯤 진짜 AGI가 올까?

METR의 7개월 2배 증가 추세가 계속된다면:

2027년: 몇 시간짜리 작업을 안정적으로 처리
2029-2030년: 며칠에서 몇 주짜리 프로젝트 독립 수행 가능

하지만 2024-2025년 데이터만 보면 118일마다 2배씩 증가하고 있어서, 더 빠를 수도 있어요.

다만 이 추세가 계속 유지될지는 의문이에요. 복잡성이 증가할수록 새로운 차원의 문제들이 나타날 가능성이 높거든요.

ARC Prize 재단의 프랑수아 숄레 창립자는 "AGI 도달 여부를 판단할 기준은 AI보다 인간에게 더 쉬운 문제를 만드는 것이 불가능해지는 시점"이라고 정의했어요. 아직 그 시점까지는 상당한 시간이 필요할 것 같아요.

결론: 길고 험난하지만 흥미진진한 여정

AGI로 가는 길은 생각보다 복잡하고 험난해요. 단순히 모델을 더 크게 만들거나 데이터를 더 많이 넣는다고 해결되는 문제가 아니에요.

중요한 것들:

샘플 효율적 학습 능력 개발
연속 학습 메커니즘 구현
진정한 맥락 이해와 추론 능력
현실 세계의 복잡성을 다루는 능력
경제적 실용성 확보

GPT-5는 분명 큰 진전이지만, 여전히 AGI까지는 갈 길이 멀어요. 하지만 그렇기 때문에 더욱 흥미진진하고, 우리가 지켜봐야 할 여정인 것 같아요.

여러분은 언제쯤 진짜 AGI가 올 것 같나요? 그리고 그때를 위해 지금 무엇을 준비하고 계신가요?

300x250

'IT > AI' 카테고리의 다른 글

🛍️ 이제 정말로 AI가 쇼핑을 대신해줄까? 글로벌 기업들의 치열한 AI 어시스턴트 전쟁 (5)	2025.09.01
🔍 "클릭 없는 검색"이 콘텐츠를 집어삼켰다면? (6)	2025.08.31
🔮 구글 NotebookLM의 비밀 무기 'Magic View'가 온다 (0)	2025.08.31
코딩계의 판도를 바꿀 GPT-5와 손잡은 커서 AI 이야기 ✍️ (8)	2025.08.30
개발자들의 마음을 훔친 AI, 클로드 코드에 대한 놀라운 이야기 😲 (5)	2025.08.30

고팀장의 일잘러 이야기

🤖 GPT-5 출시했는데, AGI는 언제 올까요?

GPT-5, 정말 대단하긴 한데...

"AGI가 아닌 이유"를 정확히 말할 수 없는 딜레마

METR 연구가 밝힌 놀라운 사실

샘플 효율성의 거대한 벽

크기의 역설과 깊이의 차이

연속 학습의 절대적 필요성

벤치마크와 현실의 간극

위상 변화의 가능성

비용 효율성의 현실

한국 기업들의 대응 방향

미래 전망: 언제쯤 진짜 AGI가 올까?

결론: 길고 험난하지만 흥미진진한 여정

'IT > AI' 카테고리의 다른 글

티스토리툴바

🤖 GPT-5 출시했는데, AGI는 언제 올까요?

GPT-5, 정말 대단하긴 한데...

"AGI가 아닌 이유"를 정확히 말할 수 없는 딜레마

METR 연구가 밝힌 놀라운 사실

샘플 효율성의 거대한 벽

크기의 역설과 깊이의 차이

연속 학습의 절대적 필요성

벤치마크와 현실의 간극

위상 변화의 가능성

비용 효율성의 현실

한국 기업들의 대응 방향

미래 전망: 언제쯤 진짜 AGI가 올까?

결론: 길고 험난하지만 흥미진진한 여정

'IT > AI' 카테고리의 다른 글

'IT/AI' Related Articles

티스토리툴바