본문 바로가기
IT/소프트웨어

🚀 클라우드플레어는 어떻게 데이터 제국을 건설했나

by DrKo83 2025. 10. 18.
300x250
반응형

인터넷 보안 회사가 데이터 분석 강자로 변신한 비밀

안녕하세요! 오늘은 정말 흥미로운 이야기를 하나 들려드릴게요.

여러분이 웹사이트를 방문할 때마다 뒤에서 조용히 일하는 회사가 있어요. 바로 '클라우드플레어'라는 곳이에요. 이 회사가 2025년 9월, 완전히 새로운 변신을 했답니다. 단순히 웹사이트를 빠르게 만들어주는 회사에서 데이터 분석까지 할 수 있는 종합 플랫폼으로 진화한 거죠.

이게 왜 중요한지, 초보자분들도 쉽게 이해할 수 있도록 천천히 설명해드릴게요.

클라우드플레어, 대체 뭐 하는 회사예요?

먼저 클라우드플레어가 어떤 회사인지부터 알아볼까요?

클라우드플레어는 2009년 미국 샌프란시스코에서 시작한 회사예요. 원래는 웹사이트를 빠르게 만들어주는 'CDN' 서비스로 시작했어요.

CDN이 뭐냐고요? Content Delivery Network의 약자로, '콘텐츠 전달 네트워크'라는 뜻이에요. 쉽게 말하면 이런 거예요. 여러분이 서울에서 미국 서버에 있는 웹사이트를 접속하면 느리잖아요? CDN은 그 웹사이트의 복사본을 전 세계 여러 곳에 미리 저장해놓아요. 그럼 서울에 있는 서버에서 바로 가져오니까 훨씬 빠르죠.

시간이 지나면서 클라우드플레어는 여기에 보안 기능도 추가했어요. 악의적인 해커들이 웹사이트를 마비시키려는 'DDoS 공격'을 막아주는 서비스도 제공하고요. DDoS는 Distributed Denial of Service의 약자로, 수많은 컴퓨터로 동시에 웹사이트에 접속해서 서버를 다운시키는 공격이에요.

2019년에는 뉴욕증권거래소에 상장될 정도로 성장했어요. 2025년 1분기 기준으로 매출이 약 6,400억 원에 달해요. 전년 대비 27%나 증가한 수치죠.

더 놀라운 건 이용자 규모예요. 돈을 내고 쓰는 유료 고객만 25만 명이 넘어요. 그중에서 1년에 1억 원 이상 쓰는 큰 기업이 3,500곳이 넘고요. 전 세계 330개 넘는 도시에 데이터 센터가 있어요.

어느 정도 규모냐면요, 인터넷 트래픽의 약 20%가 클라우드플레어를 거쳐 간대요. 여러분이 웹사이트 5번 방문하면 그중 1번은 클라우드플레어가 도와주고 있다는 뜻이에요.

송신료라는 덫, 그리고 클라우드플레어의 반격

자, 여기서 중요한 이야기가 나와요. 2021년 클라우드플레어가 업계를 뒤집어놓은 사건이 있었어요.

먼저 '송신료'가 뭔지 설명해드릴게요. 여러분이 클라우드에 사진을 저장한다고 생각해보세요. 아마존 웹 서비스나 구글 클라우드 같은 곳에 말이에요. 사진을 저장하는 데는 돈이 얼마 안 들어요. 그런데 그 사진을 다시 꺼내서 보거나 다른 곳으로 옮기려고 하면? 엄청난 돈을 내야 해요. 이게 바로 '송신료' 또는 '이그레스 비용'이라고 불러요.

얼마나 비싸냐면요, 실제 예를 들어볼게요. 1테라바이트, 그러니까 고화질 영화 약 500편 정도 되는 데이터를 아마존 웹 서비스에 저장하면 한 달에 약 3만 원 정도 들어요. 그런데 이 데이터를 다시 꺼내서 쓰려고 하면? 무려 12만 원이 넘게 나와요. 저장하는 것보다 꺼내는 게 4배나 비싼 거죠.

더 충격적인 건, 이게 실제 네트워크 비용보다 훨씬 높다는 거예요. 한국의 경우 실제 비용의 3.5배를 받아요. 그나마 양반이에요. 미국과 유럽은 무려 80배, 일본은 17배의 마진을 붙여서 받는대요. 완전히 폭리죠.

왜 이렇게 비싸게 받을까요? 고객들이 데이터를 한번 저장하면 옮기기가 너무 비싸서 못 나간다는 걸 알거든요. 일종의 '인질극'이에요. 이걸 전문 용어로 '벤더 락인(Vendor Lock-in)'이라고 불러요. 특정 업체에 갇혀서 빠져나올 수 없는 상황을 말하죠.

2021년, 클라우드플레어는 이런 관행에 정면으로 도전했어요. 'R2'라는 스토리지 서비스를 출시하면서 '송신료 제로' 정책을 선언한 거예요. 데이터를 저장하는 것도 저렴하고, 꺼내 쓰는 건 완전 무료라는 거죠.

어떻게 이게 가능할까요? 클라우드플레어는 이미 전 세계 수천 개의 통신사, 인터넷 서비스 제공업체와 직접 연결된 거대한 네트워크를 갖고 있었거든요. 그래서 데이터를 옮기는 비용이 거의 들지 않았던 거예요.

이건 정말 혁신적이었어요. 마치 은행이 예금은 물론이고 출금 수수료도 안 받겠다고 선언한 것과 비슷해요. 당연히 많은 기업들이 관심을 가질 수밖에 없었죠.

아파치 아이스버그, 마법 같은 기술

여기서 중요한 기술 하나를 소개해드릴게요. 바로 '아파치 아이스버그'라는 거예요.

아이스버그는 원래 넷플릭스에서 만든 기술이에요. 넷플릭스는 여러분이 아시다시피 전 세계에서 가장 큰 동영상 스트리밍 서비스죠. 넷플릭스는 어마어마한 양의 데이터를 다뤄요. 누가 어떤 영화를 봤는지, 언제 일시정지했는지, 어떤 장면을 다시 봤는지 같은 데이터를 말이에요.

2017년 넷플릭스 엔지니어인 라이언 블루와 댄 윅스가 이 기술을 개발하기 시작했어요. 그리고 2018년 아파치 재단에 기부했죠. 아파치 재단은 무료 오픈소스 소프트웨어를 만드는 비영리 단체예요. 2020년에는 아파치의 최상위 프로젝트로 승격됐고요.

그래서 아이스버그가 정확히 뭐냐고요? 쉽게 설명해드릴게요.

일반적인 파일 저장소는 그냥 파일을 저장만 해요. 예를 들어 엑셀 파일을 저장했다고 해볼게요. 나중에 그 파일의 일부 내용만 수정하려면 파일 전체를 다시 저장해야 해요. 1기가바이트짜리 파일에서 한 줄만 바꿔도 1기가바이트를 다시 저장하는 거죠. 비효율적이잖아요?

아이스버그는 이런 문제를 해결해요. 파일 저장소 위에 똑똑한 관리 시스템을 올려놓는 거예요. 그럼 데이터베이스처럼 쓸 수 있어요. 일부만 수정할 수 있고, 과거 버전으로 되돌릴 수도 있고, 여러 명이 동시에 작업해도 충돌이 안 나고요.

2022년 성능 테스트에서 아이스버그는 경쟁 기술들을 모두 이겼어요. 그래서 현재 넷플릭스뿐만 아니라 에어비앤비(숙박 공유 플랫폼), 애플, 링크드인(비즈니스 SNS), 어도비(포토샵 만드는 회사) 같은 글로벌 대기업들이 모두 아이스버그를 사용하고 있어요.

클라우드플레어가 데이터 플랫폼을 만들면서 아이스버그를 핵심 기술로 선택한 이유가 바로 여기에 있어요.

데이터 플랫폼의 3가지 핵심 서비스

자, 이제 본격적으로 클라우드플레어 데이터 플랫폼을 파헤쳐볼게요. 세 가지 핵심 서비스로 이루어져 있는데, 각각을 쉽게 설명해드릴게요.

1. 클라우드플레어 파이프라인 - 데이터 수집기

파이프라인은 데이터가 들어오는 첫 번째 관문이에요. 마치 공장의 컨베이어 벨트 같은 거죠.

2025년 초에 클라우드플레어는 '아로요'라는 작은 회사를 인수했어요. 아로요는 실시간으로 데이터를 처리하는 '스트림 처리 엔진'을 만드는 회사였어요. 스트림 처리가 뭐냐면, 데이터가 들어오는 즉시 바로바로 처리하는 거예요. 예를 들어 신용카드 결제가 일어나자마자 사기 거래인지 체크하는 것처럼요.

파이프라인은 세 가지 부품으로 이루어져 있어요.

첫 번째는 '스트림'이에요. 이건 데이터를 받아서 임시로 저장하는 대기실 같은 거예요. 웹사이트에서 클릭이 일어나거나, 앱에서 버튼을 누르거나, 센서에서 측정값이 오면 여기에 쌓여요.

두 번째는 '싱크'예요. 이건 데이터를 최종적으로 어디에 보낼지 정하는 거예요. R2 스토리지에 저장할 수도 있고, JSON이나 파케이(Parquet) 같은 특정 형식으로 저장할 수도 있어요. 파케이는 데이터를 압축해서 효율적으로 저장하는 파일 형식이에요.

세 번째는 '변환'이에요. 이게 정말 멋진 부분인데요, SQL이라는 데이터베이스 언어로 데이터를 가공할 수 있어요. SQL은 Structured Query Language의 약자로, 데이터를 조회하고 조작하는 표준 언어예요.

실제 예를 들어볼게요. 여러분이 온라인 쇼핑몰을 운영한다고 해볼게요. 고객들이 클릭하는 모든 정보를 수집하고 싶어요. 파이프라인을 이용하면 이런 걸 할 수 있어요.

  • 사용자 아이디를 깔끔하게 정리하기
  • 클릭한 건지, 구매한 건지, 장바구니에 담은 건지 이벤트 종류 분류하기
  • 시간 정보를 한국 시간으로 통일하기
  • 긴 URL에서 필요한 정보만 빼내기
  • 로봇이나 크롤러의 가짜 클릭 걸러내기

이 모든 걸 SQL 몇 줄로 실시간으로 처리할 수 있어요. 데이터가 들어오는 순간 바로 정리되는 거죠.

현재는 오픈 베타 기간이라서 파이프라인 기능 자체는 무료예요. 나중에 정식 출시되면 읽은 데이터량, 처리한 데이터량, 전송한 데이터량에 따라 비용을 받을 예정이에요.

2. R2 데이터 카탈로그 - 데이터 도서관

두 번째는 R2 데이터 카탈로그예요. 이건 데이터를 체계적으로 관리하는 심장부라고 보시면 돼요.

먼저 R2 스토리지 자체가 얼마나 안전한지 말씀드릴게요. 연간 내구성이 99.999999999%래요. 9가 11개나 붙어있죠. 이게 얼마나 높은 수준이냐면, 100만 개의 파일을 저장하면 10만 년에 하나 정도 손실될 수 있다는 뜻이에요. 거의 영구적이라고 봐도 되는 수준이죠. 아마존 S3나 구글 클라우드 스토리지도 같은 수준이에요.

2025년 4월 공개 베타 버전이 나온 후 반응이 정말 뜨거웠대요. 특히 'DuckDB'라는 인기 있는 데이터 분석 도구가 바로 지원을 추가했어요. DuckDB는 개인 컴퓨터에서도 빠르게 데이터를 분석할 수 있는 무료 데이터베이스예요. 마리모 노트북 같은 데이터 분석 노트북 도구들도 통합을 시작했고요.

시작하는 것도 정말 간단해요. '랭글러'라는 명령어 도구로 명령어 두 줄만 입력하면 바로 데이터 레이크가 만들어져요. 데이터 레이크는 모든 종류의 데이터를 그대로 저장하는 거대한 저장소를 말해요. 호수처럼 모든 데이터가 모인다고 해서 '레이크'라고 불러요.

그리고 원하는 도구로 송신료 걱정 없이 데이터를 분석할 수 있어요. 예를 들어 파이썬으로 분석하고 싶으면 파이썬으로, 엑셀로 보고 싶으면 엑셀로 자유롭게 꺼내 볼 수 있어요.

여기서 중요한 기능이 하나 더 있어요. 바로 '컴팩션'이라는 건데요.

데이터가 계속 쌓이면 파일 개수가 엄청나게 많아져요. 예를 들어 1분마다 데이터를 저장한다고 해볼게요. 하루면 1,440개 파일이 생기죠. 일주일이면 1만 개가 넘어요. 파일이 너무 많으면 나중에 데이터를 읽을 때 엄청 느려져요. 마치 책장에 책이 너무 많아서 원하는 책 찾기가 힘든 것처럼요.

컴팩션은 이런 작은 파일들을 큰 파일로 자동으로 합쳐주는 기능이에요. 1만 개의 작은 파일을 100개의 큰 파일로 합치는 거죠. 그럼 나중에 데이터를 읽을 때 훨씬 빠르고 효율적이에요. 2025년 9월에 이 기능이 추가됐어요. 명령어 한 줄이면 자동으로 실행돼요.

가격도 정말 투명하고 저렴해요. 기가바이트당 한 달에 20원이에요. 1테라바이트면 2만 원 정도죠. 데이터 카탈로그 작업은 100만 건당 12,000원이에요. 컴팩션 처리는 기가바이트당 6.7원이고요.

무엇보다 중요한 건, 데이터를 꺼내 쓰는 건 완전 무료라는 거예요. 다른 회사들이 여기서 가장 많은 돈을 받는데 말이죠.

현재는 오픈 베타라서 모든 기능이 무료예요. 정식 요금제가 시작되기 최소 30일 전에는 미리 공지가 나올 거래요.

3. R2 SQL - 데이터 분석 엔진

세 번째는 R2 SQL이에요. 저장된 데이터를 실제로 분석하는 부분이죠.

전통적으로는 데이터를 분석하려면 복잡한 과정을 거쳐야 했어요. 'DuckDB', '스파크', '트리노' 같은 쿼리 엔진을 직접 설치해야 하고요. 쿼리 엔진은 데이터베이스에 질문을 던져서 답을 얻는 프로그램이에요.

서버도 띄워야 하고, 메모리나 CPU 같은 자원도 관리해야 하고, 성능을 높이기 위해 튜닝도 해야 해요. 전문 지식이 필요한 일이죠. 스파크는 아파치 재단이 만든 빅데이터 처리 프레임워크예요. 수백 대의 컴퓨터를 하나처럼 묶어서 거대한 데이터를 처리할 수 있어요. 트리노는 여러 데이터베이스를 동시에 쿼리할 수 있는 SQL 엔진이고요.

R2 SQL은 이 모든 걸 '서버리스'로 제공해요. 서버리스는 서버를 직접 관리하지 않아도 된다는 뜻이에요. 여러분이 코드만 작성하면 클라우드플레어가 알아서 서버를 띄우고, 실행하고, 끄는 거죠. 마치 전기를 쓸 때 발전소를 직접 관리하지 않는 것처럼요.

더 강력한 건, 클라우드플레어의 글로벌 네트워크 어디서든 컴퓨팅을 실행할 수 있다는 거예요. 데이터가 서울에 있으면 서울에서, 도쿄에 있으면 도쿄에서 처리해요. 데이터를 옮기지 않고 데이터가 있는 곳에서 바로 계산하는 거죠. 이걸 '에지 컴퓨팅'이라고 불러요.

왜 이게 중요할까요? 데이터를 옮기는 게 시간도 오래 걸리고 비용도 많이 들거든요. 데이터가 있는 곳에서 바로 처리하면 훨씬 빠르고 저렴해요.

R2 SQL의 또 다른 강점은 R2 데이터 카탈로그와의 긴밀한 통합이에요. 단순히 파일을 읽는 게 아니라, 데이터 카탈로그가 가진 풍부한 정보를 활용해요. 어떤 데이터가 어디에 있는지, 값의 범위가 어떻게 되는지, 데이터 타입이 뭔지 같은 메타데이터를 말이에요.

이런 정보를 활용하면 쿼리를 훨씬 똑똑하게 실행할 수 있어요. 예를 들어 2024년 1월 데이터만 필요한데, 시스템이 자동으로 그 달 파일만 읽는 거죠. 2년치 데이터를 다 읽을 필요가 없어요. 이런 최적화가 자동으로 이루어져요.

사용하는 것도 정말 간단해요. 랭글러 명령어 도구에 웨어하우스 이름과 SQL 쿼리만 입력하면 돼요. 웨어하우스는 데이터를 저장하고 분석하는 시스템을 말해요.

현재 오픈 베타는 필터 쿼리에 집중하고 있어요. 필터는 조건에 맞는 데이터만 골라내는 거예요. 예를 들어 "서울에 사는 30대 여성 고객" 같은 조건으로 데이터를 걸러내는 거죠.

시간이 지나면서 더 복잡한 기능이 추가될 예정이에요. 집계는 데이터를 그룹으로 묶어서 합계, 평균 같은 걸 계산하는 거예요. 조인은 여러 테이블을 연결하는 거고요.

베타 기간엔 R2 SQL 자체는 무료예요. 하지만 쿼리 실행 중에 데이터를 읽는 건 R2 스토리지 요금이 부과돼요. 나중에 정식 출시되면 스캔한 데이터 볼륨에 따라 비용을 받을 거래요. 요금제 시작 전에 미리 공지가 나올 거고요.

왜 이게 혁명이라고 할까요?

자, 이제 이 모든 게 왜 중요한지 정리해볼게요.

전통적인 데이터 분석 시스템은 정말 비쌌어요. 스노우플레이크나 데이터브릭스 같은 유명한 데이터 웨어하우스 서비스는 한 달에 최소 수백만 원에서 수천만 원이 들어요. 데이터 웨어하우스는 데이터를 저장하고 분석하기 좋게 정리한 시스템이에요. 스노우플레이크는 현재 가장 인기 있는 클라우드 데이터 웨어하우스 회사고요. 데이터브릭스는 스파크 기반의 데이터 분석 플랫폼이에요.

중소기업이나 스타트업은 이런 비용을 감당하기 어려워요. 그래서 데이터가 있어도 제대로 활용하지 못하는 경우가 많았죠.

클라우드플레어는 이런 장벽을 확 낮췄어요. 사용한 만큼만 내는 구조라서 작게 시작할 수 있어요. 월 몇만 원으로도 시작할 수 있고, 필요하면 페타바이트까지 확장할 수 있어요. 페타바이트는 1,000테라바이트예요. 고화질 영화로 치면 50만 편 정도 되는 엄청난 양이죠.

더 중요한 건 송신료가 없다는 거예요. 다른 클라우드 서비스에서는 데이터를 옮기거나 꺼낼 때마다 돈을 내야 해요. 그래서 한번 들어가면 나오기 어려워요. 마치 헬스장 회원권 해지하기 어려운 것처럼요.

클라우드플레어는 이런 제약이 없어요. 데이터를 자유롭게 이동할 수 있어요. 오늘은 클라우드플레어에서 분석하다가 내일은 다른 도구로 옮겨도 돼요. 비용 걱정이 없으니까요.

또 하나 중요한 건 '오픈 스탠다드'예요. 클라우드플레어는 아파치 아이스버그라는 오픈소스 기술을 사용해요. 오픈소스는 소스 코드가 공개되어 있어서 누구나 볼 수 있고, 수정할 수 있고, 사용할 수 있는 소프트웨어예요.

아이스버그를 지원하는 도구가 정말 많아요. 파이썬의 PyIceberg, DuckDB, 스파크는 물론이고, 스노우플레이크나 데이터브릭스 같은 다른 플랫폼과도 연결할 수 있어요. 클라우드플레어에 갇히지 않는 거죠.

독립적인 연구에 따르면, 클라우드플레어처럼 전 세계에 촘촘히 퍼진 네트워크는 도시 지역에서 지연시간을 최대 40%, 신흥 시장에서 25% 줄일 수 있대요. 지연시간은 데이터를 요청하고 응답받는 데 걸리는 시간이에요. 짧을수록 빠르고 좋죠.

실제 사용 사례를 하나 들어볼게요. 여러분이 이커머스 스타트업을 운영한다고 해볼게요. 하루에 고객 10만 명이 방문하고, 각 고객이 평균 10번 클릭한다고 하면 하루에 100만 건의 이벤트가 발생해요.

기존 방식이라면 이렇게 해야 했어요. 아마존 웹 서비스에 데이터를 저장하고, 분석하려면 레드시프트라는 데이터 웨어하우스를 쓰거나 스파크 클러스터를 직접 구축해야 했어요. 레드시프트는 아마존의 데이터 웨어하우스 서비스예요. 한 달에 최소 수백만 원이 들고, 전문 인력도 필요했죠.

클라우드플레어로는 이렇게 할 수 있어요. 파이프라인으로 실시간 이벤트를 받아서 자동으로 정리하고, R2 데이터 카탈로그에 저장하고, R2 SQL로 바로 분석해요. 처음엔 월 몇만 원으로 시작해서 트래픽이 늘면 자동으로 확장되고요. 서버 관리도 필요 없고, 송신료 걱정도 없어요.

더 나아가 나중에 비즈니스가 커져서 스노우플레이크 같은 고급 도구를 쓰고 싶어지면? 그냥 연결하면 돼요. 데이터를 옮길 필요도 없고, 송신료도 없으니까요. 아이스버그 형식이라서 대부분의 도구가 바로 읽을 수 있거든요.

실제 비용, 숫자로 비교해볼까요?

좀 더 구체적으로 비용을 비교해볼게요.

1테라바이트 데이터를 저장하고 한 달에 10번 정도 분석한다고 가정해볼게요.

아마존 웹 서비스의 경우 S3 스토리지 비용이 약 3만 원이에요. 여기까지는 괜찮아요. 그런데 그 데이터를 10번 꺼내 쓰면? 10테라바이트 송신료로 약 120만 원이 나와요. 레드시프트로 분석하려면 추가로 월 50만 원 이상 들고요. 총 170만 원 이상이에요.

클라우드플레어는 어떨까요? R2 스토리지 비용이 약 2만 원이에요. 송신료는 0원이고요. R2 SQL 비용은 스캔한 데이터량에 따라 달라지지만, 현재 베타라서 무료예요. 정식 출시 후에도 월 10만 원을 넘기 힘들 거예요. 총 12만 원 정도죠.

같은 작업을 하는 데 15배 가까이 차이가 나는 거예요. 1년이면 1,900만 원 대 150만 원이에요. 중소기업이나 스타트업 입장에서는 엄청난 차이죠.

구글 클라우드도 비슷해요. 클라우드 스토리지 비용은 약 2만 6천 원, 송신료는 약 160만 원이에요. 빅쿼리로 분석하면 스캔한 데이터량에 따라 추가 비용이 발생하고요. 빅쿼리는 구글의 서버리스 데이터 웨어하우스예요.

마이크로소프트 애저도 마찬가지예요. 스토리지는 저렴하지만 송신료가 비싸요.

클라우드플레어가 이렇게 저렴한 이유는 뭘까요? 세 가지 이유가 있어요.

첫째, 이미 구축된 글로벌 네트워크를 활용하기 때문이에요. 새로 인프라를 깔 필요가 없었죠.

둘째, 데이터를 에지에서 처리하기 때문이에요. 중앙 데이터 센터로 데이터를 모으지 않고 각 지역에서 처리하니까 네트워크 비용이 줄어들어요.

셋째, 송신료를 받지 않는 대신 더 많은 고객을 유치하는 전략이에요. 장기적으로 보면 고객이 많아질수록 수익이 나는 구조죠.

다른 회사들은 어떻게 대응하고 있을까요?

클라우드플레어의 공격적인 가격 정책에 다른 회사들도 반응하고 있어요.

아마존 웹 서비스는 2025년부터 특정 조건에서 송신료를 낮추는 프로그램을 시작했어요. 하지만 여전히 완전 무료는 아니에요. 월 100기가바이트까지만 무료고, 그 이상은 여전히 비용을 받아요.

구글 클라우드는 '클라우드 인터커넥트'라는 서비스로 대응하고 있어요. 구글 네트워크와 직접 연결하면 송신료를 줄여준다는 거예요. 하지만 이것도 완전 무료는 아니고, 직접 연결 비용이 따로 들어요.

마이크로소프트는 아직 큰 변화가 없어요. 송신료 정책을 그대로 유지하고 있죠.

반면 새로운 클라우드 스토리지 업체들이 속속 등장하고 있어요. '백블레이즈'라는 회사는 클라우드플레어보다 먼저 송신료 무료 정책을 시작했어요. '와사비'라는 회사도 비슷한 전략을 쓰고 있고요.

시장이 점점 송신료 없는 방향으로 움직이고 있어요. 고객들이 더 이상 비싼 송신료를 받아들이지 않는 거죠.

앞으로 어떻게 발전할까요?

클라우드플레어는 2026년 상반기에 더 많은 기능을 추가할 계획이래요.

첫 번째는 '로그푸시 통합'이에요. 로그는 시스템에서 일어나는 모든 일을 기록한 파일이에요. 웹사이트 방문 기록, 에러 기록, 보안 이벤트 같은 거죠. 현재는 로그를 외부로 내보내야 하는데, 앞으로는 클라우드플레어 안에서 바로 변환하고 저장하고 분석할 수 있게 된대요.

두 번째는 '사용자 정의 함수'예요. 워커를 통해 자기만의 데이터 처리 로직을 추가할 수 있어요. 워커는 클라우드플레어의 서버리스 컴퓨팅 플랫폼이에요. 예를 들어 특별한 암호화를 하거나, 외부 API를 호출하거나, 복잡한 계산을 할 수 있죠.

세 번째는 '상태 저장 처리'예요. 현재는 각 이벤트를 독립적으로 처리하는데, 앞으로는 이전 이벤트를 기억하면서 처리할 수 있어요. 예를 들어 "5분 동안 같은 사용자가 10번 이상 로그인 실패하면 알림" 같은 걸 할 수 있어요.

네 번째는 R2 SQL의 확장이에요. 현재는 기본적인 필터만 되는데, 복잡한 집계와 조인까지 지원될 거예요. 그럼 "지역별 월별 매출 합계"나 "고객 정보와 주문 정보 결합" 같은 복잡한 분석도 가능해져요.

클라우드플레어의 전략, 큰 그림

한 발짝 물러서서 클라우드플레어의 전략을 보면 정말 영리해요.

2009년 CDN 서비스로 시작했죠. 웹사이트를 빠르게 만들어주는 거였어요. 그러면서 자연스럽게 전 세계에 네트워크를 깔았어요.

그다음 보안 서비스를 추가했어요. DDoS 방어, 웹 애플리케이션 방화벽, SSL 인증서 같은 거요. 이미 네트워크가 있으니 추가하기 쉬웠죠.

2017년에는 '워커'라는 서버리스 컴퓨팅을 출시했어요. 개발자들이 코드를 에지에서 실행할 수 있게 한 거죠. 서버를 직접 관리하지 않아도 되니까 편리했어요.

2021년에는 R2 스토리지로 데이터 저장 시장에 진입했어요. 송신료 무료라는 파격적인 정책으로요.

그리고 2025년, 완전한 데이터 플랫폼을 완성했어요. 수집, 저장, 처리, 분석까지 전부 다 되는 거죠.

이게 왜 대단하냐면요, 각 서비스가 따로 노는 게 아니라 서로 연결되기 때문이에요.

예를 들어볼게요. 여러분이 글로벌 서비스를 만든다고 해볼게요.

  1. 클라우드플레어 CDN으로 웹사이트를 빠르게 제공해요
  2. 보안 서비스로 공격을 막아요
  3. 워커로 서버 없이 백엔드 로직을 실행해요
  4. 파이프라인으로 사용자 행동 데이터를 수집해요
  5. R2에 저장하고 R2 SQL로 분석해요
  6. 분석 결과를 다시 워커에서 사용해서 개인화 서비스를 제공해요

전부 클라우드플레어 안에서 해결되는 거죠. 다른 서비스를 붙일 필요가 없어요. 통합이 잘 되어 있으니 설정도 쉽고, 비용도 저렴하고, 성능도 좋아요.

이걸 전문 용어로 '수직 통합'이라고 해요. 한 회사가 여러 단계의 서비스를 모두 제공하는 거죠. 애플이 하드웨어부터 운영체제, 앱스토어까지 다 만드는 것처럼요.

경쟁사들은 어떤가요?

물론 클라우드플레어만 이런 걸 하는 건 아니에요.

'버셀'이라는 회사도 비슷한 접근을 하고 있어요. 버셀은 웹사이트 호스팅, 서버리스 함수, 에지 네트워크를 제공해요. 넥스트제이에스라는 인기 웹 프레임워크를 만든 회사죠. 하지만 버셀은 데이터 분석 쪽은 약해요.

'넷리파이'도 있어요. 버셀과 비슷한 서비스를 제공하는데, 역시 데이터 쪽은 부족해요.

'파스틀리'는 CDN과 에지 컴퓨팅에 강해요. 클라우드플레어의 직접적인 경쟁사죠. 하지만 데이터 플랫폼은 없어요.

결국 CDN부터 데이터 플랫폼까지 전부 갖춘 곳은 클라우드플레어가 유일해요. 이게 클라우드플레어의 큰 강점이죠.

주의할 점도 있어요

물론 장점만 있는 건 아니에요. 주의할 점도 있어요.

첫째, 아직 베타 서비스예요. 파이프라인, R2 SQL 모두 오픈 베타 단계죠. 기능이 완전하지 않을 수 있고, 버그가 있을 수도 있어요. 중요한 프로덕션 시스템에 바로 쓰기는 조심스러워요.

둘째, 현재는 무료지만 나중에 요금이 어떻게 될지 확실하지 않아요. 물론 최소 30일 전에 공지한다고 했지만, 생각보다 비쌀 수도 있죠.

셋째, R2 SQL의 기능이 아직 제한적이에요. 복잡한 집계나 조인은 아직 안 돼요. 고급 분석을 하려면 다른 도구를 함께 써야 할 수 있어요.

넷째, 한국어 지원이 부족해요. 문서가 대부분 영어로 되어 있고, 한국 커뮤니티도 작아요. 문제가 생겼을 때 도움 받기 어려울 수 있어요.

다섯째, 클라우드플레어에 너무 의존하게 될 수 있어요. 송신료가 없다고 해도 결국 한 회사의 서비스를 많이 쓰면 그 회사에 종속되는 건 마찬가지예요. 클라우드플레어가 정책을 바꾸거나 가격을 올리면 곤란해질 수 있죠.

누가 사용하면 좋을까요?

그래서 누가 클라우드플레어 데이터 플랫폼을 쓰면 좋을까요?

첫째, 스타트업이요. 초기엔 비용을 최소화하고 싶고, 나중에 확장 가능해야 하잖아요. 클라우드플레어는 딱 맞아요. 작게 시작해서 크게 키울 수 있거든요.

둘째, 이미 클라우드플레어를 쓰고 있는 기업이요. CDN이나 보안 서비스를 쓰고 있다면 데이터 플랫폼도 추가하기 쉬워요. 통합이 잘 되어 있으니까요.

셋째, 멀티클라우드 전략을 쓰는 기업이요. 여러 클라우드를 동시에 쓰고 싶은데 송신료 때문에 망설였던 곳들이요. 클라우드플레어를 중심으로 데이터를 관리하면 자유롭게 이동할 수 있어요.

넷째, 글로벌 서비스를 하는 기업이요. 전 세계 사용자를 상대하면 에지에서 데이터를 처리하는 게 효율적이거든요. 지연시간도 줄고 비용도 줄어요.

다섯째, 실시간 데이터 처리가 필요한 곳이요. 파이프라인의 스트림 처리 기능이 강력하거든요. IoT, 금융, 게임 같은 분야에서 유용해요.

반대로 이런 경우는 조심하는 게 좋아요. 매우 복잡한 데이터 분석이 필요한 대기업이요. 아직 R2 SQL이 고급 기능을 다 지원하지 않아서요. 레거시 시스템이 많은 전통 기업도 마찬가지예요. 기존 시스템과 통합하기 어려울 수 있거든요.

실제로 시작해볼까요?

자, 이제 실제로 어떻게 시작하는지 간단히 알아볼게요.

먼저 클라우드플레어 계정이 필요해요. 무료로 만들 수 있어요. 그다음 랭글러라는 명령줄 도구를 설치해야 해요. 명령줄 도구는 텍스트 명령어로 프로그램을 제어하는 도구예요.

랭글러 설치는 npm으로 해요. npm은 Node.js 패키지 관리자예요. 터미널에서 이렇게 입력하면 돼요:

npm install -g wrangler

그다음 클라우드플레어에 로그인해요:

wrangler login

이제 R2 버킷을 만들어볼게요. 버킷은 데이터를 담는 컨테이너예요:

wrangler r2 bucket create my-data-lake

데이터 카탈로그를 활성화해요:

wrangler r2 catalog enable my-data-lake

파이프라인을 만들어요:

wrangler pipelines create my-pipeline

이렇게 몇 줄의 명령어로 기본 설정이 끝나요. 이제 데이터를 보내고, 저장하고, 쿼리할 수 있어요.

물론 실제로 사용하려면 더 많은 설정이 필요해요. 스키마를 정의하고, 변환 로직을 작성하고, 쿼리를 최적화해야 하죠. 하지만 시작하는 건 정말 간단해요.

클라우드플레어 문서 사이트에 자세한 튜토리얼이 있어요. 단계별로 따라 하면 30분 안에 기본적인 데이터 파이프라인을 만들 수 있어요.

마무리하며

클라우드플레어의 데이터 플랫폼은 단순히 새로운 제품이 아니에요. 데이터 인프라의 민주화라고 할 수 있죠.

예전에는 구글이나 넷플릭스 같은 거대 기업만 페타바이트급 데이터를 다룰 수 있었어요. 비용도 비용이지만 전문 인력이 필요했거든요. 데이터 엔지니어, 데이터베이스 관리자, 인프라 엔지니어 같은 사람들이요.

클라우드플레어는 이런 장벽을 낮췄어요. 이제 개발자 한 명만 있어도 대규모 데이터 시스템을 만들 수 있어요. 비용도 합리적이고, 관리도 쉬워졌죠.

특히 송신료 제로 정책이 게임 체인저예요. 데이터를 자유롭게 이동할 수 있으니 벤더 락인에서 벗어날 수 있어요. 오늘은 클라우드플레어에서 분석하다가 내일은 다른 도구를 써도 돼요. 데이터는 여러분 것이니까요.

아파치 아이스버그 같은 오픈 스탠다드를 사용한 것도 현명한 선택이에요. 클라우드플레어가 망해도(물론 그럴 가능성은 낮지만), 데이터는 다른 도구로 읽을 수 있어요. 미래를 보장받는 거죠.

2025년은 데이터 플랫폼의 전환점이 될 것 같아요. 클라우드플레어가 문을 열었고, 다른 회사들도 따라올 거예요. 송신료 없는 세상, 누구나 빅데이터를 다룰 수 있는 세상이 오고 있어요.

여러분도 이 흐름에 올라타보시는 건 어떨까요? 지금은 오픈 베타라서 무료로 실험해볼 수 있는 절호의 기회예요. 여러분의 데이터로 뭔가 멋진 걸 만들어보세요. 누가 압니까, 다음 유니콘 기업이 여러분이 될지!

 

300x250
반응형