그림 조각 ·종이 콜라주 컷아웃
4개 사이트로 쪼개진 한 덩어리
올해 3월 크루소(Crusoe)는 모듈형 데이터센터를 묶은 엣지 존을 내놨다. 표준 구성보다 첫 토큰까지 9.9배 빠르고 처리량은 5배라고 했다. 비슷한 시점 GTC 2026에서 엔비디아는 통신망 자체를 추론 플랫폼으로 바꾸는 AI 그리드 설계를 공개했다. 컴캐스트와 돌린 벤치마크에서 중앙 집중형 한 덩어리를 네 개 사이트로 흩뿌렸더니 토큰당 비용이 평시 52.8퍼센트, 트래픽 폭증 구간에서 76.1퍼센트 싸졌다. 지연은 P99 폭증에서도 500밀리초 아래를 지켰다.
숫자만 보면 신제품 자랑이다. 더 빠르고 더 싸다. 그런데 이걸 제품 뉴스로 읽으면 핵심을 통째로 놓친다.
빠르다는 말 뒤에 숨은 진짜 사건
진짜 사건은 속도가 아니라 위치다. 지난 3년간 자본은 한곳에 거대한 학습 클러스터를 쌓는 방향으로 흘렀다. 수백 메가와트짜리 단일 캠퍼스, 전력망 옆에 박힌 GPU 수만 장. 그런데 추론은 학습과 물리 법칙이 다르다. 사용자가 100밀리초와 30밀리초의 차이를 체감하는 순간, 거리가 곧 품질이 된다. 빛도 서울에서 버지니아까지 왕복하는 데 시간이 걸린다. 그래서 추론 랙은 사람이 사는 곳으로 내려와야 한다.
여기서 데이터센터의 지리가 뒤집힌다. 중앙 집중에서 지역 분산으로. 거대한 한 채에서 동네마다 박힌 작은 노드 수백 개로. 스팬(Span)이라는 회사는 아예 새로 짓는 주택 100채에 분산 컴퓨팅을 심는 파일럿을 잡았다. GPU 1600장, 1.25메가와트를 집집마다 쪼개 넣는다. 데이터센터가 산업단지에서 거실로 내려오는 그림이다.
반론은 당연히 나온다. 분산은 비효율이라는 것이다. 한곳에 모아야 냉각도, 전력 협상력도, 운영 인력도 규모의 경제가 산다는 논리. 학습에서는 맞는 말이다. 그러나 추론은 자주 부르고 작게 부르는 워크로드다. 소형 언어 모델(SLM)이 키오스크와 공장 바닥에서 도는 시대에는, 한 덩어리의 효율보다 사용자 옆 30밀리초가 더 큰 돈을 만든다. 엔비디아가 자기 매출의 중심인 대형 클러스터 대신 통신사 엣지를 띄운 것 자체가, 다음 전장이 어디인지 알려주는 신호다.
자본은 레이어를 사러 간다
그래서 돈이 어디로 가는지를 봐야 한다. 빅테크가 통신망과 손잡는 이유는 단순하다. 추론 노드를 깔 부동산과 전력이 이미 통신사 손에 있기 때문이다. 중앙국, 메트로 허브, 기지국. 엔비디아는 이 흩어진 노드를 하나의 프로그래밍 가능한 평면으로 묶는 제어판을 판다. 부동산은 통신사가 대고, 표준은 엔비디아가 쥔다. 누가 레이어를 장악하는지 보이는가. 칩과 오케스트레이션 계층을 잡으면, 그 위에 깔리는 모든 분산 노드가 결국 같은 통행료를 낸다.
이게 미국 현장의 자본 이동이다. 학습 캠퍼스라는 거대 자산에서, 분산 추론을 묶는 표준이라는 더 얇고 더 비싼 자리로.
한국은 공급자인가 고객인가
여기서 한국의 자리를 따져야 한다. 한국은 이 게임에서 세 갈래로 동시에 서 있다. 공급자, 고객, 그리고 어쩌면 표준 설계자.
공급자 쪽은 강하다. 분산 추론이 늘수록 HBM 수요는 더 깊어진다. SK하이닉스는 2026년 물량을 이미 완판했고, 삼성도 내년 생산능력을 5할가량 늘린다. HBM3E 가격은 2할 가까이 올랐다. 칩 레이어에서 한국은 분명한 공급자다.
문제는 다른 두 자리다. 그 칩으로 짓는 분산 추론 표준, AI 그리드의 제어판은 엔비디아 것이다. 한국 기업은 그 위에서 통행료를 내는 고객이 된다. 표준 설계자 자리는 비어 있는데, 아직 아무도 앉지 못했다.
부산을 보면 기회의 좌표가 또렷하다. 서울이 데이터센터 점유율 절반을 쥔 사이, 부산은 2031년까지 연 27.55퍼센트로 가장 빠르게 큰다. JAKO, 브리지원, SJC2 같은 해저 케이블이 부산과 울산에 상륙한다. 동남아와 일본으로 가는 관문이 부산이라는 뜻이다. 분산 추론 시대에 사용자 옆 30밀리초가 돈이라면, 동남아 사용자에게 가장 가까운 한국 노드는 부산이 된다.
동남권 유치 경쟁의 실익은 그래서 단순한 세수나 건설 일감이 아니다. 부산이 그저 케이블 양륙장에 그치면 임대료만 받는 고객이다. 반면 케이블이 모이는 지점에서 추론 표준을 한 겹이라도 한국식으로 설계하면, 동남아로 가는 토큰의 통행료를 한국이 일부 쥔다.
관망의 비용
실리콘밸리의 이 뉴스는 남의 이야기가 아니다. 분산 추론이 토큰당 비용을 절반 아래로 떨어뜨리는 순간, 그 원가 구조 위에서 경쟁하는 모든 한국 기업의 손익이 다시 계산된다. 더 싸게 추론하는 경쟁사가 같은 서비스를 더 낮은 가격에 내놓을 때, 관망은 곧 원가 열위다.
지금 결정을 미루면 부산은 케이블이 지나가는 길목으로 남는다. 길목은 통행료를 못 받는다. 통행료를 받는 자리는 표준을 한 줄이라도 쥔 쪽이다. 데이터센터가 동네로 내려오는 이 몇 년이, 한국이 공급자에 머물지 표준의 한 귀퉁이라도 설계할지를 가른다.
이 글이 좋았다면 눌러주세요
이 글이 유용했다면 공유해 주세요
VALLEY 칼럼 더 보기 →