구호가 먼저 도착했다
요즘 정부 발표와 산업 보고서를 읽으면 '소버린 AI'와 'AI 3강'이 거의 모든 문장에 박혀 있다. 그런데 회의실 열 곳에 들어가 같은 단어의 뜻을 물으면 열 가지 답이 돌아온다. 누군가에게 소버린 AI는 한국어를 잘하는 국산 거대모델이다. 다른 누군가에게는 데이터센터와 칩을 국내에 두는 일이다. 또 누군가에게는 외국 클라우드에 공공 데이터를 넘기지 않는 보안 문제다. 다 그럴듯하지만, 다 다르다.
여기서 첫 번째 오해가 생긴다. 대중과 정책 입안자 다수는 소버린 AI를 '우리도 우리 것으로 챗봇 하나 갖자'는 소유의 문제로 받아들인다. 자국어 모델을 만들고, 깃발을 꽂고, 글로벌 순위표에서 몇 등인지 확인하는 경기로 본다. 이건 AI를 개인이 쓰는 생산성 도구의 국가판으로 축소한 것이다. 더 좋은 망치를 누가 갖느냐의 싸움.
소버린 AI의 본질은 소유가 아니라 통제 가능성이다. 정확히는, 한 사회가 자기 운명에 영향을 주는 기술의 작동 방식을 들여다보고, 따지고, 멈출 수 있는 능력이다.
송유관이라는 비유
AI 주권을 이해하려면 모델을 송유관에 비유하는 편이 낫다. 송유관에서 중요한 건 파이프를 누가 소유했느냐만이 아니다. 어디서 기름이 들어오는지, 중간에 무엇이 섞이는지, 밸브를 누가 잠글 수 있는지, 새면 누가 책임지는지가 진짜 질문이다.
AI도 똑같다. 모델이라는 파이프 안으로는 학습 데이터가 들어가고, 그 데이터에는 누군가의 편향과 누락이 섞여 있다. 밸브는 모델을 멈추거나 고치는 권한이고, 책임은 잘못된 출력이 시민에게 피해를 줬을 때 누구를 부를 수 있느냐다. 국산 파이프를 깔았다고 해서 이 네 가지가 자동으로 풀리지 않는다. 외국 파이프를 쓰더라도 밸브와 검사 권한을 확보하면 주권의 상당 부분은 지킬 수 있다.
그래서 'AI 3강에 들었다'는 말은 측정 기준이 없으면 공허하다. 무엇으로 3강인가. 모델 성능 벤치마크 점수인가, 데이터센터 전력 용량인가, 자국어 처리 품질인가, 아니면 AI가 내린 결정을 시민이 이의제기할 수 있는 제도의 성숙도인가. 마지막 항목으로 순위를 매기면 순위표는 지금과 전혀 다르게 그려진다. 그리고 그 순위표가 사실 국가 운영 능력에 더 가깝다.
개인 사용법을 넘어서야 하는 이유
AI를 잘 쓰는 개인은 늘어나고 있다. 보고서를 빠르게 쓰고, 코드를 짜고, 외국어를 번역한다. 좋은 일이다. 하지만 개인이 도구를 능숙하게 다루는 능력과, 사회가 그 도구를 이해하고 제도 안에 배치하는 능력은 전혀 다른 근육이다.
후자가 사회적 문해력이다. 학습 데이터에 무엇이 들어갔는지 물을 줄 아는 능력, 자동화된 결정이 틀렸을 때 어디에 항의해야 하는지 아는 능력, 'AI가 그렇게 판단했다'는 말 앞에서 그래서 누가 책임지느냐고 되물을 수 있는 능력. 개인 생산성은 이 질문들에 답하지 못한다. 망치질을 잘하는 것과 건축 안전 기준을 만드는 일이 다른 것과 같다.
소버린 AI 담론이 위험한 지점이 여기다. 국산 모델 몇 개와 데이터센터 용량으로 주권을 다 샀다고 착각하면, 정작 사회가 길러야 할 이 문해력은 뒷전으로 밀린다. 파이프만 깔고 검사관은 뽑지 않는 격이다.
한국이 아직 비워둔 칸
구체적 빈칸을 짚어보자. 첫째, 공공 데이터다. 행정, 의료, 교육 데이터로 국산 모델을 학습시키자는 'K-온톨로지' 류의 구상은 매력적이지만, 그 데이터에 대한 시민의 권리, 동의의 범위, 폐기 절차에 관한 언어는 아직 거칠다. 데이터를 모으자는 의지는 강한데, 그것을 시민의 것으로 되돌려 다루는 문법은 약하다.
둘째, 교육이다. 코딩 교육과 프롬프트 활용법은 빠르게 들어왔지만, 'AI가 내린 판단을 의심하는 법'은 정규 교육의 언어가 되지 못했다. 시민이 알아야 할 최소한의 AI 문해력이 무엇인지, 국가가 그 목록조차 합의하지 못했다.
셋째, 책임성이다. 행정에 AI가 들어오면 민원 처리, 복지 심사, 위험 예측에 자동화된 판단이 개입한다. 그 판단이 틀렸을 때 시민이 설명을 요구하고 결정을 뒤집을 절차가 법으로 보장돼 있는가. 이 빈칸이 가장 크다.
여기서 5개년 계획의 망령을 경계해야 한다. 국가주도 대형 사업은 목표 연도와 투입 예산과 모델 개수 같은 셀 수 있는 지표로 성과를 보고하려는 관성이 있다. 부산만 봐도 그렇다. 데이터센터 유치와 디지털 거점을 말할 때 전력과 부지와 일자리 숫자는 또렷하지만, 그 인프라 위에서 시민이 어떤 권리를 갖는지는 흐릿하다. 셀 수 있는 것이 셀 수 없는 것을 밀어낸다.
반론, 그리고 답
이렇게 반박할 수 있다. 정의가 흐릿해도 일단 깃발을 꽂고 자원을 투입해야 추격이라도 하지 않느냐. 완벽한 정의를 기다리다 기차를 놓친다는 것이다. 일리가 있다. 기술 경쟁에서 속도는 실제로 중요하다.
그러나 용어가 정책을 앞서면 자원은 측정 가능한 것으로만 흘러간다. 정의가 없으면 평가도 없고, 평가가 없으면 예산은 칩과 건물처럼 셀 수 있는 곳으로 쏠린다. 그래서 속도를 위해서라도 기준을 먼저 세워야 한다. 무엇을 주권이라 부를지 합의하지 않은 채 달리면, 5년 뒤 우리가 무엇을 얻었는지조차 측정하지 못한다.
AI를 잘 쓰는 나라는 많아질 것이다. 그러나 잘 쓰는 것과 제대로 이해하는 것은 다르다. 제대로 이해하는 나라는 자기가 무엇을 통제할 수 있고 무엇을 못 하는지 알고, 그 경계를 시민의 언어로 적어둔다. 소버린 AI가 구호로 끝날지 전략이 될지는 모델의 등수가 아니라, 우리가 이 빈칸을 채울 언어를 만들 수 있느냐에 달려 있다.
이 글이 좋았다면 눌러주세요
이 글이 유용했다면 공유해 주세요
받아쓰기 칼럼 더 보기 →