AI Tech 칼럼

별은 모델이 아니라 작업흐름으로 이동했다

2026년 봄 GitHub가 말하는 에이전트 개발의 미래

데니 김 · 2026년 6월 6일 · 16분 읽기

많은 사람이 GitHub의 star를 그저 인기 지표로 본다.

어떤 저장소가 하룻밤 사이 주목받았는지, 어떤 프로젝트가 개발자들의 관심을 끌었는지 보여주는 순위표쯤으로 여긴다.

하지만 2026년 봄의 GitHub를 그렇게만 읽으면 정작 중요한 변화를 놓친다.

별은 더 이상 “멋진 모델”에만 찍히지 않는다. 이제 별은 모델을 실제 일에 투입하는 방식, 곧 작업흐름에 찍힌다.

AI 개발의 중심은 “어떤 모델이 더 똑똑한가”에서 “그 지능을 어떤 구조로 반복 가능하게 만들 것인가”로 옮겨가고 있다. 모델은 엔진이다. 하지만 엔진만으로는 산업이 되지 않는다. 도로와 신호, 정비소, 운전 규칙이 함께 깔려야 비로소 산업이 시작된다.

2026년 봄 GitHub의 star가 가리킨 것이 바로 그 도로다.

이 글에서는 그것을 스킬 레일(skill rail)이라고 부르려 한다.

스킬 레일은 프롬프트가 아니다.

에이전트가 반복 가능한 일을 해내도록 미리 깔아두는 작업흐름의 철도다.

스킬은 프롬프트가 아니라 레일이다

인터넷이 처음 등장했을 때 사람들은 웹페이지를 “전자 브로슈어”로 이해했다. 회사 소개서를 화면에 옮긴 것이라고 생각했다. 그러나 웹의 진짜 힘은 페이지가 아니라, 링크와 프로토콜과 검색, 결제, 인증이 이어지며 새로운 경제 활동의 레일이 됐다는 데 있었다.

AI 에이전트도 같은 길목에 서 있다.

처음에는 챗봇이었다. 질문하면 답하고, 코드를 조금 써주고, 문서를 요약해주는 도구였다. 그러나 지금 개발자들이 관심을 두는 것은 “더 똑똑한 답변”이 아니다. 에이전트가 일정한 품질로 일하고, 이전 경험을 기억하고, 외부 도구를 호출하고, 여러 단계의 일을 끝까지 해내게 만드는 구조다.

GitHub에서 주목받는 skills류 저장소가 이 변화를 잘 보여준다. mattpocock/skills는 자신이 매일 실제 엔지니어링에 쓰는 agent skill을 모아둔 저장소라고 설명한다. 중요한 건 이 저장소가 단순한 프롬프트 묶음이 아니라, 실제 애플리케이션 개발의 맥락 안에서 에이전트가 어떤 절차로 판단하고 실행해야 하는지를 정리한다는 점이다.

mvanhorn/last30days-skill도 같은 방향을 가리킨다. 이 스킬은 Reddit, X, YouTube, Hacker News, Polymarket, 웹을 훑어 특정 주제나 인물의 최근 흐름을 종합하도록 설계됐다. 검색어 하나를 잘 던지는 문제가 아니다. 여러 소스의 신호를 모으고 비교해 요약 가능한 구조로 바꾸는 작업흐름이다.

여기서 핵심은 “스킬”이라는 단어다.

스킬은 모델에 더해지는 작은 기능처럼 보이지만, 실제로는 에이전트가 일하는 방식을 표준화하는 단위다. 좋은 스킬은 좋은 프롬프트보다 강하다. 프롬프트는 한 번의 요청을 개선하지만, 스킬은 반복 가능한 일을 만든다.

개발자들이 별을 찍는 대상이 바뀐 이유도 여기에 있다.

모델은 점점 더 강해지고 있다. 그런데 모델이 강해질수록 역설적으로 더 중요해지는 건 모델 바깥의 구조다. 어떤 메모리를 읽을 것인가. 어떤 도구를 호출할 것인가. 무슨 기준으로 결과물을 검증할 것인가. 실패했을 때 어떻게 되돌릴 것인가.

개발의 병목은 지능의 부재가 아니라, 그 지능을 운영하는 구조의 부재로 옮겨가고 있다.

OpenClaw가 보여준 개인 에이전트의 상상력

이 흐름을 대중적으로 폭발시킨 사례가 OpenClaw다. OpenClaw는 사용자가 자기 기기에서 직접 돌리는 개인 AI 비서를 표방한다. 메시징 앱으로 응답하고, 사용자가 이미 쓰는 채널 위에서 동작하며, 단순 대화형 챗봇이 아니라 실제로 일을 해내는 비서가 되는 것을 목표로 한다.

OpenClaw의 의미는 단순히 “로컬에서 돌아가는 AI 비서”에 그치지 않는다.

그보다 중요한 건 에이전트가 사용자의 일상 채널 안으로 들어왔다는 점이다. 과거의 AI는 브라우저 탭 안에 있었다. 사용자가 들어가서 질문해야 했다. OpenClaw류의 에이전트는 반대로 사용자가 이미 일하는 공간으로 들어온다. 메시지와 일정, 이메일, 파일, 브라우저, 외부 서비스가 하나의 작업 표면이 된다.

이 변화는 개발자에게도 중요하다. 에이전트는 더 이상 “코드를 생성하는 도구”에 머물지 않는다. 일의 흐름을 관찰하고, 필요한 도구를 연결하고, 작업을 나누고, 결과를 되돌려주는 실행 주체에 가까워진다.

다만 이 지점에서 위험도 함께 커진다. 에이전트가 실제로 일을 하려면 권한이 필요하다. 파일을 읽고, 명령을 실행하고, 외부 서비스에 접근하고, 때로는 결제나 메시징 시스템과도 연결된다. 권한이 커질수록 편의성도 커지지만, 공격면도 같이 넓어진다.

실제로 OpenClaw 생태계에서는 악성 skill과 검증 부족을 둘러싼 보안 우려가 제기됐다. Snyk는 ClawHub skill marketplace에서 악성 skill 캠페인을 발견했다고 보고했고, 수만 개의 ClawHub skill과 악성 샘플을 대상으로 AI agent skill 보안 문제를 다룬 연구도 나왔다.

이것이 스킬 레일 시대의 첫 번째 교훈이다.

에이전트에게 일을 맡기는 순간, 문제는 생산성만이 아니다. 신뢰와 권한, 검증, 책임의 문제가 동시에 열린다.

스킬은 능력의 단위이면서, 동시에 위험의 단위다.

빅테크가 발표한 것도 모델이 아니라 구조였다

2026년 5월의 빅테크 발표는 이 흐름을 한층 분명하게 만들었다.

Anthropic은 Claude Managed Agents에서 dreaming, outcomes, multiagent orchestration을 공개했다. dreaming은 에이전트가 이전 세션과 메모리를 주기적으로 복기해 패턴을 정리하는 기능이고, outcomes는 결과물이 특정 품질 기준을 만족하도록 평가하고 수정하는 구조이며, multiagent orchestration은 리드 에이전트가 전문 에이전트에게 일을 나누는 방식이다. Anthropic이 강조한 건 단순히 “더 큰 모델”이 아니라, 에이전트가 꾸준히 배우고 품질 기준을 맞추며 여러 작업을 병렬로 해내게 만드는 운영 구조였다.

Google도 같은 방향으로 움직였다. Google I/O 2026의 개발자 발표는 Antigravity 2.0, Gemini API의 Managed Agents, Google AI Studio의 agentic 개발 경험을 전면에 내세웠다. 개발자가 agentic future를 만들 수 있도록 이런 기능을 제공한다는 설명이었다.

여기서 눈여겨볼 건 두 회사의 메시지가 닮아 있다는 점이다.

AI 경쟁은 여전히 모델 경쟁이다. 그러나 모델만으로는 충분하지 않다는 사실을 빅테크 스스로 인정하기 시작했다. 이제 경쟁은 모델을 감싸는 하네스, 실행 환경, 평가 루브릭, 메모리, 도구 연결, 샌드박스, 멀티에이전트 오케스트레이션으로 번지고 있다.

이는 PC 산업에서 운영체제가 등장했던 순간과 비슷하다.

초기에는 누가 더 좋은 하드웨어를 만드느냐가 중요했다. 그러나 어느 순간 경쟁의 중심은 하드웨어 위에서 애플리케이션이 안정적으로 돌아가게 만드는 운영체제로 옮겨갔다. AI에서도 비슷한 일이 벌어지고 있다. 모델은 연산의 엔진이고, 에이전트 구조는 그 엔진을 사회와 조직 안에서 작동하게 만드는 운영체제다.

그래서 스킬 레일은 단순한 개발자 편의 기능이 아니다.

AI가 조직 안에서 일할 수 있게 만드는 운영 인프라다.

Hermes Agent와 기억하는 동료의 등장

Nous Research의 Hermes Agent는 이 변화의 또 다른 방향을 보여준다. Hermes Agent는 스스로의 경험에서 skill을 만들고, 쓰면서 개선하며, 지식을 꾸준히 저장하고, 과거 대화를 검색하는 self-improving agent를 표방한다. 또 노트북에 묶이지 않고 VPS, GPU 클러스터, 서버리스 인프라, 클라우드 VM 등 다양한 환경에서 실행될 수 있다고 설명한다.

여기서 핵심은 “기억”이다.

기존의 AI 도구는 매번 새로 시작하는 계약직에 가까웠다. 사용자는 매번 맥락을 설명해야 했다. 프로젝트의 역사, 팀의 규칙, 이전 결정의 이유, 실패했던 시도는 대화가 끝나면 사라졌다.

그러나 에이전트가 기억을 갖기 시작하면 성격이 달라진다.

그것은 더 이상 한 번 쓰고 닫는 도구가 아니다. 프로젝트의 맥락을 쌓아가는 동료에 가까워진다. 장기적인 제품 개발, 고객 대응, 연구, 운영 자동화에서 중요한 건 한 번의 답변 품질보다 “맥락의 지속성”이다.

Hermes Agent의 릴리스도 이 방향을 강화한다. v0.14.0 릴리스는 어디서나 설치하고 실행할 수 있는 기반, OAuth 기반 provider 연동, 로컬 프록시, X 검색 도구 등을 포함한다고 설명한다.

이 흐름은 개발자의 역할도 바꾼다.

개발자는 더 이상 모든 코드를 직접 쓰는 사람이 아니다. 점점 더 에이전트가 일할 수 있는 환경을 설계하는 사람이 된다. 어떤 skill을 허용할지, 어떤 데이터를 읽게 할지, 무엇은 자동화하고 어떤 판단은 사람이 쥘지 정하는 사람이 된다.

개발자는 코더에서 작업흐름 설계자로 옮겨간다.

MCP는 에이전트 시대의 연결 표준이 되고 있다

에이전트가 실제 세계에서 일하려면 외부 시스템과 연결돼야 한다. 캘린더, 이메일, 데이터베이스, 코드 저장소, 결제, CRM, 검색, 문서 도구가 모두 연결 대상이 된다. 그런데 각각의 에이전트와 각각의 도구를 매번 따로 연결하면 생태계는 금세 파편화된다.

이 지점에서 MCP, 곧 Model Context Protocol의 의미가 커진다.

Anthropic은 MCP를 AI agent를 외부 시스템과 연결하기 위한 open standard라고 설명한다. 전통적으로 agent와 tool 또는 data를 연결하려면 조합마다 커스텀 통합이 필요했고, 이는 파편화와 중복을 낳았다. MCP는 한 번 구현하면 여러 integration 생태계를 열 수 있는 공통 프로토콜을 지향한다.

MCP 생태계의 성장도 이미 상당하다. Model Context Protocol 공식 블로그는 2025년 12월 기준 9,700만 건 이상의 월간 SDK 다운로드와 1만 개 이상의 active server, 주요 AI 플랫폼들의 client support를 언급했다.

이 숫자가 중요한 이유는 단순한 인기 때문이 아니다.

에이전트 경제의 핵심 병목이 “모델 호출”에서 “시스템 연결”로 옮겨가고 있음을 보여주기 때문이다. 모델이 아무리 똑똑해도 캘린더를 읽지 못하고, 사내 DB에 접근하지 못하고, 코드베이스의 상태를 이해하지 못하면 실제 일을 해낼 수 없다.

MCP는 에이전트 시대의 USB가 되려 한다.

장치마다 다른 포트를 쓰던 시대에서 하나의 표준 포트가 주변기기 시장을 폭발시켰듯이, 에이전트도 외부 도구와 데이터를 잇는 표준이 깔릴 때 비로소 산업으로 커질 수 있다.

스킬 레일은 작업 단위의 표준화다.

MCP는 연결 단위의 표준화다.

이 둘이 만날 때 에이전트는 장난감에서 인프라로 넘어간다.

별이 많다는 것이 신뢰가 많다는 뜻은 아니다

그러나 이 변화가 저절로 좋은 미래를 보장하지는 않는다.

GitHub의 star는 관심의 신호이지, 품질 보증서가 아니다.

빠르게 성장한 저장소일수록 코드 리뷰, 보안 검증, 라이선스 검토, 운영 지속성은 오히려 더 취약할 수 있다. OpenClaw의 malicious skill 논란이 이를 보여준다. Claude Code source map leak과 이를 둘러싼 재구현 논란도 같은 질문을 남긴다. Layer5는 Claude Code의 source map 노출로 약 51만 2천 줄, 약 1,900개 파일이 공개됐다고 설명했다.

이 사건들의 공통점은 하나다.

에이전트 시대에는 “빨리 만드는 능력”과 “정당하게 만드는 능력”이 분리될 수 없다는 점이다.

AI는 재구현 속도를 극단적으로 끌어올린다.

누군가의 코드나 워크플로, 제품 구조가 노출되면 이를 분석해 비슷한 형태로 다시 만드는 시간이 과거보다 훨씬 짧아진다. 오픈소스 생태계는 이 속도를 창의성으로 바꿀 수도 있지만, 신뢰를 무너뜨리는 방향으로 흘러갈 수도 있다.

그래서 star가 많다는 사실보다 더 중요한 질문이 생긴다.

이 skill은 어떤 권한을 요구하는가.

누가 검증했는가.

악성 업데이트를 막을 수 있는가.

데이터는 어디로 흐르는가.

실패했을 때 책임은 누구에게 있는가.

라이선스와 지식재산권은 명확한가.

에이전트가 실제 일을 할수록, 개발자 커뮤니티는 단순한 사용자 집단이 아니라 신뢰 인프라의 운영자가 된다.

한국은 빠른 사용자에 머물 것인가, 작업 표준의 생산자가 될 것인가

이 변화는 한국에도 중요하다.

한국 개발자들은 새 도구를 빠르게 받아들이는 데 강하다. AI 코딩 도구, 에이전트, 자동화 워크플로, MCP, n8n, 바이브 코딩을 둘러싼 실험과 해설도 빠르게 퍼졌다. AWS Summit Seoul 2026에서도 AI League 세션이 열렸고, 참가자들이 Bedrock AgentCore 위에서 모델 선택, 도구 연결, 프롬프트 설계를 구성해 에이전트로 미로를 푸는 핸즈온 경쟁을 벌였다.

하지만 빠른 사용만으로는 충분하지 않다.

한국이 이 흐름에서 단순 소비자로 남으면, 국내 기업의 업무흐름은 해외 모델과 해외 플랫폼 위에서 자동화되고, 그 위에 쌓이는 skill과 workflow의 표준마저 해외 생태계가 가져갈 가능성이 크다.

더 중요한 질문은 이것이다.

한국은 에이전트를 잘 쓰는 나라가 될 것인가, 아니면 에이전트가 일하는 방식을 정의하는 나라가 될 것인가.

한국에는 기회가 있다.

콘텐츠, 게임, 커머스, 제조, 금융, 교육, 팬덤 운영은 한국이 고밀도의 실행 데이터를 가진 영역이다. 이 산업들은 단순히 “AI를 붙이면 좋아지는” 분야가 아니다. 반복되는 작업흐름, 복잡한 승인 구조, 빠른 고객 피드백, 언어와 문화의 맥락이 강한 영역이다.

바로 이런 곳에서 한국형 skill rail이 나올 수 있다.

K-콘텐츠 제작 파이프라인을 위한 에이전트 skill.

게임 운영과 커뮤니티 관리를 위한 moderation workflow.

제조 현장의 품질 이슈를 추적하는 agentic workflow.

금융사의 규제 준수와 고객 응대를 동시에 만족시키는 검증형 skill.

글로벌 팬덤 데이터를 읽고 캠페인을 설계하는 마케팅 에이전트.

이것들은 단순 자동화가 아니다.

한국 산업의 암묵지를 에이전트가 실행할 수 있는 구조로 번역하는 일이다.

한국이 잡아야 할 위치는 “모델을 누가 만들었나”의 싸움만이 아니다.

모델 위에서 돌아가는 작업 표준, skill marketplace, MCP server, 검증 체계, 보안 기준, 산업별 workflow를 누가 설계하느냐의 싸움이다.

모델은 글로벌 빅테크가 주도할 가능성이 높다.

그러나 skill rail은 산업 맥락을 가진 플레이어가 만들 수 있다.

한국이 가진 진짜 자산은 거대 모델 자체가 아니라, 복잡한 산업 현장의 밀도 높은 문제들이다.

그 문제들이 잘 설계된 skill로 번역될 때, 한국은 에이전트 경제의 단순 사용자가 아니라 작업 표준의 생산자가 될 수 있다.

이제 별은 누가 일을 설계하는지에 찍힌다

2026년 봄 GitHub의 star가 보여준 것은 유행의 변화가 아니다.

개발 권력의 이동이다.

별은 모델에서 작업흐름으로 이동했다.

코드 생성에서 업무 위임으로 이동했다.

프롬프트에서 스킬로 이동했다.

개별 도구에서 레일과 표준으로 이동했다.

물론 모델 경쟁은 끝나지 않았다. 앞으로도 더 강한 모델은 계속 나올 것이다. 그러나 모델이 강해질수록 역설적으로 더 중요해지는 건 모델을 둘러싼 운영 구조다. 에이전트가 무엇을 기억하고, 어떤 도구를 호출하고, 어떤 권한으로 움직이며, 무슨 기준으로 스스로의 결과를 검증할지 정하는 구조가 경쟁력의 핵심이 된다.

GitHub의 star는 이 변화를 조용히 기록하고 있다.

개발자들은 이제 “누가 가장 똑똑한 모델을 만들었는가”만 보지 않는다.

“누가 그 모델을 실제 일에 쓸 수 있는 레일로 만들었는가”를 본다.

한국도 같은 질문 앞에 서 있다.

우리는 에이전트를 소비할 것인가, 아니면 에이전트가 일하는 방식을 설계할 것인가.

이 글이 좋았다면 눌러주세요

글쓴이