AI 비용위기: 토큰은 공짜 노동자가 아니다
🎧 Voice Briefing
📅 Generated: 2026. 5. 25. 오후 12:10:27

AI 비용위기: 토큰은 공짜 노동자가 아니다
프롤로그: AI가 사람보다 싸다는 믿음
AI는 정말 사람을 대체해서 비용을 줄여줄까?
처음에는 그렇게 보인다.
회의록을 요약하고, 코드를 고치고, 검색을 대신하고, 초안을 만든다. 한 사람이 하던 일을 몇 분 만에 끝내는 장면은 분명하다. 그래서 많은 조직은 AI를 "생산성 보너스"로 받아들였다.
하지만 조직 전체가 매일 수천 번, 수만 번, 수십만 번 호출하기 시작하면 질문이 바뀐다.
AI는 공짜 노동자가 아니라 사용량 기반 인프라다.
문제는 AI가 비싸다는 단순한 말이 아니다. 문제는 많은 조직이 AI를 소프트웨어 구독처럼 예산화하면서, 실제로는 클라우드 컴퓨팅처럼 소비하고 있다는 데 있다.
Microsoft가 내부 엔지니어들에게 Claude Code 사용 축소와 GitHub Copilot CLI 전환을 요구했다는 보도, Uber가 Claude Code 같은 AI 코딩 도구 사용 증가로 연간 AI 예산을 몇 달 만에 소진했다는 보도는 모두 같은 구조를 가리킨다.12
하이프가 끝났다는 뜻이 아니다.
AI가 진짜 업무 도구가 되었기 때문에, 이제 비용도 진짜 문제가 되었다는 뜻이다.
I - 토큰은 새로운 전기요금이다
AI 비용은 좌석 수만으로 설명되지 않는다.
전통적인 SaaS는 비교적 단순했다. 한 명당 월 얼마. 조직은 사람 수를 세고, 연간 계약을 맺고, 예산을 고정했다. 그런데 생성형 AI, 특히 코딩 에이전트는 다르다.
사용자는 한 명이어도, 그 한 명이 하루에 얼마나 긴 컨텍스트를 보내는지, 몇 번 재시도하는지, 어떤 모델을 쓰는지, 에이전트가 내부에서 몇 단계 추론을 반복하는지에 따라 비용이 달라진다.
더 중요한 것은 이 비용이 눈에 잘 보이지 않는다는 점이다.
전기요금은 계량기가 있다. 클라우드 서버는 인스턴스와 트래픽 지표가 있다. 그런데 AI 도구는 종종 "생산성 도구"라는 이름으로 들어온다. 그래서 처음에는 예산 항목이 아니라 문화 변화처럼 보인다.
하지만 실제 비용 구조는 문화가 아니라 인프라에 가깝다.
flowchart LR A[개인 생산성 도구 도입] --> B[팀 단위 확산] B --> C[에이전트형 반복 호출 증가] C --> D[토큰 사용량 폭증] D --> E[예산 초과] E --> F[도구 통제와 모델 라우팅]
Microsoft 사례는 이 지점을 잘 보여준다. 보도에 따르면 Microsoft의 일부 조직은 Claude Code 사용을 줄이고 GitHub Copilot CLI로 옮기도록 안내받았다. 공식 명분은 내부 저장소, 보안 기대치, 워크플로에 더 잘 맞는 도구를 직접 조정할 수 있다는 점이었다. 동시에 여러 매체는 회계연도 종료와 비용 절감 압박도 배경으로 해석했다.13
즉, "어떤 모델이 더 똑똑한가"만의 문제가 아니다.
누가 비용을 통제할 수 있는가.
누가 내부 워크플로에 맞게 도구를 조정할 수 있는가.
누가 같은 품질을 더 낮은 단위비용으로 제공할 수 있는가.
이 질문이 AI 도입의 중심으로 들어오고 있다.
II - Uber 사례가 말해주는 것
Uber 사례는 더 직접적이다.
The Information 보도에 따르면 Uber의 AI 코딩 도구 사용, 특히 Claude Code 사용 증가가 2026년 전체 AI 예산을 몇 달 만에 소진하게 만들었다. 이후 Forbes 등은 이 사례를 엔터프라이즈 AI 비용 통제 문제로 해석했다.24
여기서 조심해야 할 점이 있다. 온라인에서는 "AI가 실패했다", "토큰이 인건비보다 비싸졌다"처럼 말이 커지기 쉽다. 하지만 핵심은 실패가 아니라 확산이다.
AI 도구가 쓸모없어서 비용 문제가 생긴 것이 아니다.
쓸모가 있었기 때문에 너무 빨리 퍼졌고, 너무 많이 쓰였고, 기존 예산 모델이 따라가지 못했다.
이것은 기업 입장에서 꽤 낯선 종류의 성공이다.
| 과거의 생산성 도구 | AI 코딩 에이전트 |
|---|---|
| 좌석 수 중심 비용 | 사용량과 모델 호출 중심 비용 |
| 예산 예측이 비교적 쉬움 | 파워 유저와 자동 반복 호출이 비용을 흔듦 |
| 도입률이 높아도 비용 증가가 완만함 | 도입률과 사용 강도가 함께 오르면 비용이 급증 |
| 관리 포인트는 라이선스 | 관리 포인트는 토큰, 모델, 컨텍스트, 재시도, 권한 |
"토큰 비용 폭탄"이라는 말은 과장처럼 들릴 수 있다. 하지만 기업 재무 관점에서는 꽤 정확한 은유다.
문제는 한 번의 호출 가격이 아니다.
문제는 호출이 업무 습관이 되는 순간이다.
개발자가 검색 대신 AI에게 묻는다. 코드 리뷰 전에 AI에게 고치게 한다. 테스트 실패를 AI에게 맡긴다. 문서 작성, 리팩터링, 분석, 배포 스크립트까지 모두 AI를 통과한다.
그 결과 업무는 빨라질 수 있다.
동시에 비용도 업무 속도만큼 빨라진다.
III - 진짜 경쟁력은 모델 성능이 아니라 단위경제다
AI 도구 경쟁은 지금까지 주로 성능 경쟁처럼 보였다.
더 긴 컨텍스트.
더 좋은 코딩 능력.
더 자연스러운 대화.
더 많은 에이전트 기능.
하지만 기업 내부에서는 다음 경쟁이 이미 시작됐다.
같은 결과를 더 적은 토큰으로 만드는 조직이 이긴다.
여기에는 세 가지 능력이 필요하다.
첫째, 모델 라우팅이다.
모든 작업에 가장 비싼 모델을 쓰면 안 된다. 초안, 검색, 포맷 정리, 단순 리팩터링, 테스트 로그 요약은 더 싼 모델이나 로컬 모델로 충분할 수 있다. 반대로 아키텍처 판단, 보안 검토, 복잡한 장애 분석은 비싼 모델을 쓰는 편이 낫다.
둘째, 컨텍스트 절약이다.
AI 비용은 질문 하나의 길이만이 아니라, 매번 붙여 넣는 문맥의 양에서 커진다. 저장소 전체를 던지는 습관, 긴 로그를 줄이지 않고 넣는 습관, 같은 설명을 매번 반복하는 습관은 모두 비용이 된다.
셋째, 결과 검증이다.
비용을 썼으면 결과가 남아야 한다. 코드가 병합됐는가. 테스트가 통과했는가. 문서가 실제로 배포됐는가. 고객 문제가 줄었는가. AI 사용량 자체를 성과처럼 보는 순간, 조직은 생산성이 아니라 소비량을 최적화하게 된다.
이 지점에서 AI FinOps가 중요해진다.
클라우드 시대에 기업이 서버 비용을 추적하고, 태깅하고, 권한을 나누고, 비용 알림을 만들었던 것처럼, AI 시대에는 토큰 비용도 같은 방식으로 다뤄야 한다.
IV - 인간을 다시 채용하게 될까?
"결국엔 인간을 다시 채용해서 인간-인공지능이 같이 일하게 되는 광경이 만들어질 것 같다."
나는 이 말이 꽤 정확하다고 본다.
AI가 사람을 완전히 대체하는 방향보다, 사람과 AI의 역할을 다시 나누는 방향이 더 현실적이다. 비용 때문이다. 품질 때문이다. 책임 때문이다.
AI는 반복과 확장에 강하다.
사람은 문제 정의, 맥락 판단, 비용 대비 가치 판단에 강하다.
그래서 앞으로 중요한 직무는 "AI를 많이 쓰는 사람"이 아니라 "AI를 어디에 쓰지 않을지 아는 사람"이 될 가능성이 크다.
무조건 자동화하는 사람보다, 자동화의 손익분기점을 계산하는 사람이 더 중요해진다.
무조건 최신 모델을 붙이는 사람보다, 작은 모델과 큰 모델을 섞어 워크플로를 설계하는 사람이 더 중요해진다.
무조건 빠르게 만드는 사람보다, 빠르게 만든 결과가 유지보수 가능한지 검증하는 사람이 더 중요해진다.
AI 비용위기는 AI의 끝이 아니다.
AI 사용법이 아마추어 단계에서 운영 단계로 넘어가는 신호다.
생각해볼 질문
-
우리 조직이나 개인 작업에서 AI를 쓰는 비용은 실제로 측정되고 있는가, 아니면 "편하니까 쓴다"에 머물러 있는가?
-
가장 비싼 모델을 써야 하는 작업과, 더 싼 모델이나 사람의 판단이 나은 작업을 구분하고 있는가?
-
AI 사용량이 늘어나는 것이 진짜 생산성 증가인지, 단지 토큰 소비량 증가인지 어떻게 증명할 수 있는가?
결론: 비용을 모르는 자동화는 새로운 낭비다
AI를 쓰지 말자는 이야기가 아니다.
오히려 반대다. 이제 AI는 충분히 유용해졌기 때문에, 더 엄격하게 운영해야 한다.
초기의 AI 도입은 "써보자"였다.
다음 단계의 AI 도입은 "어디에, 어떤 모델로, 얼마까지, 어떤 증거를 남기며 쓸 것인가"가 되어야 한다.
개인에게도 마찬가지다.
AI를 쓰면 시간이 절약된다. 하지만 생각 없이 쓰면 판단력이 줄고, 비용은 늘고, 결과물의 품질은 평균으로 수렴한다.
기업에게도 마찬가지다.
AI를 쓰면 개발 속도가 올라갈 수 있다. 하지만 통제 없이 쓰면 예산이 먼저 녹고, 나중에는 도구 사용을 다시 제한해야 한다.
진짜 AI 역량은 많이 호출하는 능력이 아니라, 필요한 순간에 필요한 만큼만 호출하는 능력이다.
앞으로의 승자는 AI를 가장 요란하게 쓰는 조직이 아닐 것이다.
가장 조용하게, 가장 싸게, 가장 정확하게 운영하는 조직일 것이다.
오늘 바로 할 일은 단순하다. 내가 매일 쓰는 AI 작업을 세 가지로 나눠보자. 반드시 써야 하는 일, 싼 모델로 충분한 일, 사람의 판단이 먼저인 일. 그 구분이 생기는 순간, AI는 장난감이 아니라 운영 체계가 된다.
출처
Footnotes
-
TechRadar, 「Microsoft may discontinue Claude Code internally as it looks to push users towards GitHub Copilot」, 2026-05-15. https://www.techradar.com/pro/microsoft-may-discontinue-claude-code-internally-as-it-looks-to-push-users-towards-github-copilot ↩ ↩2
-
The Information, 「Uber CTO Shows How Claude Code Can Blow Up AI Budgets」, 2026-04. https://www.theinformation.com/articles/uber-cto-shows-claude-code-can-blow-ai-budgets ↩ ↩2
-
Windows Central, 「Microsoft cancels Claude Code licenses, shifting developers to GitHub Copilot CLI」, 2026-05-15. https://www.windowscentral.com/microsoft/microsoft-cancels-claude-code-licenses-shifting-developers-to-github-copilot-cli-a-move-likely-driven-by-financial-motives ↩
-
Forbes, 「Uber Burns Its 2026 AI Budget In Four Months On Claude Code」, 2026-05-17. https://www.forbes.com/sites/janakirammsv/2026/05/17/uber-burns-its-2026-ai-budget-in-four-months-on-claude-code/ ↩