newsletter중국AI알리바바바이트댄스AI영상생성로보틱스AI경쟁

중국 AI, 설 연휴에 쏟아진 신모델 — 로봇부터 영화급 영상까지, 무슨 일이 벌어졌나

2026-02-14
6 min read
1032 words

중국 AI, 설 연휴에 쏟아진 신모델 — 로봇부터 영화급 영상까지, 무슨 일이 벌어졌나

미국이 앤스로픽과 오픈AI에 시선을 빼앗기고 있는 사이, 중국의 테크 공룡들이 설 연휴를 기점으로 AI 신모델을 일제히 쏟아냈습니다. 로봇이 오렌지를 세고, 텍스트 한 줄로 영화급 영상이 만들어지는 시대. 그 이면에는 윤리 논란까지 엮여 있습니다.


'AI 전쟁은 미국에서만 벌어지는 것 아닌가?' 한 번쯤 그렇게 생각하셨을 겁니다. GPT, 클로드, 제미나이… 뉴스에 나오는 이름은 늘 미국 회사들이니까요.

그런데 2026년 2월 둘째 주, 중국에서 벌어진 일을 보면 생각이 달라집니다. 알리바바, 바이트댄스, 쾌수(快手), 즈푸AI까지 — 중국의 빅테크 4곳이 일제히 신모델을 공개했습니다. 그것도 설 연휴 기간에요.

구글 딥마인드의 CEO 데미스 허사비스는 올해 1월, CNBC 인터뷰에서 이렇게 말했습니다.

"중국의 AI 모델은 서방과 몇 달 차이밖에 나지 않는다."

그 '몇 달 차이'가 이번 주에 더 좁혀진 것 같습니다. 어떤 모델들이 나왔는지, 하나씩 살펴볼게요.


Chapter 1. 알리바바의 '린브레인' — 로봇에게 시공간 감각을 심다

알리바바의 연구 조직 다모 아카데미(DAMO Academy)가 공개한 모델의 이름은 린브레인(RynnBrain)입니다. 한마디로 말하면, 로봇이 세상을 이해하도록 돕는 AI예요.

데모 영상을 보면 이런 장면이 나옵니다. 집게 모양의 손을 가진 로봇이 탁자 위 오렌지 개수를 세고, 하나하나 집어 바구니에 담습니다. 냉장고에서 우유를 꺼내기도 하고요.

'그게 뭐가 대단해?' 싶을 수 있지만, 로봇에게 "오렌지"라는 물체를 인식시키는 것만으로도 엄청난 학습 데이터가 필요합니다. 과일 하나 집는 게 사람에겐 쉽지만, 기계에겐 아직 도전적인 과제예요.

허깅페이스(Hugging Face)의 연구원 아디나 야케푸는 린브레인의 핵심을 이렇게 설명합니다.

"린브레인의 핵심 혁신은 시간과 공간에 대한 인식이 내장되어 있다는 것입니다. 로봇이 단순히 즉각적인 입력에 반응하는 게 아니라, 언제 어디서 무슨 일이 일어났는지 기억하고, 여러 단계에 걸쳐 작업을 이어갈 수 있습니다."

쉽게 말하면, '기억하는 로봇'입니다. 지금까지 로봇은 눈앞의 명령에만 반응했다면, 린브레인은 과거의 맥락을 이어갈 수 있다는 거예요.

이 모델은 오픈소스로 공개되었습니다. 개발자라면 누구나 무료로 사용 가능합니다. 이로써 알리바바는 엔비디아, 구글과 같은 '로봇 AI' 분야에 본격적으로 뛰어든 셈이죠.

graph TD
    subgraph 기존로봇 ["🔴 기존 로봇 AI"]
        A["즉각 입력만 처리"] --> B["단일 작업 수행"]
        B --> C["맥락 기억 불가"]
    end

    subgraph 린브레인 ["🟢 린브레인 (RynnBrain)"]
        D["시공간 인식 내장"] --> E["다단계 작업 연속 수행"]
        E --> F["과거 맥락 기억 + 활용"]
    end

Chapter 2. 바이트댄스의 '시댄스 2.0' — 7만 원으로 영화를 만들다

틱톡의 모회사 바이트댄스가 내놓은 시댄스 2.0(Seedance 2.0)은 AI 영상 생성 모델입니다. 텍스트를 입력하면 영상이 만들어지고, 이미지나 다른 영상을 프롬프트에 넣을 수도 있습니다.

CNBC가 직접 확인한 시댄스 2.0 결과물은 "상당히 사실적"이었다고 합니다. 중국 테크 커뮤니티에서는 오픈AI의 소라(Sora)와 쾌수의 클링(Kling)을 카메라 움직임과 일관성 면에서 넘어섰다는 평가가 나왔어요.

스톡홀름에서 AI 생성 콘텐츠를 제작하는 광고 에이전시를 운영하는 빌리 보만은 이렇게 말합니다.

"2023년만 해도 사람이 걷거나 뛰는 장면을 만들기 어려웠습니다. 짧은 클립, 느린 속도, 엉성한 텍스처가 전부였죠. 지금은 완전히 뒤집혔습니다. 이제 무엇이든 만들 수 있어요. 기술 발전이 정말 놀랍습니다."

한국 뉴스1에 따르면, 시댄스 2.0으로 약 7만 원이면 2분짜리 영화급 영상을 완성할 수 있다고 합니다. 영상 제작의 비용 장벽이 사실상 무너지고 있는 겁니다.

그런데, 윤리 문제가 터졌습니다

시댄스 2.0에는 사진 한 장으로 그 사람의 목소리를 복제하는 기능이 있었습니다. 한 중국 블로거가 "동의 없이 목소리가 생성된다"며 문제를 제기했고, 바이트댄스는 이 기능을 즉각 중단했습니다.

기술이 빠르게 진화할수록, '할 수 있다'와 '해도 되는가'의 간극도 커진다는 걸 보여주는 사례입니다.


Chapter 3. 쾌수의 '클링 3.0' — 주가 50% 상승의 원동력

틱톡의 중국 내 경쟁자인 쾌수(Kuaishou)도 가만있지 않았습니다. 지난주 공개한 클링 3.0(Kling 3.0)은 영상 생성 분야에서 바이트댄스와 직접 경쟁하는 모델입니다.

핵심 업그레이드 포인트는 이렇습니다.

항목 클링 3.0 업그레이드 내용
🎬 영상 길이 최대 15초까지 확장
🖼️ 화질 포토리얼리스틱(사진 수준) 출력
🔊 오디오 다국어·방언·억양 지원 음성 자동 생성
🎯 일관성 프레임 간 일관성 대폭 향상

현재 유료 구독자만 이용할 수 있지만, 곧 일반 공개될 예정입니다.

쾌수의 클링 모델 시리즈는 회사 주가 상승의 핵심 동력이었습니다. 지난 1년간 주가가 50% 넘게 올랐는데, 그 배경에 클링이 있습니다.


Chapter 4. 나머지 플레이어들 — 즈푸AI와 미니맥스

이번 주의 모델 러시는 여기서 끝이 아닙니다.

① 즈푸AI(Zhipu AI)의 GLM-5

홍콩 증시에서 '지식도감(Knowledge Atlas Technology)'이란 이름으로 거래되는 즈푸AI가 GLM-5를 공개했습니다. 오픈소스 대형언어모델(LLM)로, 코딩 능력과 장기 에이전트 작업에 특화되어 있어요.

즈푸AI는 "코딩 벤치마크에서 앤스로픽의 클로드 오퍼스 4.5에 근접하고, 구글의 제미나이 3 프로를 일부 테스트에서 앞섰다"고 주장했습니다. 다만 CNBC는 이 주장을 직접 검증하지는 못했습니다.

② 미니맥스(MiniMax)의 M2.5

미니맥스도 업데이트된 오픈소스 모델 M2.5를 발표했습니다. AI 에이전트(자동화 작업 수행 AI) 도구가 강화된 것이 특징입니다.

두 회사 모두 발표 당일 주가가 급등했습니다.


Chapter 5. 미·중 AI 경쟁, 지금 어디까지 왔나

이번 주를 한마디로 정리하면 이렇습니다.

미국이 소프트웨어와 금융 서비스에 AI를 적용하는 데 집중하는 동안, 중국은 로보틱스와 영상 생성이라는 '물리적 AI'에서 빠르게 치고 올라왔습니다.

pie title 이번 주 중국 AI 신모델 분야별 분포
    "로보틱스 (알리바바 린브레인)" : 20
    "영상 생성 (시댄스·클링)" : 40
    "LLM·코딩 (GLM-5·M2.5)" : 30
    "이미지 생성 (기타)" : 10

특히 주목할 점은 오픈소스 전략입니다. 알리바바의 린브레인, 즈푸AI의 GLM-5, 미니맥스의 M2.5 모두 오픈소스로 풀렸습니다. 누구나 가져다 쓸 수 있다는 뜻이에요. 기술 확산 속도가 미국의 폐쇄형 모델 전략과 대비됩니다.

그러나 빛이 있으면 그림자도 있습니다. 시댄스 2.0의 음성 복제 논란이 보여주듯, 빠른 기술 발전에는 반드시 윤리적 안전장치가 따라와야 합니다.


💭 이 글을 읽고 생각해볼 질문

  1. 중국의 AI 영상 생성 모델이 윤리적 논란을 해결하면서도, 서방 벤치마크와의 성능 격차를 어떻게 좁혀갈 수 있을까?

  2. 로봇에게 '시공간 인식'을 부여하는 기술이 일상으로 들어오면, 우리의 노동과 생활은 어떻게 달라질까?

  3. 중국의 오픈소스 전략과 미국의 폐쇄형 전략 — 글로벌 AI 생태계에 어느 쪽이 더 큰 영향을 미칠까?

댓글로 당신의 생각을 공유해주세요.

배움의 달인 뉴스레터

이번 주 중국발 AI 소식을 정리하면서, 한 가지 감상이 남았습니다. 기술의 속도는 상상보다 빠르고, 그 속도가 만들어내는 질문들은 아직 답이 없다는 것. 7만 원에 영화를 찍을 수 있는 세상에서, 정말 중요해지는 건 '무엇을 만들 것인가'가 아니라 '왜 만드는가'가 아닐까요.

"기술이 빠르게 진화할수록, '할 수 있다'와 '해도 되는가'의 간극에서 우리의 판단력이 시험받는다."

Sources


이 글이 도움이 되셨다면, 한 명의 친구에게 공유해주세요.

Back to All Posts
NEW

뉴스레터 서비스가 정식 시작되었습니다!

매주 금요일, 옵시디언으로 정리한 AI 인사이트를 메일함으로 배달해 드립니다.