AI 일보 - 2026-02-11

키워드：AI 비디오, 에이전트 혁명, 대형 모델, Seedance 2.0, OpenClaw, GLM-5 아키텍처

🔥 포커스

ByteDance, Seedance 2.0 발표: AI 영상 ‘서사적 로직’ 시대로 진입 : ByteDance가 Seedance 2.0 영상 모델을 공식 발표하며, AI 영상이 OpenAI Sora 식의 ‘물리 시뮬레이션파’에서 ‘서사적 로직파’로 패러다임이 전환되었음을 알렸습니다. 이 모델은 완벽한 물리적 피드백에 집착하는 대신, Self-storyboarding 및 Auto-camera movement 기술을 통해 AI에게 감독의 사고방식을 부여하고 음향-화면 동기화 생성 및 매우 높은 인물 일관성을 지원합니다. Tim(Filmmaker Chase) 등 블로거들의 실측 결과, 카메라 워킹과 서사적 연속성 면에서 질적인 도약을 이루었다는 평가입니다. ByteDance는 2026년까지 AI 인프라에 1,600억 위안을 투입할 계획이며, Douyin 생태계의 ‘트렌드 감각’ 데이터를 활용해 영상 분야에서 OpenAI와 대등하거나 그 이상을 목표로 하고 있습니다 (출처: 36氪)

OpenClaw(샤오롱샤), 개인용 에이전트 혁명 촉발 : 독립 개발자 Peter Steinberger가 시작한 오픈소스 프로젝트 OpenClaw(구 명칭 Clawdbot)가 GitHub에서 별 17만 개를 기록하며 폭발적인 반응을 얻고 있습니다. 이 프로젝트는 시스템 권한을 획득하여 AI가 사용자의 컴퓨터를 직접 조작하고 파일을 처리하며 Markdown 기반의 장기 기억을 갖게 합니다. 커뮤니티에서는 이를 AGI로 가는 초기 단계로 보고 ‘Mac mini 격리 배포’ 열풍이 불고 있습니다. 능동성(Heartbeat mechanism)과 실행력은 놀랍지만, 그에 따른 개인정보 유출, 파일 오삭제 및 악성 플러그인 위험으로 인해 ‘고권한 에이전트’ 제어권에 대한 보안계의 치열한 논쟁이 이어지고 있습니다 (출처: 新智元)

GPT-5.3-Codex vs Claude Opus 4.6: 프로그래밍 모델 정점 대결 : OpenAI와 Anthropic이 프로그래밍 분야에서 정면 승부를 벌이고 있습니다. GPT-5.3-Codex는 WeirdML 등 추론 벤치마크에서 강력한 성능을 보이며 사용자 수가 50% 증가했으며, 실행 속도와 확실성을 추구하는 ‘효율적인 계약자’ 같다는 평가를 받습니다. 반면 Claude Opus 4.6은 복잡한 UI 디자인과 긴 논리 분석에서 더 뛰어난 연속성을 보여 ‘시니어 파트너’로 간주되지만, 매우 높은 Token 소모(평균 32k)와 비싼 ‘빠른 모드’ 비용으로 인해 사용자들의 불만을 사고 있습니다. 현재 두 모델은 GitHub 커밋 점유율에서 소프트웨어 개발 생태계를 빠르게 재편하고 있습니다 (출처: Reddit)

Zhipu GLM-5 아키텍처 세부 사항 노출: DeepSeek와 동일한 Sparse Attention : Zhipu AI의 차세대 플래그십 모델 GLM-5의 아키텍처 세부 사항이 vLLM의 PR 신청을 통해 유출되었습니다. GLM-5의 총 파라미터 수는 745B에 달하며, DeepSeek-V3와 유사한 MLA(Multi-head Latent Attention) 및 DSA(Sparse Attention) 메커니즘을 채택하고 200k Context를 지원합니다. 커뮤니티에서는 OpenRouter에서 놀라운 성능을 보인 익명 모델 ‘Pony Alpha’가 바로 GLM-5의 테스트 버전이라고 보고 있습니다. 이 모델의 뛰어난 창의적 글쓰기 및 논리 추론 성능은 자본 시장에서 Zhipu 관련 테마주의 연속 상승을 이끌고 있습니다 (출처: 量子位)

🎯 동향

OpenAI, ChatGPT 내 광고 기능 공식 테스트 시작 : OpenAI가 막대한 연산 비용을 충당하기 위해 미국 지역의 무료 버전 및 Go 버전 사용자를 대상으로 광고 테스트를 발표했습니다. 광고는 ‘스폰서 콘텐츠’ 링크 형식으로 나타나며, OpenAI는 광고가 모델 답변의 독립성을 간섭하지 않고 대화 내용이 광고주와 공유되지 않을 것이라고 약속했습니다. 이 조치는 슈퍼볼 광고에서 “AI 대화에 광고가 있어서는 안 된다”고 주장한 Anthropic의 공개적인 조롱을 받았습니다. 이는 대형 모델 상용화 경로가 ‘광고 트래픽파’와 ‘순수 구독파’로 공식 분화되었음을 의미합니다 (출처: 36氪)

Alibaba Qwen, 리테일 생태계 결합으로 AI 쇼핑 스트레스 테스트 개시 : Alibaba Qwen 앱은 ‘춘절 30억 위안 무료 증정’ 이벤트를 통해 AI 어시스턴트를 Taobao, Ele.me, Amap 등 생활 시나리오에 깊숙이 통합했으며, 출시 9시간 만에 주문량 1,000만 건을 돌파했습니다. 이는 단순한 마케팅을 넘어 ‘AI 기반 차세대 소비 OS’에 대한 스트레스 테스트입니다. 시장 전문가들은 Alibaba가 풀스택 AI 역량(칩+클라우드+모델)을 활용해 Google과 유사한 폐쇄형 생태계를 구축하고, AI를 통해 거래 단계에 직접 개입함으로써 이커머스 입구를 재정의하려 한다고 분석합니다 (출처: 36氪)

Kimi K2.5, 해외 매출 국내 추월… ‘엔지니어링 안정성’ 주력 : Moonshot AI는 Kimi의 해외 매출이 국내를 넘어섰으며 유료 사용자가 4배 증가했다고 밝혔습니다. Kimi K2.5는 긴 Context에서의 매우 높은 기억 안정성과 OpenClaw 등 Agent 프레임워크에 대한 우수한 지원 덕분에 해외 개발자들이 선호하는 국산 모델이 되었습니다. 양즈린 대표는 회사의 현금 보유액이 100억 위안을 초과하여 단기적으로 상장을 서두르지 않고, ‘Anthropic+Manus’ 방식의 생산성 에이전트 레이아웃으로 중심을 옮길 것이라고 전했습니다 (출처: 36氪)

ByteDance, Seedream 5.0 발표: 검색 기반 이미지 생성 및 4K 강화 지원 : 영상 모델에 이어 ByteDance의 이미지 모델 Seedream 5.0이 출시되었습니다. 새 버전은 처음으로 온라인 지식 통합 생성을 지원하여 복잡한 프롬프트 이해도와 텍스트 렌더링 능력을 크게 향상시켰습니다. 예술적 감각 면에서는 Google Nano Banana Pro에 다소 못 미치지만, 인포그래픽 생성, 다중 하위 이미지 일관성 및 중국어 의미 이해의 실용성이 대폭 강화되어 ‘예술적 장난감’에서 ‘생산성 도구’로 진화하고 있습니다 (출처: 36氪)

xAI 공동 창립자 Wu Yuhuai 퇴사, 핵심 팀의 지속적인 동요 : 일론 머스크 산하 xAI의 5인 중국인 창립 멤버 중 한 명인 Wu Yuhuai가 퇴사를 발표했습니다. Wu는 제프리 힌튼의 제자로, Grok 3의 수학적 추론 돌파구를 주도했습니다. 이는 양거(질병으로 퇴사)에 이어 한 달 사이 xAI에서 이탈한 두 번째 중국인 공동 창립자입니다. 외부에서는 이번 퇴사가 SpaceX의 xAI 인수 이후 구조 조정과 관련이 있을 것으로 추측하며, 이는 머스크의 ‘세계 시뮬레이터’ 비전에 인재 유출이라는 우려를 더하고 있습니다 (출처: 智东西)

🧰 도구

Cursor, Composer 1.5 발표: 강화 학습 기반의 엔드 투 엔드 코딩 : Cursor가 출시한 Composer 1.5 모델은 20배 규모의 강화 학습 훈련을 통해 지능과 속도 사이의 새로운 균형을 맞췄습니다. ‘Self-summary’ 기능을 도입하여 Context가 소진될 때 핵심 로직을 자동으로 요약하고 더 긴 주기의 프로젝트 개발을 지원합니다. 개발자들은 복잡한 버그 수정 시 GPT-5.2보다 더 선제적인 대응을 보여준다며 실리콘밸리 엔지니어들의 주력 도구로 자리 잡고 있습니다 (출처: ZhaiAndrew)

Skywork Desktop: Windows를 지원하는 최초의 시스템급 AI 어시스턴트 : Kunlun Tech가 출시한 Skywork Desktop은 Anthropic Cowork의 Windows 버전 부재를 메웠습니다. 운영체제에 깊숙이 통합되어 로컬 파일을 자동으로 분석하고 디자인 시안의 이름을 변경하며, 100개 이상의 엄선된 Skill(영상 다운로드, 문서 변환 등)을 제공합니다. 이 도구는 Gemini, Claude 등 주요 모델을 자유롭게 전환하여 호출할 수 있어 Windows 사무직 종사자들에게 진정한 ‘디지털 직원’ 경험을 제공합니다 (출처: op7418)

LobsterX: LlamaIndex 기반의 문서 처리 에이전트 : LlamaIndex가 출시한 LobsterX는 문서 워크플로우에 최적화된 OpenClaw 변체입니다. LlamaCloud를 활용해 고정밀 문서 파싱을 수행하며, 스캔본과 복잡한 도표가 포함된 PDF에서 100% 정확한 Context를 추출할 수 있습니다. 보안을 위해 AgentFS 가상 파일 시스템에서 실행되어 AI가 위험한 Shell 명령을 실행하는 것을 방지하므로 기업용 민감 문서 처리에 이상적인 솔루션입니다 (출처: jerryjliu0)

Transformers.js v4 발표: WebGPU 가속으로 100% 로컬 AI 구현 : Hugging Face가 새로운 C++ 기반 WebGPU 런타임을 채택한 Transformers.js v4 프리뷰 버전을 발표했습니다. 브라우저, Node.js, Deno에서 GPT-OSS 20B와 같은 대형 모델을 직접 실행할 수 있으며 속도가 최대 4배 향상되었습니다. 이번 업데이트는 진정한 완전 오프라인 지원을 실현하여 개발자가 클라우드 API에 의존하지 않는 개인정보 보호에 최적화된 AI 앱을 구축할 수 있게 합니다 (출처: HuggingFace)

Izwi: Rust 기반의 로컬 음성 추론 엔진 : Izwi는 TTS, ASR 및 음성 클로닝을 지원하는 완전 로컬 실행 오디오 AI 스택입니다. Rust(Candle/MLX)를 활용해 Apple Silicon 하드웨어 가속을 구현하고 OpenAI 호환 인터페이스를 제공합니다. 극강의 프라이버시와 낮은 지연 시간을 추구하는 음성 상호작용 개발자들에게 Izwi는 데이터 외부 유출 없는 SOTA급 솔루션을 제공합니다 (출처: Reddit)

📚 학습

Recursive Language Models (RLM): 2026년의 새로운 패러다임 : 논문 《Recursive Language Models》는 모델이 자신의 Prompt를 외부 조작 가능한 객체로 간주하고 재귀적 호출을 통해 무한한 길이의 Context를 처리하도록 제안했습니다. 실험 결과 RLM은 소설 《프랑켄슈타인》 전체의 캐릭터 추출과 같은 초장거리 작업에서 기존 코딩 에이전트보다 훨씬 뛰어난 성능을 보였습니다. 이러한 ‘자기 참조’ 메커니즘은 ‘추론 모델’에서 ‘재귀 모델’로의 도약을 이끌 것으로 기대됩니다 (출처: lateinteraction)

InftyThink+: 반복적 요약을 통한 무한 시야 추론 : 긴 사고 사슬(CoT) 비용이 길이에 따라 기하급수적으로 증가하는 문제를 해결하기 위해 InftyThink+ 프레임워크는 모델이 추론 과정에서 ‘단계별 요약’을 수행하도록 학습시킵니다. 모델은 각 단계에서 자기 요약을 생성하고 중복된 Context를 비움으로써 추론 깊이(AIME24 정확도 21% 향상)를 유지하면서도 추론 지연 시간을 32.8% 단축하여 계산 비용과 추론 길이의 탈동조화를 실현했습니다 (출처: dair_ai)

F-GRPO: 강화 학습의 ‘평범화’ 방지 : RLVR(검증 보상 기반 강화 학습)에서 대규모 그룹 샘플링 비용 문제로 모델이 평범한 해답에 치우치는 현상을 방지하기 위해 F-GRPO는 난이도 인지 이점 스케일링 계수를 도입했습니다. 성공률이 높은 프롬프트의 가중치를 낮추어 모델이 희귀하고 정확한 해법에 집중하도록 강제함으로써, 연산량 증가 없이 Qwen2.5 등 모델의 복잡한 수학 작업 성능을 크게 향상시켰습니다 (출처: _akhaliq)

STLE 프레임워크: AI에게 “모른다”고 말하는 법 학습시키기 : AI의 보편적인 문제인 ‘과잉 확신’과 환각 현상을 해결하기 위해 STLE 프레임워크는 집합값 이론을 활용해 지식 경계를 명확히 모델링합니다. ‘도달 가능성’ 점수를 계산하여 AI가 처음 보는 의료나 운전 시나리오에서 “40%만 확신함”과 같은 피드백을 주고 능동적으로 인간에게 처리를 넘기게 합니다. 실험 결과 OOD(분포 외) 탐지에서 67%의 정확도를 달성했습니다 (출처: Reddit)

AgentArk: 다중 에이전트 토론 능력을 단일 모델로 증류 : 연구에 따르면 다중 에이전트 토론은 논리력을 높이지만 추론 비용이 에이전트 수에 비례해 증가합니다. AgentArk는 오프라인에서 다중 에이전트 토론을 실행해 고품질 추론 궤적을 생성한 후, 이를 Qwen3와 같은 단일 모델에 증류합니다. 이 방법으로 단일 모델은 수학 및 TruthfulQA 작업에서 4.8%~30%의 성능 향상을 얻었으며, ‘다중 에이전트의 지능을 단일 에이전트의 비용으로’ 구현했습니다 (출처: dair_ai)

💼 비즈니스

SpaceX, xAI 인수 공식 발표… 머스크의 AI+우주 폐쇄 루프 구축 : 일론 머스크가 SpaceX의 xAI 인수를 완료했다고 발표했습니다. Grok의 추론 능력을 Starship 설계, 화성 식민지 계획 및 Starlink 네트워크 최적화에 깊이 통합하는 것이 목표입니다. 이번 합병으로 xAI는 더 안정적인 연산 자원과 자금 지원을 확보하게 되었으며, 동시에 ‘AI 기반 하드테크 제국’의 독점적 지위에 대한 광범위한 논의를 불러일으키고 있습니다 (출처: menhguin)

법률 AI 유니콘 Harvey, 2억 달러 투자 유치… 기업 가치 110억 달러 달성 : Harvey AI가 110억 달러의 기업 가치로 새로운 투자 라운드를 진행 중이며, ARR(연간 반복 매출)은 1.9억 달러에 달하고 10만 명 이상의 변호사에게 서비스를 제공하고 있습니다. Harvey의 성공은 고부가가치 및 프로세스화된 작업을 해결하는 수직 분야 에이전트의 거대한 상업적 잠재력을 증명하며, 전통적인 SaaS 모델이 ‘에이전트 대행’ 모델로 전환되고 있음을 예고합니다 (출처: Dorialexander)

Noematrix(穹彻智能), 수억 위안 투자 유치… Embodied AI 상용화 가속 : 중국 Embodied AI 기업 Noematrix가 C Capital이 주도한 시리즈 A 투자를 완료했습니다. 핵심 제품인 Noematrix Brain은 이미 스마트 약국, 호텔 세탁실 등에서 폐쇄형 배포를 실현했습니다. 회사는 자체 개발한 외골격 장비를 통해 수십만 시간의 실제 기기 데이터를 축적했으며, ‘데이터-모델-시나리오’의 폐쇄 루프를 통해 물리적 AI 분야에서 입지를 다지고 있습니다 (출처: 36氪)

🌟 커뮤니티

AI 피로도(AI Fatigue), 개발자들 사이에서 공감 화두로 부상 : 커뮤니티에서는 “AI가 생산성을 높였지만 나는 더 힘들다”는 논의가 뜨겁습니다. 개발자들은 자신이 ‘창조자’에서 AI가 생성한 파편화된 작업을 처리하고 끝없는 코드 검토를 수행하는 ‘코드 보조원’으로 전락했음을 발견하고 있습니다. 이러한 비결정성이 주는 불안과 의사결정 피로로 인해 업계에서는 AI를 통한 효율 향상이 인간의 에너지 한계를 소진시키고 있는 것은 아닌지 반성하고 있습니다 (출처: 36氪)

한국 국가 AI 경진대회 표절 논란: 참여 기업 60%가 중국 모델 기반 : 한국의 자체 AI 모델 선정 과정에서 Upstage, SK텔레콤 등 여러 진출 기업의 핵심 코드가 Zhipu AI, DeepSeek, Qwen 등과 매우 유사하다는 의혹이 제기되었습니다. 한국 네티즌들은 이에 대해 “기술적 우월감이 무너졌다”는 반응을 보였으며, 이 사건은 중견 국가들이 ‘주권 AI’를 추구할 때 직면하는 기술 공동화 현상과 미-중 오픈소스 생태계에 대한 깊은 의존도를 드러냈습니다 (출처: 36氪)

Vibe Coding으로 첫 수익 창출: 00년대생 대학생들의 성공기 : 커뮤니티에 ‘1인 기업’ 신화가 쏟아지고 있습니다. 대학생들이 Vibe Coding 도구로 앱을 빠르게 구축하고 계정 공유를 통해 월 수만 위안의 수익을 올리고 있습니다. 기술 장벽은 낮아졌지만, 커뮤니티는 이제 ‘취향(Taste)’과 ‘비즈니스 통찰력’이 새로운 필터가 되고 있으며 평범한 AI 작업물은 빠르게 디지털 쓰레기로 전락하고 있음을 깨닫고 있습니다 (출처: 36氪)

Anthropic 2026 트렌드 보고서: 프로그래머는 ‘지휘관’으로 변모할 것 : Anthropic이 발표한 18페이지 분량의 보고서에 따르면 2026년은 ‘에이전트 군단’의 원년이 될 것입니다. 소프트웨어 개발은 그래픽 인터페이스 이후 최대의 패러다임 전환을 겪고 있습니다. 엔지니어는 코드 작성에서 AI Agent 편성으로 역할이 바뀌고, 변호사나 HR 같은 비기술 전문가도 자연어를 통해 복잡한 시스템을 직접 구축하게 되면서 프로그래밍이 완전히 민주화될 것입니다 (출처: 36氪)

OpenClaw가 촉발한 ‘Mac mini’ 하드웨어 프리미엄 : OpenClaw의 인기에 힘입어 중고 시장에서 Mac mini(특히 M4 버전) 가격이 상승하고 있습니다. 전문가들은 물리적 격리가 고권한 에이전트를 실행하는 유일한 안전책이라고 믿고 있습니다. 이러한 ‘1기기 1에이전트’ 배포 모델은 AI 매니아들의 표준 구성이 되고 있으며, 심지어 에이전트 전용 하드웨어 분야까지 탄생시키고 있습니다 (출처: 36氪)

💡 기타

MechaEpstein-8000: 논란의 로컬 미세 조정 모델 : 개발자들이 엡스타인의 공개 이메일을 활용해 학습시킨 MechaEpstein이라는 Qwen3-8B 미세 조정 모델을 HuggingFace에 공개했습니다. 특정 인물의 대화 스타일을 모사할 수 있는 이 모델은 ‘디지털 생명’의 윤리, 데이터 저작권 및 AI가 논란이 되는 실존 인물을 모사해도 되는지에 대한 커뮤니티의 격렬한 논쟁을 불러일으켰습니다 (출처: karminski3)

GeoSpy AI: 사진으로 지리적 위치 유출, 프라이버시 공포 확산 : GeoSpy라는 AI 도구가 소셜 미디어 사진 속의 미세한 디테일(식생, 건축 양식 등)을 통해 촬영자의 좌표를 정확히 찾아낼 수 있습니다. 미아 찾기 등에는 유용할 수 있으나, 커뮤니티는 이 도구가 대규모 감시 도구로 전락할 것을 크게 우려하며 AI 시대 개인 생체 및 환경 정보 프라이버시에 대한 경종을 다시 한번 울리고 있습니다 (출처: Reddit)

아이작 뉴턴과 AI의 시공간을 초월한 연결 : 커뮤니티에서는 “모든 미래의 진보는 AI 덕분이지만, AI는 뉴턴 덕분이다”라는 논의가 활발합니다. 뉴턴이 정립한 고전 역학과 미적분 기초 없이는 현대 물리학과 계산 과학이 존재할 수 없었을 것이라는 의견입니다. AI의 IQ가 190을 돌파할 것으로 예측됨에 따라, 인류는 ‘무한한 수의 뉴턴’이 협력하는 새로운 시대를 맞이하고 있습니다 (출처: Reddit)

🔥 포커스

관련 태그

Related Posts

AI 일보 – 2026-07-19

AI 일보 – 2026-07-18

AI 일보 – 2026-07-17