AI 일보 – 2026-01-08(조간)

키워드:AI 슈퍼컴퓨팅 아키텍처, 대형 모델, AI 에이전트, 루빈 슈퍼컴퓨팅 아키텍처, 미로씽커 1.5, 다양체 제약 초연결

🔥 포커스

NVIDIA, Rubin 슈퍼컴퓨팅 아키텍처 발표: “삽을 파는 것”에서 “생산 워크숍을 파는 것”으로 전환 : 젠슨 황은 CES 2026에서 새로운 AI 슈퍼컴퓨팅 아키텍처인 Vera Rubin을 선보였습니다. 이 아키텍처는 단순한 그래픽 카드 업그레이드가 아니라 Vera CPU, Rubin GPU, NVLink 6 등 6개의 전용 칩이 통합된 수직 통합 시스템입니다. Rubin은 시스템 확장성 문제를 해결하기 위해 설계되었으며, Inference Throughput 10배 향상, Trillion-parameter 모델 학습 시 GPU 요구량을 Blackwell의 4분의 1로 절감, Token 비용을 10분의 1로 낮췄다고 발표했습니다. 이는 NVIDIA가 시스템 레벨 최적화를 통해 해자를 구축하고, 컴퓨팅 파워 스택을 “수동 조립”에서 “표준화된 생산 라인”으로 바꾸려 함을 의미하며, 저렴한 추론 시대의 도래를 예고합니다. (출처: 36氪, TheRundownAI)

英伟达发布Rubin超算架构

MiroThinker 1.5 전격 발표: 30B 모델로 GPT-5-High와 어깨를 나란히 : 첸톈차오(TCCI)가 후원하고 칭화대 부교수 다이지펑이 이끄는 MiroMind 팀이 MiroThinker 1.5를 발표했습니다. 이 모델은 단 30B 파라미터만으로 HLE, BrowseComp 등 고난도 벤치마크 테스트에서 GPT-5-High, DeepSeek-V3.2와 대등한 성능을 보였습니다. 핵심 기술은 “Interactive Scaling”으로, 모델이 더 깊고 빈번한 Agent와 환경 간의 상호작용을 처리하도록 훈련하여 성능을 높였습니다. 이 성과는 소규모 엘리트 팀이 올바른 아키텍처 선택(단순 Pre-training이 아닌 Agent 모델링에 집중)을 통해 여전히 AGI 프런티어에서 경쟁 구도를 재편할 수 있음을 증명했습니다. (출처: GitHub, ZhihuFrontier)

MiroThinker 1.5震撼发布

DeepSeek, Manifold-Constrained Hyper-Connections (mHC) 발표: Transformer 아키텍처의 중대한 돌파구 : DeepSeek 팀은 훈련 붕괴를 일으키지 않으면서 Residual Stream을 확장할 수 있는 새로운 방안을 제시한 논문 《Manifold-Constrained Hyper-Connections》를 발표했습니다. 이 기술은 초거대 모델 훈련 시 발생하는 불안정성, 확장성 및 메모리 오버헤드 문제를 해결합니다. CEO 량원펑이 직접 서명한 이 기술은 2015년 Transformer 탄생 이후 아키텍처에 대한 가장 근본적인 개선 중 하나로 평가받습니다. 실험 결과, 27B 파라미터와 60개 레이어 깊이의 모델에서 우수한 성능을 보였으며, 이는 DeepSeek V4가 더 깊고 넓은 아키텍처 설계를 채택할 가능성을 시사합니다. (출처: nrehiew_, Reddit)

DeepSeek发布流形约束超连接

Meta의 Manus 인수 거래, 중국 규제 당국의 심사 직면 : 소식통에 따르면 중국 상무부는 Meta가 AI Agent 스타트업인 Manus를 20억 달러에 인수하려는 거래가 기술 수출 통제 규정을 위반했는지 평가하고 있습니다. 심사의 핵심은 해당 팀이 중국에 머무는 동안 개발한 디지털 자산 및 기술을 싱가포르로 이전하는 것의 합법성 여부입니다. 이러한 움직임은 글로벌 AI 경쟁 배경 속에서 규제 기관이 최첨단 AI 인재와 핵심 기술 유출에 대해 매우 민감하게 반응하고 있음을 반영하며, 오픈소스 기여와 국경 간 기술 이전의 경계에 대한 심도 있는 논의를 불러일으킬 수 있습니다. (출처: dotey, teortaxesTex)

Meta收购Manus交易遭中国监管审查

🎯 동향

DeepSeek-R1 논문 대폭 업데이트: 22페이지에서 86페이지로 확장 : DeepSeek-R1의 기술 문서가 심층 보완되어 R1-Zero의 자기 진화 과정, 평가 세부 사항, Distillation 전략 및 심층적인 Ablation Study가 상세히 공개되었습니다. 이 행보는 커뮤니티에서 DeepSeek V4 또는 R2 출시의 전조로 여겨지며, Reinforcement Learning 및 Reasoning Model 분야에서의 깊은 내공을 보여줍니다. 새로운 내용은 연구자들이 추론 모델의 내적 논리를 이해하는 데 매우 가치 있는 참고 자료를 제공합니다. (출처: dejavucoder, MachineLearning)

DeepSeek-R1论文大幅更新

OpenAI, 비밀리에 펜 형태의 소비자 기기 개발: iPhone의 지위에 도전 : OpenAI가 코드명 “Third Core Device”로 불리는 펜 형태의 AI 하드웨어를 개발 중이라는 소문이 돌고 있습니다. 크기는 iPod Shuffle과 비슷하며, 마이크와 카메라를 탑재해 환경 인식 능력을 갖추고 있습니다. 핵심 기능은 손글씨 메모를 실시간으로 텍스트로 변환하여 ChatGPT에 업로드하는 것입니다. 이는 기존 스마트폰 시스템을 우회하여 네이티브 AI 하드웨어를 통해 사용자 상호작용 입구를 직접 점유하려는 OpenAI의 야심을 보여줍니다. (출처: Reddit)

Runway, GWM Worlds 발표: 실시간 환경 시뮬레이션 세계 모델 : Runway가 최신 세계 모델인 GWM Worlds를 선보였습니다. 사용자가 정적인 장면 이미지 한 장만 제공하면 모델이 실시간 기하학, 빛과 그림자, 물리 시뮬레이션을 포함한 몰입형 무한 탐색 가능 3D 공간을 생성합니다. 이 기술은 영화 제작 및 게임 개발에 새로운 대화형 환경 생성 수단을 제공하는 것을 목표로 하며, AI가 비디오 생성을 넘어 상호작용 가능한 세계 생성으로 도약했음을 상징합니다. (출처: c_valenzuelab)

DFlash: Speculative Decoding 기술로 Qwen3 속도 6.2배 가속 : Zhijian Liu 팀이 Block Diffusion을 이용한 Speculative Sampling 기술인 DFlash를 출시했습니다. Qwen3-8B에서 손실 없이 6.2배 가속을 구현했으며, 이는 EAGLE-3보다 2.5배 빠른 속도입니다. 이 기술의 핵심 논리는 “Diffusion Model이 초안을 작성하고, Autoregressive Model이 검증하는 것”으로, LLM의 느린 추론 속도 문제를 교묘하게 해결하며 Diffusion Model과 Autoregressive 아키텍처의 협업 잠재력을 보여주었습니다. (출처: jeremyphoward)

Tesla FSD, 최초의 100% 자율 미국 횡단 도전 완료 : 운전자 David Moss는 Tesla FSD를 사용하여 로스앤젤레스에서 머틀 비치까지 총 2,732마일의 여정을 인간의 개입 없이 완주했습니다. 여기에는 슈퍼차저 스테이션에서의 자동 주차도 포함되었습니다. 이는 End-to-End 신경망 기반의 자율주행 기술이 매우 높은 Robustness를 갖추었으며, 완전 무인 주행의 임계점에 근접하고 있음을 시사합니다. (출처: Reddit)

🧰 도구

Cursor, “Dynamic Context Discovery” 공개: 파일 시스템은 Agent의 궁극적인 메모리 : Cursor는 기술 블로그를 통해 파일 시스템으로 컨텍스트를 관리하는 전략을 설명했습니다. 긴 출력을 파일로 변환하고, 필요에 따라 Agent Skills를 로드하며, MCP 도구 설명을 최적화함으로써 품질을 유지하면서 Token 소모를 46.9% 줄였습니다. 핵심 관점은 방대한 정보를 미리 주입하여 모델을 방해하는 대신, 모델이 필요할 때 파일 시스템을 통해 능동적으로 검색하게 하는 것입니다. 이는 Manus의 “파일 시스템이 곧 컨텍스트”라는 이념과 일맥상통합니다. (출처: dotey, swyx)

Cursor揭秘“动态上下文发现”

Claude Desktop, 로컬 Claude Code 인터페이스 통합 : Anthropic이 데스크톱 앱을 업데이트하여 그래픽 인터페이스를 갖춘 Claude Code를 내장했습니다. 사용자는 사이드바에서 “Code” 모드로 전환하고 로컬 폴더를 선택하기만 하면 터미널이 아닌 환경에서도 Claude를 사용하여 코드 작성 및 파일 관리를 할 수 있습니다. 이는 AI 프로그래밍 도구의 진입 장벽을 크게 낮추어, 명령줄 조작에 익숙하지 않은 개발자도 Claude의 Agent 능력을 효율적으로 활용할 수 있게 합니다. (출처: op7418)

Claude Desktop集成本地Claude Code界面

Skywork, 비디오 Agent 출시: 전 과정 AI 비디오 편집 능력 : Skywork Videos Agent는 스토리보드 생성부터 소재 편집까지의 전체 워크플로우를 지원합니다. 사용자는 텍스트, 이미지 또는 첫 프레임과 마지막 프레임을 통해 비디오 소재를 생성하고, 오른쪽 편집기에서 음악과 음성을 직접 합성할 수 있습니다. 출시된 특수 효과 템플릿은 원클릭 재사용을 지원하며, AI Agent가 단일 콘텐츠 생성에서 복잡한 창의적 워크플로우 관리로 진화하고 있음을 보여줍니다. (출처: op7418)

NousCoder-14b: 오픈소스 경진대회급 프로그래밍 모델 : Nous Research가 Qwen3-14B를 기반으로 파인튜닝한 NousCoder-14b를 발표했습니다. 이 모델은 Atropos 프레임워크 하에서 48대의 B200으로 4일간 훈련되었으며, Verifiable Execution Rewards를 통해 Pass@1 정확도를 67.87%까지 높였습니다. 팀은 전체 RL 환경, 벤치마크 및 훈련 스택을 동시에 오픈소스화하여 복잡한 로직 프로그래밍 분야에서 오픈소스 커뮤니티의 역량 경계를 확장했습니다. (출처: tokenbender, huggingface)

NousCoder-14b

Memvid: AI Agent를 위한 단일 파일 Serverless 스토리지 레이어 : Memvid는 Rust로 작성된 휴대용 AI 메모리 시스템입니다. 비디오 인코딩 논리를 차용하여 데이터, 임베딩 및 검색 구조를 단일 .mv2 파일에 패키징하며, 5ms 미만의 로컬 검색 속도를 제공합니다. 이러한 설계는 AI Agent가 하드드라이브를 휴대하듯 장기 기억을 휴대할 수 있게 하며, 복잡한 RAG 파이프라인이나 서버 측 벡터 데이터베이스가 필요 없어 오프라인 우선 Agent 구축에 이상적입니다. (출처: GitHub)

Memvid

📚 학습

Rust 베테랑 Steve Klabnik, Claude와 협력하여 11일 만에 새로운 언어 Rue 개발 : 《The Rust Programming Language》의 저자 Steve Klabnik은 Claude의 도움을 받아 11일 동안 약 10만 줄의 Rust 코드를 작성하여 실험적인 시스템 레벨 언어인 Rue를 만들었습니다. 이 프로젝트는 AI가 언어 설계의 실험 비용을 어떻게 획기적으로 낮출 수 있는지 보여주며, 개발자가 번거로운 코드 작성에서 벗어나 추상화 설계와 제약 조건 정의에 집중할 수 있게 합니다. 이 사례는 “AI 시대에 여전히 새로운 프로그래밍 언어가 필요한가”에 대한 커뮤니티의 뜨거운 논쟁을 불러일으켰습니다. (출처: 36氪)

Steve Klabnik联手Claude打造新语言Rue

CogFlow 프레임워크: 인간의 인지 과정을 시뮬레이션하여 시각적 수학 난제 해결 : 논문에서 제안된 CogFlow 프레임워크는 “인식-내면화-추론”의 3단계를 통해 인간의 수학 문제 해결 논리를 시뮬레이션합니다. 도입된 “지식 내면화 보상 모델”은 모델이 지름길을 찾는 대신 시각적 단서를 진정으로 통합하도록 보장합니다. 논문과 함께 공개된 MathCog 데이터셋은 12만 개의 고품질 인식-추론 정렬 주석을 포함하고 있어 멀티모달 수학 추론 연구에 중요한 자원을 제공합니다. (출처: HuggingFace)

SOP 시스템: Vision-Language-Action (VLA) 모델을 위한 온라인 Post-training 방안 : SOP 시스템은 물리적 세계에서 로봇의 분산형 다중 작업 온라인 훈련을 구현했습니다. 폐쇄 루프 아키텍처를 통해 로봇 클러스터는 경험 스트림을 실시간으로 클라우드 학습기에 전송하고 비동기적으로 정책 업데이트를 수신합니다. 실험 결과, 몇 시간의 실제 상호작용만으로 옷 개기, 물건 진열 등 복잡한 작업에서 모델 성능을 크게 향상시킬 수 있었으며, 성능은 로봇 수에 따라 선형적으로 확장되었습니다. (출처: HuggingFace)

💼 비즈니스

Zhipu AI와 MiniMax, 홍콩 IPO 추진: 중국 거대 모델 유니콘들의 상장 붐 시작 : Zhipu AI와 MiniMax는 2026년 1월 홍콩 상장을 계획하고 있으며, 예상 조달 금액은 약 5억 5천만 달러, 기업 가치는 약 65억 달러입니다. Zhipu의 2024년 매출은 약 4,470만 달러, MiniMax는 약 3,050만 달러입니다. 무역 긴장 상황에도 불구하고 두 회사는 탄탄한 기술 모델과 사용자 기반(MiniMax 사용자 2.2억 명)을 바탕으로 여전히 매력적인 가치를 지닌 것으로 평가받으며, 중국 AI 산업이 자본 회수기에 진입했음을 상징합니다. (출처: bookwormengr, 36氪)

xAI, 200억 달러 투자 유치 완료: 기업 가치 2,300억 달러로 급등 : 일론 머스크의 xAI가 컴퓨팅 파워 구매 및 X 플랫폼에서의 AI 역량 확장을 위해 다시 200억 달러의 자금을 조달했습니다. xAI의 독특한 강점은 X 플랫폼의 실시간 데이터와 2.5억 명의 일일 활성 사용자를 보유하고 있다는 점입니다. 머스크의 전략은 “AI로 주의력을 구축하는 것”이며, Grok의 유머러스하고 반전통적인 스타일을 통해 OpenAI와 Anthropic의 포위망 속에서 차별화된 노선을 걷고 있습니다. (출처: TheRundownAI, Yuchenj_UW)

리카이푸의 2025년 요약: “세계의 공장”에서 “Agent 공장”으로 진화 : 01.AI의 CEO 리카이푸는 2025년이 추론 AI Agent의 원년이며, DeepSeek 모멘트가 ToB 시장을 재편했다고 지적했습니다. 그는 2026년에 “1인 1AI 팀” 시대에 진입할 것이며, 멀티 에이전트 시스템이 조립 라인이 산업을 재편했듯 조직을 재편할 것이라고 예측했습니다. 중국은 강력한 오픈소스 모델과 제조 기반을 바탕으로 글로벌 Agent 공장이 되어 조직 역량을 모듈화하고 24/7 배치할 수 있는 잠재력을 갖추고 있습니다. (출처: ZhihuFrontier)

李开复总结2025

🌟 커뮤니티

Noam Brown의 실험 반성: AI는 아직 도메인 전문가를 완전히 대체할 수 없다 : 최고의 AI 연구원 Noam Brown은 Codex와 Claude Code를 사용하여 포커 솔버를 작성하려 시도했습니다. AI가 개발 속도를 높일 수는 있지만, 알고리즘 로직, 프론트엔드 GUI 구현 및 혁신적인 알고리즘 연구 개발에서 여전히 빈번하게 오류를 범하거나 사용자를 “오도”했습니다. 그는 현재 AI가 “불안정한 컴파일러”에 더 가까우며, 깊은 도메인 배경지식이 필요한 연구 작업에서는 인간 전문가의 검증과 교정이 여전히 필수적이라고 생각합니다. (출처: polynoamial, SebastienBubeck)

Noam Brown实验反思

하드웨어 가격 경고: GPU, DRAM, NAND 가격 폭등 예고 : 커뮤니티 논의에 따르면 데이터 센터 수요 급증과 OpenAI 등 거대 기업의 생산 능력 쟁탈전 영향으로 2026년 1분기 메모리 계약 가격이 55-60% 상승할 것으로 예상되며, SSD 가격은 이미 두 배가 되었습니다. NVIDIA RTX 5090 가격은 5,000달러까지 치솟을 수 있습니다. 이는 개발자들이 더 효율적인 양자화 모델(예: FLUX.2 quantized)과 llama.cpp 같은 경량 추론 프레임워크로 눈을 돌리게 만들고 있습니다. (출처: Reddit)

硬件价格预警

프롬프트 엔지니어링의 종말? “Scratchpad” 법칙 유행 : 커뮤니티에서는 복잡한 Persona와 제약 조건을 작성하는 데 몇 주를 소비하는 것보다, AI에게 답변 전 <scratchpad>를 사용하여 브레인스토밍과 자기 비판을 하도록 간단히 요청하는 것이 더 효과적임을 발견했습니다. 이러한 “강제 사고” 모드는 논리 문제에서 대부분의 복잡한 프롬프트보다 뛰어난 성능을 보입니다. 프롬프트 엔지니어링의 핵심은 결국 모델이 “천천히” 생각하도록 만드는 방법에 불과하다는 의견이 지배적입니다. (출처: Reddit)

AI 앱 “급사(猝死) 열풍”: 2025년 평균 하루에 하나꼴로 AI 도구 사라져 : 통계에 따르면 2025년 전 세계적으로 약 400개의 AI 서비스가 중단되었으며, 중국 내에서도 Maopao Ya, Wow AI 등 유명 동반자형 앱들이 일제히 내려갔습니다. 실패의 주요 원인은 자생 능력이 없는 허수 트래픽, 단일 기능의 “무방비” 혁신, 그리고 규제 준수 마지노선 침범입니다. 이는 AI 창업이 “기술 과시 시대”에서 비즈니스 상식으로 회귀하고 있음을 상징하며, 실제 페인 포인트를 해결하는 제품만이 살아남을 수 있음을 보여줍니다. (출처: 36氪)

AI应用“猝死潮”

💡 기타

Agibot Genie Sim 3.0: Embodied AI 오픈소스 시뮬레이션 플랫폼 발표 : AGIBOT은 CES 2026에서 NVIDIA Isaac Sim을 통합한 Genie Sim 3.0을 출시하고, 1만 시간 이상의 실제 로봇 조작 합성 데이터셋을 제공했습니다. 이 플랫폼은 분 단위로 대규모 시뮬레이션 시나리오 생성을 지원하며, 고품질 3D 재구성 및 시각적 생성 기술을 통해 Embodied AI의 물리적 하드웨어 의존도를 낮추고 모델 반복 속도를 높이는 것을 목표로 합니다. (출처: ziran_pu)

AI의 바이러스 생성 위험에 대한 보안 우려 : 커뮤니티에서는 AI가 처음부터 바이러스를 설계할 수 있는 능력에 대해 열띤 토론이 벌어지고 있으며, 이것이 “완벽한 생물 무기”까지 단 한 걸음 남았다고 경고하고 있습니다. 이러한 논의는 기술이 새로운 병원체 제조에 악용되는 것을 방지하기 위해 생물학 분야의 거대 모델에 대한 규제와 가드레일 구축을 강화해야 한다고 촉구하며, 비디지털 분야에서 AI 거버넌스의 시급성을 강조합니다. (출처: Reddit)

AI创造病毒风险引发安全忧虑