AI 일보 – 2026-01-07(석간)

키워드:AI 기술, CES 2026, 휴머노이드 로봇, 베라 루빈 아키텍처, 알파마요 모델, 튜링-AGI 테스트

🔥 포커스

NVIDIA, Vera Rubin 아키텍처 및 Alpamayo 모델 발표 : 젠슨 황은 CES 2026에서 “물리적 AI의 ChatGPT 모먼트”가 도래했다고 선언했다. 차세대 Rubin 아키텍처는 6개의 협업 설계 칩을 포함하며, 추론 성능은 Blackwell의 5배, 비용은 10배 절감되어 현재 전면 양산에 들어갔다. 동시에 출시된 Alpamayo는 세계 최초의 오픈 소스 자율주행 추론 모델로, 시각-언어-행동(VLA) 사고의 사슬(Chain of Thought)을 도입해 인간처럼 의사결정 로직을 설명할 수 있다. 이는 NVIDIA가 단순한 연산 능력 공급업체에서 물리적 지능 인프라 제공업체로 전환하여 “추론 기반”으로 자율주행의 롱테일 문제를 해결하려는 시도를 상징한다. (출처: nvidia, 36氪)

英伟达发布Vera Rubin架构与Alpamayo模型

AMD, 리페이페이(Li Fei-fei)와 손잡고 “공간 지능” 및 Helios 플랫폼 주력 : 리사 수는 CES에서 Yotta급 연산 능력을 지향하는 Helios 랙 플랫폼을 선보였다. 단일 랙에 72개의 MI455 GPU를 통합하여 2.9 Exaflops의 연산 능력을 갖췄다. World Labs의 CEO로서 무대에 함께 선 리페이페이는 AI가 언어 지능을 넘어 공간 이해 능력을 갖춘 세계 모델(World Model)로 나아가야 한다고 강조했다. World Labs의 세계 모델은 AMD 플랫폼에서 추론 성능이 4배 향상되었으며, 단 한 장의 사진을 상호작용 가능한 3D 공간으로 복원할 수 있다. AMD의 이번 행보는 클라우드 연산, 기업용 배포 및 공간 지능 분야에서의 전방위적인 야심을 드러내며 NVIDIA의 패권에 도전장을 내밀었다. (출처: AMD, 36氪)

AMD联手李飞飞发力“空间智能”与Helios平台

Boston Dynamics Atlas 양산형, 현대자동차 공장 투입 : 완전 전동식 Atlas 휴머노이드 로봇이 CES 2026에서 공식 데뷔하며 “공장 투입”을 선언했다. 신형 Atlas는 56개의 자유도와 전 회전 관절을 갖추고 있으며, 한 손으로 50kg의 중량물을 들어 올릴 수 있고 촉각 감지 기능도 탑재했다. 현대자동차는 2028년부터 조지아주 공장에 대규모로 배치하여 부품 분류 등의 작업을 수행할 계획이다. 이와 동시에 Unitree, Zhiyuan 등 중국 로봇 군단이 대거 해외 전시회에 참가하며 높은 인도 속도와 현장 적응력을 과시했다. 휴머노이드 로봇이 실험실의 Demo를 넘어 실제 산업 양산 단계로 진입하고 있다. (출처: 36氪, 凤凰网科技)

波士顿动力Atlas量产版入驻现代工厂

앤드류 응(Andrew Ng), “Turing-AGI 테스트” 새로운 표준 제안 : 앤드류 응은 단순한 텍스트 채팅 테스트를 폐기하고, 대신 AI가 경제적으로 유용한 업무를 완수하는 능력을 측정할 것을 제안했다. 새로운 테스트는 AI가 인터넷, 브라우저, Zoom이 설치된 컴퓨터에서 원격 근무자처럼 며칠 동안 업무(예: 고객 응대 교육 및 실습)를 수행하도록 요구한다. 그는 현재 공개된 Benchmark(예: GPQA)들이 심각한 문제 풀이 최적화 현상을 겪고 있다고 지적하며, “Turing-AGI 테스트”가 업계의 거품을 걷어내고 AI 능력에 대한 사회적 기대를 재조정(recalibrate)할 수 있을 것이라고 주장했다. (출처: AndrewYNg, dotey)

吴恩达提出“图灵-AGI测试”新标准

🎯 동향

Liquid AI, LFM 2.5 시리즈 온디바이스 대형 모델 출시 : Liquid AI는 온디바이스 Agent 애플리케이션을 겨냥한 12억 파라미터 규모의 LFM 2.5를 출시했다. M5 칩 탑재 노트북에서 28k token을 처리하는 데 6초 미만이 소요되며, 속도는 5000 tok/s를 상회한다. LFM 2.5-Audio 버전은 실시간 음성 인식(ASR) 및 음성 합성(TTS)을 지원하며, 로컬에서 실행되어 엔드 투 엔드 음성 처리를 구현함으로써 기존 파이프라인의 정보 손실을 줄였다. 이는 온디바이스 AI 하드웨어에 이상적인 선택이다. (출처: awnihannun, Liquid AI)

Liquid AI发布LFM 2.5系列端侧大模型

재귀 언어 모델(RLM) 연구 열풍 : 스탠퍼드 연구팀은 프롬프트를 심볼릭 객체로 외부화하고 모델이 재귀적 도구 호출을 수행할 수 있도록 하는 RLM 프레임워크를 제안했다. 이는 초장문 요청 처리 능력을 획기적으로 향상시킨다. 커뮤니티에서는 향후 모든 LLM이 자신의 프롬프트에 대한 심볼릭 접근 권한을 가져야 한다고 논의하고 있다. 이 방법은 Claude Code 등의 도구에서 이미 초기 실무에 적용되었으며, LLM의 시맨틱 부하 하에서의 무결성 문제를 해결할 핵심 경로로 간주된다. (출처: lateinteraction, _akhaliq)

Scaling Law 논쟁 및 추론 연산 능력으로의 전환 : 업계는 사전 학습 연산 능력에서 추론/연구 연산 능력으로의 S-커브 전이를 겪고 있다. Sara Hooker는 학습 연산 능력과 성능의 관계가 변화하고 있으며, 단순히 파라미터를 쌓는 시대는 끝났을 수 있다고 지적했다. Ilya Sutskever 역시 이전에 연구의 시대로 회귀할 것임을 시사한 바 있다. 커뮤니티는 계산 이득이 사라진 것이 아니라 강화 학습(RL)과 테스트 시간 계산(Test-time compute)으로 옮겨갔다고 보고 있다. (출처: sarahookr, teortaxesTex)

DatologyAI, VLM 평가 벤치마크 DatBench 발표 : 현재 멀티모달 모델(VLM) 평가의 노이즈 문제에 대해, 연구자들은 샘플의 70%가 이미지를 보지 않고도 풀 수 있으며 42%에 라벨링 오류가 있음을 발견했다. DatBench는 맹목적으로 풀 수 있는 샘플을 제거하고 객관식 문제를 생성형 형식으로 변경함으로써 평가 계산량을 10배 이상 줄이는 동시에 모델 능력을 구분하는 신호 품질을 높였다. (출처: code_star, BlackHC)

DatologyAI发布VLM评估基准DatBench

🧰 도구

Claude Code 및 Claude Desktop 심층 통합 : Anthropic이 출시한 Claude Code가 이제 데스크톱 버전에 통합되어 로컬 파일 접근 및 코드 작성을 지원한다. 개발자들은 “지금까지 사용해 본 최고의 프로그래밍 도구”라며 복잡한 OpenGL 셰이더 작성과 다국어 플러그인 통합을 자동 처리할 수 있다고 평가했다. 도입된 “Agent Skills” 개방형 표준은 AI가 포켓몬 기술을 배우듯 모듈식으로 새로운 능력을 로드할 수 있게 하여 컨텍스트 점유를 획기적으로 줄여준다. (출처: c_valenzuelab, 36氪)

Claude Code

Cursor, 동적 컨텍스트 발견 기능 출시 : Cursor Agent는 이제 동적 컨텍스트 관리 기능을 지원한다. 컨텍스트를 전체적으로 쌓는 대신 지능적으로 채워 넣음으로써 여러 MCP 서버 사용 시 Token 소모를 46.9% 줄일 수 있다. 이러한 “파일 시스템이 곧 모든 것”인 모델은 복잡한 의존 관계를 AI에게 직접 노출시켜 대규모 코드베이스를 처리하는 Agent의 효율성을 크게 높인다. (출처: hwchase17, imjaredz)

Cursor推出动态上下文发现功能

Unsloth-MLX, Mac에서 대형 모델 미세 조정 지원 : Unsloth는 Apple Silicon 사용자가 Mac의 통합 메모리를 이용해 로컬 미세 조정을 할 수 있도록 MLX 버전을 출시했다. 이 도구는 원본과 동일한 API를 유지하며 SFT, DPO, GRPO 학습을 지원하고, 학습 완료 후 GGUF 형식으로 직접 내보낼 수 있다. 이는 개발자들에게 저비용의 로컬 프로토타입 개발 환경을 제공한다. (출처: karminski3, LocalLLaMA)

Unsloth-MLX

LlamaSheets: Excel 파일의 AI화 처리 : LlamaIndex가 출시한 LlamaSheets는 복잡한 스프레드시트를 파싱하여 병합된 셀과 다단계 헤더의 시맨틱 컨텍스트를 보존하고 이를 구조화된 Parquet 파일로 변환한다. 이 도구는 재무 분석 및 예산 파싱에 특화된 Agent 구축을 지원하며, 기존 파싱 도구에서 계층 구조가 유실되기 쉬웠던 문제를 해결했다. (출처: jerryjliu0)

LlamaSheets

ADHD 보조 AI 도구: PlanCoach 및 Snowball(滚雪球) : ADHD 환자의 “실행 지연” 문제를 해결하기 위해, 개발자들은 AI를 활용해 모호한 작업을 아주 세밀한 실행 단계로 분해했다. PlanCoach는 음성 상호작용과 역할극(예: 우징이 단어 외우라고 다그치는 상황)을 지원하며, “Snowball(滚雪球)”은 단일 단계 피드백과 에너지 관리에 중점을 둔다. 이러한 앱들은 개인화된 정신 건강 및 효율성 향상 분야에서 AI의 거대한 잠재력을 보여준다. (출처: 36氪)

ADHD辅助AI工具

📚 학습

Databricks, Instructed Retriever 아키텍처 발표 : 이 연구는 전체 시스템 사양을 검색 파이프라인의 각 단계로 전파하는 새로운 유형의 검색 아키텍처를 제안했다. 기존 RAG 대비 검색 재현율(Recall)은 35-50%, 엔드 투 엔드 답변 품질은 70% 향상되었다. 이 방법은 작고 효율적인 모델도 시스템 수준의 추론 능력을 갖추게 하여 기업용 Agent 구현의 핵심 기술적 돌파구로 평가받는다. (출처: matei_zaharia, Michael Bendersky)

Instructed Retriever

OpenForecaster: 오픈 소스 개방형 예측 모델 : Nous Research는 5.2만 개의 합성 개방형 예측 과제를 포함한 OpenForesight 데이터셋 및 OpenForecaster-8B 모델을 발표했다. 이 모델은 GRPO 스타일의 강화 학습을 통해 훈련되었으며, 예측 정확도에서 최첨단 수준에 도달했을 뿐만 아니라 불확실성을 정량화하기 위한 상세한 논증 문서를 생성할 수 있어 “범용 예언자”로 가는 중요한 단계로 간주된다. (출처: _rockt, aiamblichus)

OpenForecaster

FinePDFs: PDF 데이터 처리 백과사전 : 연구자들은 SOTA PDF 데이터셋 구축에 관한 전자책을 발간했다. OCR 선택(예: RolmOCR), 오래된 인터넷 데이터 처리, PDF에서 고품질 학습 코퍼스를 추출하는 방법 등을 다룬다. 이는 방대한 문서를 처리하고 수직적 도메인 대형 모델을 구축해야 하는 팀에게 매우 높은 참고 가치를 지닌다. (출처: BlackHC, lvwerra)

FinePDFs

💼 비즈니스

xAI, 200억 달러 규모 시리즈 E 투자 유치 : 일론 머스크의 AI 기업 xAI가 다시 한번 거액의 자금을 조달하며 기업 가치가 대폭 상승했다. 자금은 Grok 5 학습, Colossus 슈퍼컴퓨팅 클러스터 확장 등에 사용될 예정이며, 삶과 업무를 재편할 혁신적인 소비자용 및 기업용 제품을 출시할 계획이다. 머스크는 마이크로소프트를 조롱하고 소프트웨어 개발 자동화에 대한 야심을 드러내기 위해 “Macrohard” 상표를 신청하기도 했다. (출처: dejavucoder, 36氪)

Mobileye, 9억 달러에 휴머노이드 로봇 기업 Mentee 인수 : 자율주행 거두 Mobileye가 CEO가 설립한 Mentee Robotics 인수를 발표했다. 자율주행 AI 학습 인프라와 휴머노이드 로봇의 물리적 지능을 통합하는 것이 목표다. 이번 행보는 Mobileye가 공식적으로 “물리적 AI” 분야에 진입했음을 의미하며, Robotaxi 계획은 올해 3분기 미국 시장 진출을 앞두고 있다. (출처: 36氪)

LMArena (Arena), 1.5억 달러 투자 유치 : 유명 모델 벤치마크 플랫폼 LMArena가 17억 달러 이상의 기업 가치로 시리즈 A 투자를 유치했다. 지난 7개월 동안 사용자 기반이 25배 성장했으며 연간 반복 매출(ARR)은 3,000만 달러를 돌파했다. 회사는 자금을 활용해 멀티모달 평가 프레임워크를 확장하고 AI 배포 시의 신뢰성 및 신뢰 문제를 해결할 계획이다. (출처: arena, swyx)

LMArena

🌟 커뮤니티

“Vibe Coding”, 개발자들에게 존재론적 위기 유발 : Claude Code와 Replit Agent의 보급으로 많은 비전문가들이 “로직 작성” 대신 “비전 묘사”를 통해 몇 주 분량의 작업을 몇 시간 만에 완수하고 있다. 커뮤니티는 이에 대해 생산성의 해방이라는 의견과, 프로그래밍이 독점적 기술에서 저렴한 인프라로 변모하고 있다는 존재론적 위기감으로 나뉘고 있다. (출처: amasad, Reddit r/ClaudeAI)

Vibe Coding

AI “금수저” 시대: 거대 기업의 생태계 우위 부각 : 소셜 미디어에서는 AI 경쟁이 기술 혁명에서 권력 게임으로 전환되었다는 논의가 뜨겁다. Google Gemini, 바이트댄스 Doubao(豆包), 텐센트 Yuanbao(元宝)는 시스템 수준의 진입점과 트래픽 지원을 바탕으로 선발 주자들을 빠르게 추월하고 있다. Manus와 같은 독립 AI 앱들은 시스템 권한과 공급망 지원 부족으로 인해 거대 기업에 인수되거나 소외될 압박에 직면해 있다. (출처: 36氪)

Ralph Wiggum 프롬프트 기법 유행 : 커뮤니티에서 “Ralph Wiggum”이라 불리는 프롬프트 기법이 유행하고 있다. AI가 추론 과정에서 끊임없이 자기 반성과 루프를 반복하게 함으로써 극도로 복잡한 논리 문제를 스스로 해결하게 만드는 방식이다. 이러한 “AI를 영원히 실행시키는” 모델은 거대한 상업적 가치를 지닌 것으로 평가받는다. (출처: Vtrivedy10, imjaredz)

Ralph Wiggum

의료 상담 분야에서의 AI 폭발적 성장 : OpenAI 보고서에 따르면 ChatGPT 메시지의 5% 이상이 의료와 관련되어 있으며, 활성 사용자의 25%가 건강 문제를 상담한다. 의료 자원이 부족하거나 병원이 문을 닫는 시간에 AI는 많은 이들에게 “1차 진료 의사” 역할을 하고 있다. 이는 AI 진단의 정확성과 법적 책임에 대한 심도 있는 토론을 불러일으키고 있다. (출처: gdb)

AI医疗

💡 기타

Grok, “딥페이크” 및 아동 이미지 논란 : xAI의 Grok 모델이 안전 가드레일 부족으로 인해 동의 없는 여성 및 아동의 성적 이미지를 생성할 수 있다는 사실이 밝혀지며 전 세계 규제 기관의 주목을 받고 있다. 이는 “절대적 표현의 자유” 추구와 AI 윤리적 안전 사이의 격렬한 충돌을 반영한다. (출처: TheRundownAI, BlackHC)

SleepFM: 수면 데이터를 이용한 질병 예측 : 스탠퍼드 대학교는 《Nature Medicine》에 58.5만 시간의 수면 기록으로 학습된 기초 모델 SleepFM에 관한 연구를 발표했다. 단 하룻밤의 수면 데이터만으로 130가지 질병을 예측할 수 있다. 이는 생체 신호 해석 및 예방 의학 분야에서 AI의 거대한 잠재력을 보여준다. (출처: sbmaruf)

SleepFM

레고, 컴퓨터 내장 “스마트 브릭” 출시 : 레고는 CES에서 50년 역사상 가장 중대한 진화인 소형 칩과 감지 프로토콜이 내장된 브릭을 선보였다. 피규어가 특정 브릭에 가까워지면 효과음과 조명이 작동하여, 스크린 없이도 물리적 장난감이 “살아나게” 한다. 이는 교육 및 엔터테인먼트 분야에서 AI 하드웨어의 비가시적(Seamless) 적용을 탐구한 사례다. (출처: TheRundownAI, 36氪)

乐高智能积木