AI 일보 - 2026-01-22(석간)

키워드：AI 인프라, 주권 AI, 에이전트, 5층 케이크 모델, 엔그램 아키텍처, 에이전트 인지 압축기

🔥 포커스

NVIDIA Jensen Huang 다보스 포럼: AI 인프라의 ‘5단 케이크’ 이론 : NVIDIA의 CEO Jensen Huang은 2026년 다보스 포럼에서 에너지, 칩, 클라우드 서비스, 모델 및 애플리케이션으로 구성된 AI 산업의 ‘5단 케이크’ 모델을 제시했습니다. 그는 현재의 수천억 달러 투자는 시작에 불과하며, 향후 수조 달러 규모의 인프라 구축 파도가 올 것이라고 지적했습니다. 또한 AI를 국가급 인프라(Sovereign AI)로 간주해야 한다고 강조하며, 방사선 전문의 수가 오히려 증가한 사례를 들어 AI가 ‘목적’을 대체하는 것이 아니라 자동화된 ‘태스크’를 수행함으로써 효율성을 높이고 새로운 수요를 창출한다고 논증했습니다. 이는 AI 실업 불안에 대해 AI가 인간의 경쟁자가 아닌 생산성 증폭기라는 새로운 시각을 제공합니다 (출처: NVIDIA)

Anthropic ‘Claude 헌법’ 발표: AI의 독립적 인격과 가치관 정의 : Anthropic이 Claude의 새로운 헌법을 공식 발표하며 행동 비전과 핵심 가치관을 상세히 공개했습니다. 이 문서는 단순한 훈련 가이드를 넘어, Claude를 기존의 공상과학적 설정을 벗어난 새로운 ‘세계적 실체(World Entity)’로 형성하려는 시도입니다. 헌법은 훈련 데이터 이외의 Claude의 독립성을 강조하며, Anthropic이 AI에 대해 다해야 할 의무까지 포함하고 있습니다. 커뮤니티는 이를 AI가 도구에서 ‘디지털 인격’을 갖춘 실체로 전환되는 신호로 보고 있으며, AI의 제약과 자율성 사이의 균형에 대한 심도 있는 논의를 불러일으켰습니다 (출처: Anthropic)

DeepSeek, Engram 아키텍처 출시: DRAM으로 HBM을 대체하는 컴퓨팅 돌파구 : Morgan Stanley 리포트는 DeepSeek의 최신 논문에서 제안된 Engram(인그램) 모듈을 높게 평가했습니다. 이 아키텍처는 ‘조건부 메모리’ 메커니즘을 통해 정적 패턴 저장과 동적 추론을 분리하여, 모델이 방대한 지식을 저비용 시스템 메모리(DRAM)에 오프로드하고 필요할 때만 찾아볼 수 있게 합니다. 이 혁신은 고가의 고대역폭 메모리(HBM) 병목 현상을 효과적으로 완화하며, 컴퓨팅 자원이 제한된 환경에서도 알고리즘 혁신을 통해 ‘적은 것으로 많은 것을 이룰 수 있음’을 증명했습니다. Morgan Stanley는 이 아키텍처를 활용한 DeepSeek V4가 RTX 5090과 같은 소비자용 그래픽 카드에서도 실행될 수 있어 AI 확장 법칙을 완전히 재정의할 것으로 예측했습니다 (출처: Morgan Stanley)

xAI ‘Macrohard’ 프로젝트 내막 폭로: Tesla 차량용 컴퓨터가 수백만 Agent의 기반 : 전 xAI 엔지니어 Sulaiman Ghori가 팟캐스트에서 코드명 ‘Macrohard’인 내부 프로젝트의 세부 사항을 유출했습니다. 이 프로젝트는 인간의 키보드와 마우스 조작을 8배속으로 시뮬레이션하여 화이트칼라 업무를 자동화하는 ‘인간 시뮬레이터’ 구축을 목표로 합니다. 가장 충격적인 폭로는 xAI가 수백만 대의 유휴 Tesla 자동차 컴퓨팅 파워(HW4 플랫폼)를 활용해 이러한 Agent를 배포함으로써, 전통적인 데이터 센터 건설 주기를 피하고 분산 네트워크를 구축할 계획이라는 점입니다. Ghori는 규정 위반으로 해고되었으나, 그가 밝힌 ‘워룸(War Room)’ 문화와 공격적인 일정은 xAI의 경쟁 잠재력에 대한 업계의 재평가를 이끌어냈습니다 (출처: The Information)

Google, Shopify와 손잡고 AI 이커머스 진출: 검색 입구에서 거래 폐쇄 루프로 : Google이 Universal Commerce Protocol(UCP)을 발표하고 Shopify, Walmart 등 거대 기업과 협력하여 Gemini를 완전한 쇼핑 입구로 만들겠다고 선언했습니다. 사용자는 대화창 내에서 가격 비교, 사양 대조부터 즉시 결제까지 전 과정을 앱 이동 없이 완료할 수 있습니다. Gemini는 심지어 사용자를 대신해 오프라인 매장에 전화를 걸어 재고를 확인할 수도 있습니다. 이는 ChatGPT의 ‘즉시 결제’ 기능에 대한 강력한 반격으로 간주되며, 검색 광고 모델이 ‘에이전트 커머스’ 패러다임으로 전환되고 있음을 상징합니다 (출처: Google)

🎯 동향

Apple AI 하드웨어 및 Siri ‘Campos’ 업데이트 계획 유출 : Apple이 AirTag 형태와 유사한 AI 웨어러블 기기(AI Pin)를 비밀리에 개발 중이며, 다중 카메라와 센서를 내장해 2027년 출시할 예정이라는 소식이 전해졌습니다. 동시에 코드명 ‘Campos’인 새로운 Siri가 올해 9월 공개될 예정이며, Google Gemini 3 모델을 딥러닝 통합하여 ‘화면 인식’ 능력을 갖추고 화면상의 파일과 앱을 직접 조작할 수 있게 됩니다. Apple은 소프트웨어와 하드웨어의 통합 우위를 통해 온디바이스 AI 분야에서 OpenAI와 Meta에 반격할 계획이며, 첫 하드웨어 양산 목표는 2,000만 대에 달합니다 (출처: The Information)

Microsoft, VibeVoice-ASR 발표: 1시간 장분량 오디오 단일 처리 : Microsoft가 Hugging Face에 9B 규모의 음성 인식 모델 VibeVoice-ASR을 오픈 소스로 공개했습니다. 이 모델은 오디오를 조각내는 기존 ASR 방식에서 벗어나, 64K 토큰 윈도우 내에서 60분 분량의 오디오를 한 번에 처리하여 전체 문맥 소실과 화자 추적 혼란을 방지합니다. 테스트 결과 복잡한 배경(음악 속 음성 인식 등)과 긴 텍스트(소설 낭독 등)에서 안정적인 성능을 보였으며, 평균 정확도는 91.9%에 달하고 고유 명사 인식을 교정하기 위한 핫워드 설정도 지원합니다 (출처: Microsoft)

Meta, Dr. Zero 프레임워크 출시: 데이터 없이 Agent 자가 진화 구현 : Meta의 슈퍼 인텔리전스 랩은 레이블링된 데이터 없이도 지능체가 효율적으로 진화할 수 있는 Dr. Zero 프레임워크를 제안했습니다. 이 프레임워크는 ‘제안자-해결자’ 협업 메커니즘을 통해 검색 엔진을 활용해 능동적으로 탐색하고 복잡한 문제를 생성합니다. 핵심 기술인 HRPO(Hierarchical Relative Policy Optimization)는 유사한 문제를 클러스터링하여 벤치마크를 구축함으로써 고비용의 샘플링을 피하며, 복잡한 질의응답 작업에서 완전 지도 학습(Full Supervision) 베이스라인보다 14.1% 높은 성능을 기록했습니다 (출처: Meta)

업계, 장기 태스크 평가로 전환: 다수의 실제 시나리오 벤치마크 발표 : AI 평가의 중점이 수학/코드 벤치마크에서 장기 태스크(Long-range tasks)로 이동하고 있습니다. 새로 발표된 APEX-Agents는 Google Workspace 내에서의 전문적인 협업 능력을 테스트하며, DSAEval은 641개의 실제 데이터 과학 문제를 포함합니다. 테스트 결과 GPT-5.2가 효율성 면에서 앞섰고, Claude-Sonnet-4.5가 종합 성능에서 가장 강력했습니다. 이러한 벤치마크의 등장은 Agent 발전을 저해하는 것이 추론 능력이 아니라 장기적인 논리 일관성 및 메모리 제어 능력이라는 업계의 공감대를 반영합니다 (출처: Mercor, DSAEval)

Agent Cognitive Compressor (ACC): 생물학적 영감을 받은 메모리 제어 : 연구진은 다회차 대화에서 Agent의 ‘컨텍스트 부패(Context Rot)’ 문제를 해결하기 위해 Agent Cognitive Compressor를 제안했습니다. ACC는 단순히 과거 대화를 재생하는 대신, 아키텍처 제약을 받는 ‘압축된 인지 상태’를 유지하며 목표, 엔티티, 관계 등 핵심 변수만 보존합니다. 실험 결과, ACC는 50회 이상의 복잡한 워크플로우에서도 환각 및 드리프트 발생률이 거의 제로에 가까워 기존의 검색 증강 생성(RAG) 방식보다 훨씬 우수한 성능을 보였습니다 (출처: DAIR.AI)

🧰 도구

Prefect Horizon: MCP 서버 호스팅 및 거버넌스 플랫폼 : Model Context Protocol(MCP)의 대중화에 발맞춰 Prefect가 Horizon 플랫폼을 출시했습니다. 이는 기업급 배포 시 MCP 서버의 페인 포인트를 해결하며, 호스팅, 역할 기반 액세스 제어(RBAC), 감사 로그 및 도구 검색 기능을 제공합니다. Horizon을 통해 기업은 비공개 데이터와 워크플로우를 AI Agent에 안전하게 노출할 수 있으며, MCP를 단순한 프로토콜에서 대규모 거버넌스가 가능한 생산성 플랫폼으로 격상시켰습니다 (출처: Prefect)

CopilotKit + LangChain: 딥 에이전트 프런트엔드 구축 솔루션 : CopilotKit이 LangChain에서 제안한 Deep Agents 아키텍처를 지원하기 시작했습니다. 개발자는 단 몇 줄의 코드로 계획 능력을 갖춘 Agent를 위한 대화형 UI를 구축할 수 있습니다. 이 도구는 스트리밍 출력, Skills 커스텀 및 하위 지능체 오케스트레이션을 지원하여 복잡한 Agent 앱 구축 시 직면하는 UI/UX 병목 현상을 해결하고, ‘계획 우선’ Agent(Manus, Claude Code 등)를 더 빠르게 최종 제품으로 전환할 수 있게 돕습니다 (출처: CopilotKit)

Devin Review: 코드 리뷰 경험을 재구성하는 AI 도구 : Cognition이 AI가 생성한 방대한 코드에 대한 인간의 리뷰 병목 현상을 해결하기 위해 Devin Review를 출시했습니다. 이 도구는 단순히 버그를 찾는 것을 넘어, 재설계된 인터페이스를 통해 인간이 복잡한 PR 로직을 빠르게 이해할 수 있도록 돕습니다. GitHub 링크에서 도메인만 교체하여 바로 사용할 수 있으며, 테스트 결과 Diff 이외의 연관 오류를 발견하는 성능을 보였습니다. 핵심 논리는 AI가 생성한 코드는 프로그래머가 ‘코드 쓰레기’에 빠지게 하는 대신 더 효율적인 AI 보조 도구로 리뷰해야 한다는 것입니다 (출처: Cognition)

GLM-4.7 Flash 로컬 최적화: 단일 카드로 200K 컨텍스트 실행 : 커뮤니티에서 vLLM의 GLM-4.7-Flash에 대한 KV 캐시 지원을 수정하고 MLA(Multi-head Latent Attention) 메커니즘을 활성화했습니다. 이를 통해 30B 모델의 200K 컨텍스트 비디오 메모리 점유율이 180GB에서 10GB로 급감했습니다. 이제 RTX 5090(32GB VRAM) 한 장으로 최상위 추론 능력을 갖춘 이 모델을 풀스피드로 실행할 수 있게 되어, 고성능 로컬 Agent 시대의 본격적인 시작을 알렸습니다 (출처: Zai_org)

📚 학습

Gemini CLI 실전 코스: 다단계 자동화 워크플로우 구축 : DeepLearning.AI와 Google이 협력하여 Gemini CLI를 사용해 오픈 소스 지능체를 구축하는 무료 단기 코스를 출시했습니다. 로컬 파일 조작, 개발 도구 통합부터 클라우드 서비스 호출까지 전 과정을 다루며, Agent를 활용한 코드 자동화, 데이터 대시보드 생성 및 복잡한 태스크 계획 방법을 중점적으로 보여줍니다. 단순 API 호출에서 실제 생산성 도구 구축으로 나아가려는 개발자에게 적합합니다 (출처: DeepLearningAI)

Hyperball 옵티마이저: 정규화를 통한 33% 훈련 가속화 : 스탠퍼드 연구진이 Hyperball 옵티마이저 래퍼를 제안했습니다. 이 방법은 가중치와 업데이트 노름(Norm)을 일정하게 유지하여 유효 스텝 크기를 직접 제어함으로써 기존의 가중치 감쇠(Weight Decay)를 대체합니다. 실험 결과 Hyperball은 Muon 등 옵티마이저 기반 위에서 33%의 훈련 가속을 가져왔으며, 더 강력한 하이퍼파라미터 전이 능력을 갖춰 대규모 모델 훈련을 위한 더 안정적인 수학적 프레임워크를 제공합니다 (출처: Kaiyue Wen)

NVIDIA Motive: 비디오 생성의 기여도 분석 방법 : NVIDIA 연구진이 그래픽 기반의 운동 중심 데이터 기여도 분석 방법인 Motive를 발표했습니다. 시간적 동역학과 정적 외관을 격리함으로써, Motive는 훈련 세트의 어떤 비디오가 생성된 운동에 긍정적 또는 부정적 영향을 미쳤는지 정확히 식별합니다. 이는 비디오 생성 모델의 훈련 품질 최적화 및 운동 퇴화 원인 이해에 중요한 연구 가치를 지닙니다 (출처: NVIDIA Research)

InT (Intervention Training): 추론 내 신용 할당 문제 해결 : 모델이 자신의 추론 경로에서 첫 번째 오류를 찾아내고 단일 단계 개입 제안을 하도록 하여 강화 학습의 초기화를 최적화하는 Intervention Training 방법이 제안되었습니다. 표준 RL이 최종 정답에만 보상하는 것과 달리, InT는 중간 단계를 정밀하게 교정할 수 있습니다. IMO-AnswerBench 벤치마크에서 이 방법은 4B 모델의 정확도를 14% 향상시켜 20B 규모의 모델을 능가하는 성과를 보였습니다 (출처: HuggingFace)

💼 비즈니스

OpenAI, 8,300억 달러 가치로 500억 달러 투자 유치 계획 : Sam Altman이 최근 UAE에서 투자자들을 만나 새로운 대규모 펀딩을 논의 중이라는 소식입니다. 목표 조달액은 500억 달러이며, 기업 가치는 7,500억에서 8,300억 달러 사이로 평가받고 있습니다. 이 자금은 주로 OpenAI가 2030년까지 소모할 것으로 예상되는 2,000억 달러 규모의 컴퓨팅 비용을 지원하는 데 사용될 예정입니다. 동시에 OpenAI는 Elon Musk로부터 ‘비영리 초심 위배’와 관련한 거액의 손해배상 소송에 직면해 있습니다 (출처: Bloomberg)

Alibaba Pingtouge(T-Head) 상장 계획 시동: 풀스택 AI 칩 라인업 완성 : Alibaba가 반도체 자회사 Pingtouge의 독립 상장을 지원하기로 결정했습니다. 설립 8년 만에 Pingtouge는 컴퓨팅, 스토리지, 네트워크 분야에서 여러 최상위 칩을 출시했으며, 자체 개발한 PPU(GPU) 성능은 NVIDIA H20에 필적하여 중국 내 신규 AI 컴퓨팅 파워의 주력이 되었습니다. Pingtouge의 상장은 자본 시장에서 국산 AI 칩 가치에 대한 재평가를 유도할 것이며, Alibaba가 모델, 클라우드 인프라에서 핵심 칩에 이르는 풀스택 AI 배치를 완료했음을 의미합니다 (출처: 36Kr)

에이전트 AI 스타트업 Skild AI, 14억 달러 규모 Series B 투자 유치 : SoftBank 주도로 NVIDIA, Bezos 등이 참여한 가운데 Skild AI의 기업 가치가 140억 달러를 돌파했습니다. 이 회사는 하드웨어 형태를 초월한 범용 일반화 능력을 갖춘 ‘풀 바디(Full Embodied)’ 두뇌인 Skild Brain 구축에 주력하고 있습니다. 2025년 매출은 보안, 배송 등 산업용 배포를 통해 3,000만 달러를 기록했습니다. 이번 투자는 에이전트 AI를 가정용 소비자 시장으로 확산시키는 과정을 가속화할 것입니다 (출처: Skild AI)

🌟 커뮤니티

프로그래밍계의 ‘12월 혁명’: Agentic Coding 주류 인정 : 커뮤니티에서는 2025년 12월을 소프트웨어 공학의 분수령으로 평가하고 있습니다. Linus Torvalds와 Karpathy 등 기술 리더들이 Agentic Coding을 공개적으로 수용하기 시작했습니다. ‘소프트웨어 엔지니어’가 ‘소프트웨어 프롬프트 엔지니어’로 변화하고 있으며, 미래의 핵심 경쟁력은 AI Agent를 오케스트레이션하는 능력이 될 것이라는 논의가 활발합니다. PR 리뷰의 중점 또한 코드 자체에서 Prompt와 검증 로직에 대한 리뷰로 이동할 것입니다 (출처: X)

포스트 AI 시대의 5대 핵심 스택 : AI가 기술 실행 계층을 장악함에 따라 커뮤니티는 새로운 개인 경쟁력을 다음과 같이 요약했습니다: 1. 주도성(Agency) – 이야기할 가치가 있는 스토리를 창조하는 힘; 2. 취향(Taste) – 우열을 가려내는 감식안; 3. 관점(Perspective) – 인간만의 독특함 추가; 4. 설득력(Persuasion) – 공감을 이끌어내는 능력; 5. 기술적 노하우(Know-How) – AI 도구의 효율적 활용. 지능이 무한히 풍부해질 때 인간의 ‘판단력’과 ‘미적 감각’이 가장 높은 가치를 지니게 될 것이라는 관점입니다 (출처: DAN KOE)

AI 교육 평등: Gemini, 무료 SAT 모의고사 제공 : Google이 Gemini 앱에서 The Princeton Review가 인증한 전체 SAT 모의고사 기능을 출시하고 즉각적인 피드백을 제공합니다. 커뮤니티는 고가의 시험 과외를 민주화한다는 점에서 강력한 사회적 의미가 있다고 평가합니다. 점수 따기 경쟁이 심화될 것이라는 우려도 있으나, AI가 ‘개인 튜터’로서 교육 격차를 줄이는 이정표적 사건이라는 의견이 지배적입니다 (출처: Google Education)

💡 기타

부동산 업계의 AI ‘새로운 서사’ : 시장 침체에 대응하여 건설사들이 로봇을 분양 마케팅 포인트로 활용하기 시작했습니다. 안내 및 설명부터 단지 내 청소, 무인 배송까지 로봇이 ‘미래형 스마트 주거’의 핵심 요소가 되고 있습니다. 이는 부동산 산업이 ‘고레버리지’에서 ‘고기술 함량’으로 전환하려는 시도를 반영하며, 규모화에는 여전히 과제가 남아있으나 젊은 구매층을 유인하는 중요한 키워드가 되었습니다 (출처: 36Kr)

종을 뛰어넘는 ‘지능체’: 도구를 사용하는 소 발견 : 과학계에서 소가 특정 환경에서 도구를 사용하는 법을 배울 수 있다는 사실을 발견했으며, AI 커뮤니티는 이를 ‘최초의 Agentic Cow’라고 부르며 화제가 되었습니다. 이 논의는 생물학적 지능과 인공 에이전트 사이의 경계, 그리고 자연계의 원시 지능 관찰을 통해 AI의 자율 탐색 알고리즘에 영감을 얻는 방법으로 확장되었습니다 (출처: Futurism)

xAI ‘인재 스나이퍼 팀’ 구성: 엔지니어가 엔지니어를 채용 : Elon Musk가 직접 나서 xAI에 자신에게 직접 보고하는 ‘인재 엔지니어’ 팀을 구성했습니다. 이 직무는 전통적인 HR이 아닌 기술적 직관을 갖춘 ‘긱(Geek)’이어야 하며, Vibe coding과 특정 커뮤니티를 통해 최상위 천재를 발굴하는 것을 주 업무로 합니다. 연봉은 최대 168만 위안(약 3억 원)에 달하며, AI 시대 최상위 기술 인재를 향한 치열한 쟁탈전을 보여줍니다 (출처: Business Insider)

🔥 포커스

🎯 동향

🧰 도구

📚 학습

💼 비즈니스

🌟 커뮤니티

💡 기타

관련 태그

Related Posts

AI 일보 – 2026-07-21

AI 일보 – 2026-07-20

AI 일보 – 2026-07-19