AI 일보 – 2026-01-13(석간)

키워드:엔그램 모듈, 코워크, 제미니 협업, 트랜스포머 지식 검색 메커니즘, AI 에이전트 작업 실행, TTT-E2E 테스트 시점 훈련

🔥 포커스

DeepSeek, Engram 모듈 발표로 스토리지와 계산 분리 실현 : DeepSeek는 북경대학교와 공동 논문을 발표하며 ‘조건부 메모리’ 모듈인 Engram을 출시했습니다. 이 기술은 현대적인 Hash N-gram 임베딩을 통해 Transformer에 네이티브 ‘지식 검색’ 메커니즘을 보완하여 O(1)에 가까운 결정론적 검색을 구현합니다. 실험 결과, Engram-27B는 엄격하게 동일한 파라미터와 계산량 조건에서 순수 MoE 모델보다 현저히 우수한 성능을 보였습니다. 이는 지식 저장 능력을 향상시킬 뿐만 아니라, 얕은 층의 Attention이 담당하던 ‘단순 암기’ 부담을 덜어주어 심층 네트워크가 복잡한 추론에 집중할 수 있게 함으로써 코드 및 수학 능력을 대폭 끌어올렸습니다. 방대한 파라미터를 호스트 메모리(CPU)로 오프로드하면서도 추론 손실을 3% 미만으로 유지하는 이 엔지니어링 경로는 차세대 희소 대형 모델의 핵심 원시 타입(Primitive)으로 간주되며, 곧 출시될 DeepSeek-V4에 통합될 가능성이 매우 높습니다. (출처: GitHub)

DeepSeek发布Engram模块

Anthropic, 전략적 제품 Cowork 발표하며 ‘디지털 동료’ 시대 개막 : Anthropic이 Claude Code의 하위 능력을 비기술자를 위한 그래픽 도구로 캡슐화한 Cowork(연구 프리뷰 버전)를 정식 출시했습니다. Cowork는 Claude가 로컬 폴더에 직접 액세스하여 파일을 읽고, 편집하고, 생성할 수 있는 권한을 부여합니다. 이는 단순한 챗봇을 넘어 스스로 단계를 계획하고 작업(다운로드 폴더 정리, 스크린샷에서 데이터 추출하여 Excel 생성, 보고서 초안 작성 등)을 병렬로 처리할 수 있는 지능형 협업체입니다. 제품에는 보안을 위한 가상 머신 격리 환경이 내장되어 있으며 브라우저 자동화를 지원합니다. 커뮤니티에서는 이를 AI가 ‘콘텐츠 생성’에서 ‘작업 실행’으로 패러다임이 전환되는 신호탄으로 보고 있으며, 수많은 AI 스타트업 앱에 위협이 될 것으로 평가하고 있습니다. (출처: Anthropic)

Anthropic发布战略级产品Cowork

애플과 구글, Gemini 협력 합의로 Siri에 ‘외부 두뇌’ 탑재 : 애플과 구글은 향후 Apple Foundation Models가 구글의 Gemini 모델과 클라우드 기술을 기반으로 구축되어, 올해 말 출시될 개인화된 Siri를 구동할 것이라는 공동 성명을 발표했습니다. 애플은 매년 약 10억 달러를 지불할 것으로 알려졌습니다. 이번 협력은 자체 모델 개발이 지연되는 상황에서 애플의 ‘과도기적 양보’로 풀이됩니다. Gemini는 요약 및 계획과 같은 복잡한 작업을 담당하고, 온디바이스 기본 기능은 여전히 애플의 자체 모델이 지원합니다. 이 소식에 구글의 시가총액은 처음으로 4조 달러를 돌파했으며, 동시에 머스크의 ‘권력 과도 집중’ 비판과 애플 생태계 내 OpenAI의 입지 약화에 대한 논의를 불러일으켰습니다. (출처: Google)

苹果与谷歌达成Gemini合作协议

TTT-E2E: 엔드 투 엔드 테스트 시 학습으로 LLM 장기 기억의 신기원 개척 : NVIDIA, 스탠퍼드, Astera 연구소가 공동 발표한 End-to-End Test-Time Training (TTT-E2E) 연구가 화제를 모으고 있습니다. 이 기술은 급진적인 새로운 아키텍처 없이 추론 단계(테스트 시)에서 컨텍스트를 학습 데이터로 활용하여 Next Token Prediction을 통해 모델 가중치를 지속적으로 업데이트할 것을 제안합니다. 이러한 방식은 긴 컨텍스트 경험을 모델 가중치에 압축하여, 시퀀스 길이에 따라 KV cache가 폭발적으로 증가하는 문제를 효과적으로 해결합니다. TTT는 모델을 진정한 ‘지속적 학습자’로 만들며, 수백만 Token의 초장기 시퀀스 처리 시 극강의 안정성을 보여주어 순수 서브 쿼드라틱(Sub-quadratic) 시퀀스 모델링으로 가는 가장 유망한 경로로 평가받습니다. (출처: arXiv)

TTT-E2E

🎯 동향

Sakana AI, DroPE 출시: 위치 임베딩 제거로 긴 텍스트 외삽 실현 : Transformer의 핵심 저자인 Llion Jones 팀이 위치 임베딩이 학습의 ‘보조 바퀴’일 뿐이라는 DroPE 기술을 오픈 소스로 공개했습니다. DroPE는 추론 단계에서 RoPE(Rotary Position Embedding)를 제거하고, 사전 학습 예산의 1% 미만을 사용한 짧은 보정만으로 방대한 컨텍스트 윈도우를 활성화합니다. 실험 결과, 이 방법은 LongBench 및 Needle In A Haystack 테스트에서 기존의 RoPE Scaling보다 월등한 성능을 보였으며, 저비용으로 긴 텍스트 처리 능력을 확장하는 새로운 아이디어를 제공했습니다. (출처: arXiv)

BabyVision 평가셋: 최정상급 대형 모델의 시각 능력, 아직 3세 아동에 못 미쳐 : Sequoia China xbench와 UniPatAI가 발표한 BabyVision 평가에 따르면, 언어 의존성을 엄격히 제어한 시각 작업에서 대다수 모델의 성능이 3세 아동보다 훨씬 뒤처지는 것으로 나타났습니다. 가장 우수한 성능을 보인 Gemini 3 Pro조차 간신히 기준선을 넘었습니다. 연구진은 모델이 언어 추론에 과도하게 의존하여 공간 지각, 궤적 추적, 기하학적 직관의 시스템적 결핍을 가리고 있다고 지적하며, 미래의 멀티모달 지능은 근본적으로 시각 능력을 재구축해야 한다고 강조했습니다. (출처: 36Kr)

BabyVision评测集

Recursive Language Models (RLM): DeepMind, RAG 없는 완벽한 기억 탐구 : DeepMind 연구원이 제안한 Recursive Language Models (RLM)은 모델이 스스로를 성찰하고 분할하며 재귀적으로 호출하여 수백만 Token을 처리하도록 합니다. 이 메커니즘은 전통적인 컨텍스트 윈도우의 제한을 깨뜨려, 모델이 외부 RAG에 의존하지 않고 재귀적 결과 집계를 통해 방대한 정보에 대한 ‘완벽한 기억’을 구현합니다. 이러한 진전은 향후 AI가 초장문 문서를 처리하는 방식에 질적 변화가 일어날 것임을 예고합니다. (출처: HuggingFace)

RLM

바이트댄스 AI 해외 진출, ‘효율성 도구’의 새로운 단계 진입 : 바이트댄스는 최근 해외 시장에 Manus에 대응하는 업무용 Agent인 AnyGen을 출시하며 문서 작성, 데이터 분석 등 고품질 결과물 제공에 주력하고 있습니다. 동시에 해외 AI 비서 Dola의 일일 활성 사용자(DAU)는 이미 1,000만 명을 돌파했습니다. 바이트댄스는 ‘즐거움 수출’(TikTok)에서 ‘효율성 판매’로 전환을 시도하며, 오피스 Agent 분야에서 OpenAI, Anthropic과 정면 승부를 벌이고 있습니다. (출처: 36Kr)

字节AI出海

🧰 도구

Distil-Text2SQL: 4B 소형 모델로 685B급 정밀도 로컬 구현 : Distil-labs는 Qwen3-4B를 미세 조정하여 Text2SQL 작업에서 DeepSeek-V3(685B)급의 의미론적 정확도를 달성했으며, ‘정확한 일치(Exact Match)’ 지표에서는 이를 능가했습니다. 이 모델은 로컬 실행을 지원하여 CSV 데이터를 클라우드에 업로드할 필요가 없으며, 응답 시간은 2초 미만입니다. 이는 특정 작업에서 소형 모델이 초거대 모델을 대체할 수 있는 거대한 잠재력을 보여줍니다. (출처: GitHub)

Text2SQL

LlamaParse 업그레이드: 저비용으로 차트 및 이미지의 정밀 OCR 구현 : LlamaIndex는 파싱 도구인 LlamaParse를 Agentic 모드로 업그레이드하여 문서 내 복잡한 시각적 요소(꺾은선 그래프, 파이 차트, 플로우 차트 등) 최적화에 집중했습니다. 전체 페이지 스크린샷을 VLM에 직접 입력하는 방식과 달리, 이 도구는 하위 요소의 경계 상자(Bounding Box)를 식별하고 수치 논리를 추출하여 고품질 Markdown으로 변환합니다. 이는 전문 문서 내 비텍스트 정보를 처리하는 가장 경제적이고 효율적인 솔루션 중 하나입니다. (출처: jerryjliu0)

LlamaParse升级

Wobo: AI Agent 기반의 ‘구직용 Tinder’ : Wobo는 AI Agent를 활용해 이력서 제출을 자동화하는 iOS 앱입니다. 사용자가 이력서를 한 번만 업로드하면 AI가 ‘직무 페르소나’를 분석하고, 사용자가 마음에 드는 공고를 ‘오른쪽으로 스와이프’할 때 복잡한 외부 공식 홈페이지로 자동 이동하여 맞춤형 자기소개서를 생성하고 선별 질문에 답변합니다. 이 도구는 번거로운 반복 입력 과정을 없애고 20분 걸리던 지원 프로세스를 2초로 단축하는 것을 목표로 합니다. (출처: Reddit)

Wobo

📚 학습

스탠퍼드 CS224N 2026 복귀: Agent 및 추론 특집 추가 : 클래식한 자연어 처리 강의인 CS224N의 복귀가 선언되었습니다. 올해 강의는 Diyi Yang과 Yejin Choi가 공동 진행하며, 신경망 NLP 기초 외에도 AI Agent, 도구 사용 및 ‘추론(Reasoning)’에 특화된 두 개의 세션을 추가하여 대형 모델의 최신 트렌드를 반영할 예정입니다. (출처: Stanford)

CS224N

앤드류 응, 《Build with Andrew》 발표: 노코드 웹 앱 구축 : 앤드류 응(Andrew Ng) 교수는 최신 The Batch 주간 뉴스레터에서 새로운 코스를 출시했습니다. 초보자가 자연어 설명만으로 아이디어를 구체화하고 AI 도구를 활용해 실행 가능한 웹 애플리케이션을 구축 및 배포하는 방법을 안내합니다. 이 코스는 ‘개발자로서의 AI’ 패러다임을 강조하며 일반인의 소프트웨어 개발 진입 장벽을 낮추고 있습니다. (출처: DeepLearningAI)

Build with Andrew

11가지 신형 정책 최적화 기술 요약 : TuringPost는 최근 등장한 11가지 정책 최적화(Policy Optimization) 기술을 정리했습니다. 여기에는 GDPO(보상 디커플링 정규화), AT²PO(트리 탐색 기반 Agent 턴제 PO), 그리고 큰 관심을 받고 있는 PC-GRPO(퍼즐 커리큘럼 GRPO) 등이 포함됩니다. 이러한 기술들은 대형 모델의 논리 체인과 작업 정렬 능력을 향상시키는 핵심 요소입니다. (출처: TuringPost)

Policy Optimization

💼 비즈니스

OpenAI, 의료 스타트업 Torch 인수 : OpenAI가 실험 결과, 약물 기록, 진료 녹음을 통합 관리하는 의료 AI 스타트업 Torch를 인수한다고 발표했습니다. Torch 팀은 ChatGPT Health 부서에 합류할 예정입니다. 이번 행보는 OpenAI가 건강 관리 및 임상 보조 분야에서 AI 상용화를 가속화하여 ChatGPT를 세계에서 가장 전문적인 개인 건강 비서로 만들려는 의지를 보여줍니다. (출처: OpenAI)

OpenAI收购Torch

MiniMax 홍콩 상장, 첫날 109% 폭등 : 중국의 AI 유니콘 MiniMax가 2026년 1월 9일 홍콩 증시에 상장했으며, 첫날 주가가 109% 급등하며 시가총액 1,500억 홍콩 달러를 돌파했습니다. MiniMax는 Talkie와 HaiLuo AI를 통한 C단 시장에서의 성공을 통해, 대형 고객 계약에 의존하지 않고 소비자용 멀티모달 제품에 집중하는 경로가 자본 시장에서 매력적임을 증명했습니다. 이번 IPO는 치열한 연산 자원 경쟁 속에서 ‘산소’를 확보하기 위한 핵심 단계로 평가받습니다. (출처: TuringPost)

MiniMax上市

xAI 일일 2,800만 달러 소모, 기업 가치 2,300억 달러 향해 : xAI는 2025년 3분기까지 78억 달러의 막대한 손실을 기록했음에도 불구하고, 최근 200억 달러 규모의 투자를 유치하며 기업 가치 2,300억 달러를 달성했습니다. 머스크는 테슬라 로봇을 구동할 수 있는 자율 AI 시스템 구축을 목표로 하는 ‘Macrohard’ 계획을 전력 추진 중입니다. 이러한 ‘공격적 투자’ 모델은 인프라와 인재 확보에 있어 최상위 AI 플레이어들의 높은 진입 장벽을 반영합니다. (출처: 36Kr)

🌟 커뮤니티

Vibe Coding/Working, 직업 정체성에 대한 대토론 촉발 : Claude Cowork와 다양한 Agent 도구가 보급되면서 ‘바이브 워킹(Vibe Working)’이 화두가 되었습니다. 커뮤니티에서는 이것이 단순한 효율성 향상이 아니라 ‘머릿속 도메인 지식의 현금화’라고 논의하고 있습니다. 미래 엔지니어의 가치는 ‘10만 줄의 코드 작성’에서 ‘AI가 10만 줄의 코드를 쓰도록 시스템을 설계하는 것’으로 전환될 것입니다. 그러나 코드 품질의 저하(Slop)와 AI 블랙박스에 대한 과도한 의존을 우려하는 목소리도 있습니다. (출처: nearcyan, amasad)

AI 탐지기, ‘순전한 사기’라는 비판 직면 : Reddit 커뮤니티는 GPTZero 등 AI 탐지 도구에 대해 맹비난을 쏟아냈습니다. 오보율이 매우 높으며, 심지어 ‘독립선언서’를 90% AI 생성물로 판정하기도 한다는 점을 지적했습니다. 사용자들은 이러한 도구가 출처가 아닌 ‘통계적 친숙도’를 측정하기 때문에 수많은 원작자와 학생이 피해를 입고 있다고 주장합니다. 교육계에서는 ‘마녀사냥’을 멈추고 학생의 내용 이해 및 응용 능력을 평가하는 방향으로 전환할 것을 촉구하고 있습니다. (출처: Reddit)

AI检测器争议

DeepSeek 창업자 량원펑, ‘AI계의 무명 고수’로 추앙 : 커뮤니티에서는 DeepSeek 창업자 량원펑의 퀀트 펀드 배경이 화제입니다. 그가 이끄는 High-Flyer Quant는 2025년 수익률 56.6%를 기록하며 업계 평균을 크게 상회했습니다. 네티즌들은 퀀트로 번 돈을 AI에 ‘YOLO’식으로 투자하면서도 MLA, Engram과 같은 독창적인 기술 경로를 걷는 그의 아키텍처 감각과 엔지니어링 효율에 감탄하며, 그를 실리콘밸리 거물들에 대항하는 중국 AI의 핵심 변수로 꼽고 있습니다. (출처: teortaxesTex)

💡 기타

AI 이어폰 Sweetpea, 9월 출시 전망 : OpenAI의 첫 번째 하드웨어 제품인 코드명 Sweetpea AI 이어폰에 대한 소문이 돌고 있습니다. Jony Ive 팀이 디자인을 맡아 금속 조약돌과 유사한 외형을 가졌으며, 로컬 추론을 지원하는 2nm 칩이 내장될 것으로 보입니다. OpenAI는 첫해 판매 목표를 5,000만 대로 잡고 AirPods의 시장 지위에 직접 도전할 것으로 예상됩니다. (출처: 36Kr)

Sweetpea耳机

AI 보안, 2026년 기업 모델 선정의 새로운 표준 : AI 에이전트의 권한이 확장됨에 따라 기업의 보안 관심사가 ‘선택 사항’에서 ‘전제 조건’으로 바뀌었습니다. 조사에 따르면 기업의 43%가 보안을 AI 도입의 가장 큰 장애물로 꼽았습니다. 2026년의 트렌드는 보안 능력의 ‘내재화’로, 모델 호출 및 Agent 편성 단계에서 감사 및 권한 격리가 기본적으로 활성화되는 방향으로 나아가고 있습니다. (출처: 36Kr)