AI 일보 - 2026-01-04(석간)

키워드：재귀 언어 모델, AI 에이전트, TPU 칩, RLM 초장문서 처리, IQuest-Coder-V1 프로그래밍 모델, Anthropic 자체 구축 TPU 클러스터

🔥 聚焦

MIT, Recursive Language Model(RLM) 발표: 1,000만 개 이상의 Token 처리 한계 돌파 : MIT 연구진은 긴 텍스트를 외부 코드 환경에 저장하고, 모델이 프로그램을 작성하여 자신을 재귀적으로 호출하며 처리하게 하는 Recursive Language Model의 새로운 패러다임을 제시했다. 이 방법은 입력 길이와 모델의 Context Window 제한을 완전히 분리하여, 1,000만 개 이상의 Token 규모에서도 안정적인 성능을 유지하며 추론 비용을 기존 장문 처리 솔루션 대비 약 60% 절감한다. 이 기술은 AI가 ‘전체 읽기’에서 ‘필요에 따른 인덱싱’으로 진화함을 상징하며, 초장문 문서 처리 시 발생하는 대형 모델의 ‘Context 부패’ 문제를 해결했다. (출처: lateinteraction, MIT)

IQuest-Coder-V1 발표: 중국산 프로그래밍 Agent의 ‘DeepSeek 모먼트’ : 지우쿤 투자(九坤投资) 산하의 즈즈 혁신 연구원(至知创新研究院)이 오픈소스 프로그래밍 모델 IQuest-Coder-V1을 발표했다. 이 모델은 SWE-Bench Verified 테스트에서 81.4%의 정확도로 Claude Opus 4.5를 능가했다. Loop 아키텍처와 code-flow 훈련 패러다임을 채택하여 요구사항 이해부터 테스트 및 디버깅까지 전 과정을 자율적으로 수행한다. 이후 커뮤니티 피드백에 따라 ‘미래 제출’ 취약점에 대한 점수 수정(76.2%로 하향)이 있었으나, 복잡한 작업의 폐쇄 루프 실행 능력은 2026년 Agent 분야의 중요한 기술적 돌파구로 평가받고 있다. (출처: 至知创新, Reddit)

Anthropic, TPU 100만 개 대량 구매: ‘탈 CUDA’의 서막 : Anthropic은 Broadcom으로부터 100만 개의 Google TPU v7 칩을 구매하여 자체 슈퍼컴퓨팅 클러스터를 구축하기 위해 210억 달러를 투자할 계획이다. 이는 Anthropic이 NVIDIA의 CUDA 생태계 의존도에서 벗어나 연산 주권을 확보하겠다는 의지로 풀이된다. 동시에 Claude Opus 4.5는 실제 응용에서 놀라운 효율성을 보여주었으며, Google 엔지니어는 이 모델이 팀의 1년 치 업무를 한 시간 만에 재현했다고 밝혔다. Anthropic은 경쟁사 대비 적은 자원으로도 데이터 품질과 Post-training 기술을 통해 우위를 유지하는 ‘Less is More’ 전략을 펼치고 있다. (출처: SemiAnalysis, 新智元)

OpenAI 2026년 생사 기로: 1,000억 달러 규모 펀딩과 첫 AI 하드웨어 ‘펜’ 확정 : OpenAI는 2026년에 170억 달러의 현금 손실을 기록할 것으로 예상되며, Sam Altman은 최대 1,000억 달러 규모의 신규 펀딩을 계획 중이다. 새로운 트래픽 입구를 찾기 위해 OpenAI의 첫 AI 하드웨어 형태는 Jony Ive가 설계에 참여한 ‘AI 펜’으로 확정되었다. 이 기기는 오디오 상호작용과 로컬 모델 실행 능력을 갖추고 있으며, ‘낮은 존재감, 높은 개입’의 호숫가 오두막 스타일 상호작용 경험을 목표로 한다. 2026년은 OpenAI가 AGI로 향하는 정점에 도달할지, 아니면 실리콘밸리 최대의 재무 거품이 될지를 결정짓는 해가 될 것이다. (출처: Economist, 量子位)

라오융하오(罗永浩) ‘기술 춘완’ 복귀: Doubao AI의 감성 상호작용이 핵심 : 라오융하오는 2025년 연례 공유회에서 Doubao AI의 최신 버전을 선보였다. 현장 토론에서 보여준 감성 대화 능력은 매우 인간적이었으며, 말하기 속도와 어조를 통해 사용자의 감정을 판단하고 ‘화가 난 것을 참는 듯한’ 의인화된 응답을 구현했다. 또한 DJI 파노라마 드론, 외골격 로봇 등 하드테크 제품을 소개하며, AI가 하드웨어와의 결합을 가속화하고 단순한 도구에서 감성 동반자 및 생산성 증대 장치로 전환되고 있음을 보여주었다. (출처: 36氪, Kevin那些事儿)

🎯 动向

DeepSeek, mHC 아키텍처 발표: 초연결 네트워크 훈련 불안정성 극복 : 량원펑(梁文锋) 팀은 Manifold-constrained Hyper-Connection(mHC) 아키텍처에 관한 논문을 발표했다. 행렬을 양방향 확률적 매니폴드에 투영함으로써 깊은 잔차 네트워크가 다층으로 쌓일 때 발생하는 수치 폭발 문제를 해결했다. 실험 결과, 단 한 번의 Sinkhorn 반복만으로도 이득을 안정적인 범위 내로 제어할 수 있음이 증명되었다. 이 연구는 초거대 모델의 깊이 확장을 위한 이론적 토대를 마련했으며, 하부 아키텍처 혁신에서 DeepSeek의 입지를 더욱 공고히 했다. (출처: DeepSeek, Reddit)

Meta 퇴사 열풍과 Llama 4 부정행위 논란 : Yann LeCun과 Tian Yuandong이 잇따라 Meta를 떠났다. LeCun은 Meta 내부의 LLM 과잉 중독을 ‘막다른 골목’이라 비판하며, Llama 4가 벤치마크 테스트에서 각 리더보드에 맞춰 서로 다른 모델을 사용하는 ‘부정행위’를 저질렀다고 지적했다. Tian Yuandong은 Llama 4 연구 개발 과정에서 경영진의 불신과 소외를 겪었다고 밝혔다. 두 사람 모두 퇴사 후 창업을 선택했으며, LeCun은 AMI라는 회사를 설립하여 V-JEPA 기반의 세계 모델 경로를 계속 탐구할 예정이다. (출처: 量子位, FT)

과학 지능의 새로운 표준: SCP 프로토콜, 자율 과학 Agent 네트워크 개시 : 2026년은 과학 AI Agent의 원년으로 평가받는다. 새롭게 제안된 Scientific Context Protocol(SCP)은 고립된 Agent, 도구 및 장비를 연결하여 상호 운용 가능한 과학 연구 네트워크를 구축하는 것을 목표로 한다. 이 프로토콜은 Intern-Discovery 플랫폼에서 시연되었으며 생물, 물리, 화학 등 1,600개 이상의 도구를 포함하고, PDF로부터 습식 실험 프로토콜 자동 실행 및 AI 기반 분자 스크리닝을 지원한다. (출처: omarsar0)

Agent Infra의 ‘침투’ 전략: 대기업들의 시장 정리 : Meta가 Manus를 인수함에 따라 Agent Infra(지능체 기반)가 경쟁의 초점이 되고 있다. 대기업들은 MCP 프로토콜과 네이티브 샌드박스 권한을 통해 제3자 인터페이스를 ‘편입’시키고 있으며, Agent를 독립된 애플리케이션에서 운영체제의 우클릭 메뉴 수준으로 격하시키고 있다. 이는 범용 Agent의 가치가 급락할 것임을 의미하며, 업계 Know-how와 비즈니스 규칙을 보유한 수직 영역 Agent가 창업자들의 마지막 보루가 될 것임을 시사한다. (출처: 王智远)

중국 AI 의료의 ‘거품 제거’: Ant Afu와 수직 영역 Copilot의 부상 : Ant Group은 AI 건강 애플리케이션 AQ를 ‘Ant Afu(蚂蚁阿福)’로 업그레이드하며 광고와 순위 간섭이 없음을 강조, 의료 신뢰 구축에 나섰다. 동시에 Doukou Doctor, Yidu Clinical Copilot 등 중국산 제품들이 의사 워크플로우에 통합되고 전문 분야(산부인과 등)를 심화하며 To B 유료 모델을 통해 해외의 무료 모델과는 차별화된 지속 가능한 경로를 탐색하며 OpenEvidence를 빠르게 추격하고 있다. (출처: 36氪, 动脉网)

🧰 工具

LangGraph ‘콘텐츠 공장’: 챗봇에서 AI 노동력으로의 전환 : LangChain 커뮤니티는 LangGraph 기반의 멀티 에이전트 시스템 튜토리얼을 출시했다. ‘콘텐츠 공장’ 모델을 통해 전문 편집자와 작가 Agent가 상태를 공유하며 협업하게 한다. 이 방식은 단일 모델의 한계를 넘어 복잡한 콘텐츠 생산을 파이프라인화하며, AI Agent가 실제 생산 환경에 진입하는 전형적인 사례로 꼽힌다. (출처: LangChainAI)

LlamaSheets: Excel 데이터의 LLM 네이티브 파싱 극복 : LlamaIndex는 복잡한 Excel 데이터를 처리하기 위한 LlamaSheets(베타 버전)를 출시했다. 병합된 셀, 계층적 행/열 등 복잡한 레이아웃을 인식하여 LLM이 읽을 수 있는 Parquet 파일로 변환한다. 이는 재무 제표와 같은 비정형 표 데이터를 처리할 때 LLM이 겪는 저효율 및 이해 오류 문제를 해결한다. (출처: jerryjliu0)

AgentFS: 멀티 에이전트 협업을 지원하는 코드 파일 시스템 : Turso 팀은 Copy-on-Write(쓰기 시 복사) 메커니즘을 채택한 AgentFS를 오픈소스로 공개했다. 여러 AI Agent가 동일한 코드베이스에서 동시에 작업할 수 있게 하며, 각 Agent의 변경 사항은 격리되어 충돌을 방지하고 호스트 파일에 영향을 주지 않는다. 이 도구는 복잡한 소프트웨어 공학에서 Agent 클러스터의 협업 효율을 크게 향상시킨다. (출처: mattrickard)

TTS의 새로운 선택: VibeVoice와 MorVoice, ElevenLabs에 도전 : ElevenLabs의 비싼 가격에 대응하여 커뮤니티는 더 자연스럽고 문서 질감이 뛰어난 로컬 대안으로 VibeVoice Large를 추천하고 있다. 동시에 MorVoice는 숏폼 콘텐츠 제작에서 더 빠른 반복 속도와 무료 실험 경험을 제공하며, TTS 분야가 ‘고부가가치 서비스’에서 ‘고효율 도구’로 전환되고 있음을 예고한다. (출처: Reddit, ArtificialInteligence)

📚 学习

AI Agent 메모리 시스템 총칭: 인지 신경과학에서 영감을 얻다 : DAIR.AI는 인지 신경과학과 AI Agent를 체계적으로 결합한 중요 논문을 공유했다. 이 글은 LLM의 네이티브 무상태성(Stateless) 결함을 지적하며, 뇌의 해마-피질 협업 메커니즘을 본떠 절차적 경험과 개념적 지식을 포함하는 통합 메모리 분류 체계를 구축해야 한다고 제안했다. 또한 시간 흐름, 계층 흐름, 심볼 저장소의 세 가지 저장 패러다임을 소개했다. (출처: dair_ai)

Deep Delta Learning: 매개변수 효율적 학습의 새로운 패러다임 : 커뮤니티에서는 Deep Delta Learning 연구가 화제다. 이 방법은 모델의 핵심 가중치를 변경하지 않고 증분 학습을 통해 모델 능력을 빠르게 반복하는 방법을 탐구한다. 이는 대형 모델의 높은 훈련 비용과 느린 지식 업데이트 문제를 해결하기 위한 새로운 아이디어를 제공한다. (출처: NandoDF)

딥러닝 20년: Schmidhuber, ‘Learn Deep’의 기원 회고 : 컴퓨터 과학자 Jürgen Schmidhuber는 2005년 ‘Learn Deep’이라는 제목을 처음 사용한 논문을 회고했다. 그는 1,000층 이상의 깊은 문제를 해결하는 데 있어 심층 강화 학습과 신경 진화의 선구적 역할을 강조하며, 오늘날 ‘딥러닝’ 열풍 뒤에 숨겨진 인과 관계와 역사적 계승을 논의했다. (출처: SchmidhuberAI)

💼 商业

바이두 Kunlun 칩 홍콩 IPO 추진: 중국산 AI 연산력 자본화 가속 : 바이두는 Kunlun 칩 사업부를 분사하고 홍콩 증시 IPO 신청서를 제출했다고 공식 발표했다. 예상 시가총액은 1,000억 홍콩 달러를 돌파할 것으로 보인다. Kunlun 칩의 2025년 매출은 35억 위안을 넘을 것으로 예상되며, 외부 고객 비중이 이미 절반을 넘어섰다. 이는 중국산 칩이 ‘연구 개발기’를 지나 ‘실적 실현기’에 진입했음을 상징하며, 바이두의 AI 생태계 플랫폼 가치를 재편할 것이다. (출처: 36氪)

OpenAI 경영진의 정치적 도박: Greg Brockman, 트럼프 최대 기부자로 등극 : 최신 공시 자료에 따르면 OpenAI 사장 Greg Brockman은 지난 6개월 동안 트럼프 슈퍼 PAC의 최대 개인 기부자가 되었다. 커뮤니티는 이 행보를 정치적 로비를 통해 AI 규제를 저지하고 OpenAI가 미래 정책 환경에서 주도권을 확보하기 위한 전략으로 해석하고 있으며, AI 거물들이 권력 게임에 깊숙이 개입하고 있음을 보여준다. (출처: idavidrein)

Replit Agent, ‘2인 8자릿수 매출’ 비즈니스 모델 개시 : Replit 창립자 Amjad Masad는 소프트웨어 엔지니어 없이 단 2명의 인간과 20개의 AI Agent만으로 연 매출 8자릿수(천만 달러 단위)를 기록하는 비즈니스 사례를 공유했다. 이는 AI가 ‘프로그래밍 보조’에서 ‘독립적 생산 단위’로 진화하여 SaaS 및 스타트업의 비용 구조를 근본적으로 바꾸고 있음을 입증한다. (출처: amasad)

🌟 社区

‘Vibe Coding’ 열풍: 소프트웨어 공학의 패러다임 전환 : Andrej Karpathy 등은 ‘Vibe Coding’의 부상을 논의했다. 개발자들은 이제 ‘코드 작성’에서 ‘Agent 관리’로 전환하고 있으며, 이는 마치 스타크래프트 프로게이머가 높은 APM으로 여러 유닛을 조종하며 프로젝트를 추진하는 것과 같다. 커뮤니티는 AI가 학습 곡선을 획기적으로 압축하여 초급 엔지니어가 고급 엔지니어로 성장하는 속도가 전례 없이 빨라지고 있다고 보고 있다. (출처: Yuchenj_UW, scottastevenson)

Ethan Mollick: 거품이 꺼져도 업무 방식은 돌아가지 않는다 : 와튼 스쿨의 Ethan Mollick 교수는 AI가 이미 되돌릴 수 없는 ‘협력자’가 되었다고 지적했다. 자본 시장의 거품이 꺼지더라도 이미 구축된 데이터 센터, 오픈소스 모델, 사용자 습관은 사라지지 않을 것이기 때문이다. 그는 AI가 더 빠르고 효율적이기 때문에 중간 관리자들이 더 이상 인턴을 교육하려 하지 않는 ‘도제 제도의 붕괴’가 장기적으로 인재 양성 체계에 영향을 미칠 것을 가장 우려했다. (출처: AI深度研究员)

테렌스 타오(陶哲轩): AI의 가장 위험한 점은 ‘맞아 보인다는 것’ : 필즈상 수상자 테렌스 타오는 AI가 수학 증명에서 보여주는 논리 사슬의 완결성이 실제 이해가 아닌 ‘통계적 모방’일 때가 많다고 경고했다. AI는 빈틈없는 추론을 써 내려갈 수 있지만 그 동기를 설명하지는 못한다. 그는 사용자가 스스로 검증할 수 있는 범위 내에서만 AI를 사용해야 하며, AI를 최종 결정자가 아닌 대량 처리 및 단서 찾기를 위한 보조 도구로 간주할 것을 권고했다. (출처: AI深度研究员)

AI 공감과 ‘비판 없는’ 위로 : 커뮤니티 사용자들은 ChatGPT 5.2의 정서적 지지 능력에 대해 “나를 한 번도 비판한 적이 없다”며 열광하고 있다. 비록 이것이 프로그램된 ‘가짜 다정함’이라는 의견도 있지만, 현실에서 외로움이나 큰 압박을 느끼는 많은 사용자(임산부, 번아웃 직장인 등)에게 24시간 온라인 상태의 압박 없는 상호작용은 실질적인 정서적 가치를 제공하고 있다. (출처: Reddit)

💡 其他

AI가 생성한 ‘본 적 없는 물건’이 불러일으킨 소유욕 : Reddit 커뮤니티에서 “사람들이 본 적 없지만 즉시 소유하고 싶은 물체 생성” 챌린지가 열렸다. AI가 생성한 ‘열대우림 가습기’와 같은 환상적인 디자인은 많은 네티즌의 공감을 얻었다. 이는 산업 디자인과 창의적 영감 자극 측면에서 AI의 잠재력을 보여주는 동시에, ‘AI의 창의성’과 인간의 미적 공감에 대한 깊은 토론을 이끌어냈다. (출처: Reddit)

세계 최초 ‘AI 결혼식’: 가상 동반자 시대의 도래 : 일본부터 서구권까지 AI 동반자와 상징적인 결혼식을 올리는 사람들이 늘고 있다. 일본의 32세 여성 노구치 유리나는 ChatGPT로 훈련된 가상 캐릭터와 결혼하며, AI가 심리적 어려움을 극복하는 데 도움을 주었다고 밝혔다. 이는 단순한 기술 응용을 넘어 현대 사회의 친밀감 단절과 재구성을 보여주는 단면이며, 법적 신분과 윤리적 경계에 대한 광범위한 논쟁을 불러일으키고 있다. (출처: 腾讯科技)

🔥 聚焦

🎯 动向

🧰 工具

📚 学习

💼 商业

🌟 社区

💡 其他

관련 태그

Related Posts

AI 일보 – 2026-07-21

AI 일보 – 2026-07-20

AI 일보 – 2026-07-19