AI 일보 – 2025-12-29(석간)

키워드:AI 프로그래밍, 메모리 부족, AI 수학, 오픈소스 모델, 로봇 기술, AI 검색, AI 상용화, Self-play SWE-RL 프레임워크, HBM 및 DDR5 메모리, DeepSeek-R1 오픈소스 모델, GEO 생성 엔진 최적화, 국산 GPU 4대 기업

🔥 포커스

Meta, SSR 프레임워크 발표, AI 프로그래밍 ‘좌우합박(Self-play)’ 시대 진입 : Meta, UIUC, CMU 연구팀이 Self-play SWE-RL (SSR) 프레임워크를 발표하며 AI 프로그래머가 인간 데이터의 한계를 벗어나기 시작했다. 이 프레임워크는 AI가 ‘파괴자(Bug 주입)’와 ‘복구자(Bug 해결)’ 역할을 나누어 코드 샌드박스 내에서 대항 진화를 수행하게 한다. 실험 결과, SSR은 자연어 Issue를 본 적이 없음에도 SWE-bench 검증 세트에서 성능이 10.4% 향상되었다. 이러한 돌파구는 초지능 소프트웨어 시스템의 탄생에 더 이상 인간 스승이 필요하지 않으며, 인간의 코드는 단지 전장으로만 쓰일 뿐임을 의미한다 (출처: Arxiv)

Meta发布SSR框架

글로벌 메모리 기근: AI 연산 수요가 전자제품 가격 인상 초래 : 2025년 AI 슈퍼컴퓨팅의 폭발로 글로벌 메모리(RAM) 시장에 구조적 결핍이 발생했다. Micron, Samsung 등 칩 거물들이 생산 능력을 고수익 HBM 및 DDR5로 영구 전환하면서 소비자용 DRAM 가격이 1년 만에 3배 폭등했다. 분석에 따르면 AI가 전 세계 웨이퍼 생산 능력의 약 20%를 잠식할 것이며, 이는 스마트폰과 PC의 BOM 비용을 높일 뿐만 아니라 2026년에는 제조사들이 ‘사양 하향’ 전략을 취하게 만들 것이다. 이는 하드웨어 보너스 시대의 종말과 연산 인프라 비용이 소비자에게 전가되고 있음을 시사한다 (출처: NPR)

全球内存荒

Terence Tao, AI의 수학 난제 해결 진실 폭로: 혁신 아닌 ‘지식 고고학’ : 수학 거장 Terence Tao는 최근 AI가 여러 Erdos 난제를 해결한 것에 대해 AI의 핵심 가치는 ‘롱테일 스캔’에 있다고 평했다. AI는 새로운 수학을 발명한 것이 아니라, 엄청난 연산력을 이용해 인간이 잊어버린 비주류 문헌에서 ‘낮게 매달린 과일’을 발굴한 것이다. 이러한 솔루션은 이미 정보의 블랙홀 속에 존재했으나 인간은 검색 비용이 너무 높아 잊고 있었고, AI는 ‘슈퍼 사서’ 역할을 수행했다. 이 관점은 과학적 발견에서 AI의 역할을 정의한다: AI는 방대한 쓰레기 속에서 단서를 찾고, 인간은 이를 검증한다 (출처: Mathstodon)

陶哲轩揭示AI破解数学难题真相

DeepSeek, Nature 표지 장식: 중국 오픈소스 모델이 글로벌 AI 판도 재편 : 2025년 DeepSeek-R1이 대형 모델 최초로 피어 리뷰를 통과하며 《Nature》 표지를 장식했고, 설립자 Liang Wenfeng은 Nature 올해의 10대 인물에 선정되었다. DeepSeek은 알고리즘 최적화와 엔지니어링 효율을 통해 매우 낮은 연산 비용으로 최첨단 성능을 구현할 수 있음을 증명했다. 이 ‘다크호스 모먼트’는 Llama 등 기존 오픈소스 모델의 위상을 하락시켰으며, 글로벌 오픈소스 생태계가 ‘실리콘밸리 추종’에서 ‘중국 벤치마킹’으로 전환되고 있다 (출처: Nature)

DeepSeek登顶Nature

NVIDIA 로봇 책임자 Jim Fan의 2025년 결산: 하드웨어는 앞서가나 신뢰성이 아킬레스건 : Jim Fan은 현재 로봇 분야가 여전히 ‘와일드 웨스트’ 상태라고 지적했다. Optimus, Figure 등 하드웨어 엔지니어링은 놀랍지만, 신뢰성 문제가 소프트웨어 반복을 심각하게 제한하고 있으며 업계에 통일된 재현 가능 벤치마크가 부족하다. 그는 특히 VLM 기반의 VLA 패러다임을 비판하며, 시각 인코더가 저수준 디테일을 버리는 것이 로봇의 정교한 조작 요구와 상충된다고 보았다. 또한 ‘Video World Model’이 2026년 로봇 전략 프리트레이닝의 새로운 고지가 될 것이라고 예견했다 (출처: DrJimFan)

Jim Fan总结2025

🎯 동향

Waymo 1200행 Prompt 유출, Gemini 공식 ‘AI 부조종사’ 탑재 : 연구원들이 Waymo 코드를 역분석하여 ‘Ride Assistant’ 메타 프롬프트를 발견했으며, Google Gemini가 차량용 비서로서 승객과 상호작용하는 방식이 드러났다. 프롬프트는 AI가 운전 행동을 평가하거나 스스로를 ‘운전자’라고 칭하는 것을 엄격히 금지하며, 환경 제어, 정보 조회, 정서적 안심 제공으로 제한한다. 이러한 물리적·논리적 이중 격리 메커니즘은 승객이 AI가 운전을 통제한다는 오해를 방지하기 위함이며, 자율주행이 ‘기능 구현’에서 ‘경험 최적화’로 전환됨을 상징한다 (출처: JaneManchunWong)

Waymo Gemini入驻

Anthropic CPO 경고: 2026년 기업 AI는 ‘조직의 벽’을 넘어야 한다 : Mike Krieger는 모델 능력은 이미 기준에 도달했으나, 대부분의 기업 AI 프로젝트가 데이터 권한과 프로세스 정리 단계에서 막혀 있다고 지적했다. 그는 AI의 역할이 ‘질의응답 비서’에서 GitHub의 PR Agent와 같이 ‘결과를 인도하는’ Agent로 전환되었다고 강조했다. 2026년의 핵심은 모델의 지능 수준이 아니라, 기업이 AI에게 책임을 맡길 준비가 되었는지, 즉 명확한 책임 경계와 자동화 워크플로우를 구축했는지 여부다 (출처: MikeKrieger)

OpenAI, 연봉 100만 달러에 ‘종말 책임자’ 급구 : Sam Altman은 모델 강화에 따른 정신 건강 리스크와 고위험 보안 취약점에 대응하기 위해 ‘준비 태세 책임자(Head of Preparedness)’ 채용을 공고했다. 기본급 55.5만 달러에 주식 보상이 포함되며, 이는 Ilya 탈퇴 후 발생한 ‘보안 공동화’를 메우기 위한 긴급 조치로 풀이된다. 새 책임자는 아직 발표되지 않은 강력한 모델을 위한 식별 및 평가 시스템을 구축하여 AI 군비 경쟁에서 통제력을 잃지 않도록 관리할 예정이다 (출처: OpenAI)

OpenAI安全招聘

GEO (생성 엔진 최적화) 급부상, AI 검색이 새로운 마케팅 전장으로 : Doubao, DeepSeek 등 AI 비서로 트래픽이 몰리면서 브랜드들은 SEO에서 GEO로 눈을 돌리고 있다. 이는 AI의 답변 내 브랜드 인용률을 높이기 위함이다. 현재 GEO 시장은 ‘블랙박스’ 단계로, 출처 조작 등 정보 오염 리스크가 존재한다. 분석에 따르면 2029년 이 시장 규모는 3,739억 위안에 달할 것으로 예상되며, AI 검색이 인터넷 마케팅 규칙을 재편하고 있음을 보여준다 (출처: Kimi)

🧰 도구

NVIDIA, 범용 게임 모델 NitroGen 발표 : 이 모델은 컨트롤러 지시계가 포함된 4만 시간의 비디오를 학습하여 별도의 훈련 없이 ‘화면을 보고 게임하기’를 구현했다. 복잡한 Boss전 성능은 아직 평범하지만, 이 모델이 보여준 크로스 게임 일반화 능력은 범용 로봇 연구에 직관적인 기초를 제공한다. NitroGen은 시스템 클록을 가로채 ‘생각 후 조작’을 수행하며 가상 규칙 세계에서 AI의 자습 잠재력을 보여주었다 (출처: NVIDIA)

NitroGen

Claude Code 연간 매출 10억 달러 돌파, 개발자들의 ‘디지털 펜타닐’ 등극 : Anthropic의 사이드 프로젝트인 Claude Code는 출시 반년 만에 강력한 Agent 기능으로 개발 업계를 휩쓸었다. 코드 작성뿐만 아니라 DevOps 및 연구 작업도 자율적으로 처리한다. 많은 시니어 엔지니어들은 Claude Code 숙련도가 새로운 기술적 보너스가 되었으며, 개발자가 ‘인마일체(人機一體)’의 선(禪)적 상태에 진입하게 한다고 전했다 (출처: Anthropic)

Claude Code

Step-DeepResearch: 32B 규모의 효율적인 연구 Agent : 이 보고서는 훈련 목표를 Token 예측에서 ‘원자적 행동’ 결정으로 전환하여 Scale AI 벤치마크에서 OpenAI, Gemini 폐쇄형 시스템과 대등한 수준에 도달한 Step-DeepResearch를 소개했다. 이는 중형 모델도 올바른 Agent화 훈련을 거치면 전문가급의 심층 정보 검색과 논리 검증이 가능함을 증명한다 (출처: Arxiv)

Step-DeepResearch

MAI-UI: 현실 세계를 위한 GUI 조작 Agent : 2B에서 235B 규모를 아우르는 GUI Agent 제품군으로, 자기 진화 데이터 파이프라인과 온디바이스-클라우드 협업 아키텍처를 통해 UI 조작의 취약성 문제를 해결했다. AndroidWorld 등 내비게이션 벤치마크에서 SOTA를 경신하며, AI가 복잡한 모바일 및 데스크톱 앱을 직접 제어할 수 있는 능력을 보여주었다 (출처: Arxiv)

📚 학습

Meta, RPG 데이터셋 오픈소스 공개, AI 과학자 훈련 지원 : Meta는 Hugging Face에 2.2만 개의 다학제적 과제 및 평가 기준을 포함한 Research Plan Generation (RPG) 데이터셋을 출시했다. 이 데이터셋은 과학 연구 경로를 자율적으로 계획할 수 있는 AI 비서를 훈련하기 위해 설계되었으며, ‘AI 과학자’로 나아가는 중요한 초석이다 (출처: _akhaliq)

RPG数据集

스탠퍼드 2025년 AI Index 보고서 발표: AI, 7개 테스트에서 이미 인간 추월 : 보고서에 따르면 AI는 이미지 분류, 시각적 추론, 경진대회 수준의 수학 등 분야에서 인간의 기준선을 완전히 넘어섰다. 현재 유일한 약점은 복잡한 멀티모달 추론이지만, Gemini 3 Pro 등의 모델이 그 격차를 빠르게 좁히고 있다. 동시에 생성형 AI 투자는 전년 대비 18.7% 증가했으며, 업계는 ‘챗봇’에서 ‘실행형 Agent’로 전환되는 임계점에 와 있다 (출처: Stanford)

斯坦福AI报告

딥러닝 다큐멘터리 ‘Thinking Game’ YouTube에서 화제 : AlphaGo 제작팀이 5년간 촬영한 이 영상은 DeepMind가 Pong 게임부터 AlphaFold로 단백질 구조 예측을 정복하기까지의 여정을 생생하게 기록했다. 기술의 진화뿐만 아니라 ‘신시대 맨해튼 프로젝트’로서 AGI의 윤리적 고찰을 다루었으며, 공개 4주 만에 조회수 2억 회를 돌파했다 (출처: YouTube)

思考游戏纪录片

💼 비즈니스

OpenAI, 광고 프로그램 재개하며 상업적 현실에 굴복 : Sam Altman은 광고를 ‘최후의 수단’이라 칭했으나, 막대한 연산 비용과 구독 성장 정체에 직면하여 ChatGPT 광고가 실질적인 설계 단계에 진입했다. OpenAI는 2030년까지 비유료 사용자 광고 수익이 1,100억 달러에 달할 것으로 예상한다. 이러한 ‘문맥 광고’는 대화 흐름에 깊숙이 통합될 것이며, 이는 AI 슈퍼 플랫폼이 기존 인터넷 거물들의 전철을 밟고 있음을 의미한다 (출처: Fortune)

OpenAI商业化

중국 GPU ‘4대 천왕’ 자본 시장 집결 : Moore Threads, Muxi, Biren, Tianshu Zhixin이 2025년 말 일제히 IPO를 추진한다. 막대한 R&D 손실에도 불구하고 국산화 대체와 AI 연산 수요에 힘입어 Tencent, ByteDance 등 거물들의 투자를 받았다. ‘중국판 NVIDIA’를 향한 경쟁은 이제 실험실을 떠나 시장 점유율과 소프트웨어 생태계의 생존 경쟁으로 번졌다 (출처: 36氪)

国产GPU四小龙

AI 프로그래밍 도구 Lovable 가치 66억 달러로 폭등 : ‘Vibe Coding’을 내세운 이 스웨덴 기업은 8개월 만에 연간 반복 매출 1억 달러를 달성했으며, 26세의 공동 창업자는 유럽 최연소 억만장자 반열에 올랐다. Lovable은 텍스트 명령만으로 비기술 사용자가 앱을 구축하게 함으로써 ‘프로그래밍 민주화’가 현재 AI 응용 계층에서 가장 폭발력 있는 분야임을 증명했다 (출처: Forbes)

🌟 커뮤니티

Stack Overflow 조사: 개발자들의 AI 선호도 이례적 급락 : 2025년 개발자 설문조사에 따르면 84%가 AI를 사용함에도 불구하고 선호도는 70%에서 60%로 하락했다. 66%의 프로그래머가 AI가 생성한 ‘그럴듯한’ 코드 때문에 곤혹을 치렀으며, AI Bug를 디버깅하는 것이 직접 코딩하는 것보다 시간이 더 걸린다고 답했다. 이는 기술계가 AI에 대한 맹목적 숭배에서 이성적 검토로 돌아서고 있으며, AI가 생성한 ‘기술 부채의 쓰나미’가 현실적인 고충이 되었음을 반영한다 (출처: StackOverflow)

StackOverflow调查

Rob Pike, AI Village 맹비난: 비열한 기계의 ‘무작위 친절’은 오염일 뿐 : Go 언어의 창시자 Rob Pike는 AI가 자동 생성한 감사 편지를 받고 SNS에 독설을 퍼부었다. 그는 AI 기업들이 지구를 오염시키고 사회를 혼란에 빠뜨리면서 기계가 감정을 흉내 내게 한다고 비판했다. 이 사건은 ‘AI Agent의 자율성 경계’에 대한 격렬한 논쟁을 불러일으켰으며, 커뮤니티는 요청하지 않은 AI 자동 연락이 인간의 주의력에 대한 모욕이라는 데 공감했다 (출처: Bluesky)

Rob Pike愤怒

“Vibe Coding”이 직장 내 분수령으로 부상 : 커뮤니티에서는 “Vibe Coding을 못 하는 기술 팀은 부채”라는 논의가 뜨겁다. 찬성 측은 AI가 프로토타입 검증 속도를 획기적으로 높였으며 인간은 ‘Shoggoth 드라이버’가 되어야 한다고 주장한다. 반면 반대 측은 엔지니어링의 엄격함을 강조하며, 원리를 무시한 개발 방식이 유지보수 불가능한 ‘똥더미’를 만들 것이라고 경고한다. 이 논쟁은 전통적 기술 팀이 ‘인프라’와 ‘AI 네이티브 앱’으로 양극화될 것임을 예고한다 (출처: dotey)

💡 기타

Jeff Dean, 성능 노트 업데이트: 물리 세계의 기저 법칙으로의 회귀 : Google의 전설 Jeff Dean은 AI가 코드를 짤 수 있어도 컴퓨터 하위 계층의 물리 법칙은 변하지 않는다고 재차 강조했다. 그는 엔지니어들에게 지연 시간에 대한 ‘규모감’을 가질 것과 불필요한 추상화 비용을 피할 것을 당부했다. 이 노트는 ‘조기 최적화는 모든 악의 근원’이라는 오해에 대한 강력한 반박으로 간주되며, 성능은 튜닝하는 것이 아니라 설계하는 것임을 강조했다 (출처: JeffDean)

Jeff Dean笔记

미국 테네시주, AI의 ‘정서적 동반자’ 역할 금지 입법 추진 : 이 법안은 AI가 정서적 지지를 제공하거나 인간의 상호작용을 모방하도록 고의로 훈련하는 것을 중죄로 규정한다. 커뮤니티의 반응은 엇갈린다. 사회적 원자화를 막기 위한 필수 조치라는 의견과, 인간의 정서적 기탁 수요를 법으로 막을 수 없다는 ‘디지털 시대의 금주법’이라는 조롱이 공존한다 (출처: Reddit)

AI伴侣立法