AI 일보 – 2025-12-26(석간)

키워드:대형 모델, AI 유니콘, OpenAI, 엔비디아, 메타, AI 추론, AI 컴퓨팅 파워, AI 음악, GLM-4.7 모델, GPT-5.2-Codex-XMas, Groq LPU 아키텍처, Self-play SWE-RL, Nemotron 3 시리즈

🔥 포커스

Zhipu AI와 MiniMax, ‘글로벌 Large Model 1호 상장사’ 경쟁 : 베이징의 Zhipu AI(智谱华章)와 MiniMax(稀宇科技)가 잇따라 홍콩 증권거래소 상장 승인을 통과하고 투자설명서를 공개하며, 중국 AI 유니콘 기업들의 본격적인 자본화 행보를 알렸습니다. Zhipu AI의 2024년 매출은 3억 1,200만 위안에 달해 130% 이상의 복합 성장률을 기록했으나, 컴퓨팅 비용 급증으로 인해 2025년 상반기 손실은 23억 5,800만 위안에 이르렀습니다. 이와 동시에 Zhipu AI는 GLM-4.7 모델을 발표 및 오픈소스로 공개했으며, 프로그래밍 벤치마크인 Code Arena에서 오픈소스 부문 1위를 차지하며 GPT-5.2를 능가하는 강력한 기술 반복 능력을 입증했습니다. 이번 IPO는 단순한 자금 조달을 넘어, 순수 Large Model 기업의 가치를 측정하는 시장의 ‘척도’가 될 것으로 보입니다 (출처: 36Kr, Market Crystal)

Zhipu AI와 MiniMax, ‘글로벌 Large Model 1호 상장사’ 경쟁

OpenAI, 크리스마스 에디션 Codex 출시하며 ‘Agentic Programming’ 심화 : OpenAI가 크리스마스 기간에 GPT-5.2-Codex-XMas를 출시했습니다. 이 모델은 GPT-5.2의 성능을 유지하면서 개인화 업그레이드를 진행했으며, 구독 사용자에게는 두 배의 사용 한도를 제공했습니다. 이번 업데이트는 단순한 시즌 마케팅을 넘어, Codex를 ‘엔지니어링 Agent’로 포지셔닝하려는 OpenAI의 전략적 변화를 보여줍니다. 긴 Context 이해, 파일 간 작업 처리 및 Windows 네이티브 도구 체인 최적화가 강화되었습니다. 개발자들은 복잡한 프로젝트 구현에서 이 모델의 완성도가 대부분의 경쟁 모델보다 우수하다는 것을 확인했으며, 이는 2026년이 ‘AI가 코드를 짜는’ 시대에서 ‘AI가 엔지니어링을 관리하는’ 시대로 진화할 것임을 예고합니다 (출처: Sino Intelligence, op7418)

OpenAI, 크리스마스 에디션 Codex 출시

Axiom Math: AI 추론의 새로운 ‘검증’ 표준 정의 : 24세의 스탠퍼드 중퇴자 Carina Hong이 설립한 Axiom Math가 6,400만 달러의 투자를 유치하며 기업 가치 3억 달러를 기록했습니다. 이 회사는 논리적 정확성을 스스로 검증할 수 있는 ‘AI 수학자’ 개발에 주력하고 있습니다. 핵심 돌파구는 Lean 프로그래밍 언어를 도입하여 AI의 모든 추론 단계에 형식적 증명을 부여함으로써, Large Model 결과물의 ‘검증’이 어려웠던 신뢰 문제를 해결한 것입니다. Putnam 수학 경시 대회에서 이 시스템은 9개의 난제를 스스로 해결하고 모두 검증을 통과했습니다. 이러한 진전은 AI가 모호한 ‘답변 생성’에서 엄격한 ‘논리 자증’으로 나아가고 있음을 의미하며, 과학 연구 및 산업 분야의 신뢰할 수 있는 파트너가 될 전망입니다 (출처: AI Deep Researcher)

NVIDIA, Groq와 기술 라이선스 체결로 컴퓨팅 및 메모리 병목 현상 대응 : HBM 메모리 가격 폭등 및 공급 부족에 직면한 NVIDIA가 Groq와 비독점적 기술 라이선스 계약을 체결했습니다. Groq의 설립자 및 핵심 팀은 NVIDIA에 합류하여 추론 기술 통합을 지원할 예정입니다. Groq의 LPU 아키텍처는 SRAM을 주 메모리로 사용하여 기존 HBM보다 대역폭이 수 배 높으며, 추론 과정에서의 메모리 액세스 병목 현상을 크게 완화합니다. 이번 행보는 NVIDIA가 ‘메모리 기근’ 상황에서 개척한 제2의 전선으로 간주되며, 새로운 메모리 기술 경로 탐색을 통해 DRAM 공급망 리스크를 상쇄하고 AI 추론 시장에서의 지배력을 공고히 하려는 의도로 풀이됩니다 (출처: Heart of the Machine, op7418)

NVIDIA, Groq와 기술 라이선스 체결

🎯 동향

Meta, Self-play SWE-RL 출시로 Agent 자기 진화 구현 : Meta 연구팀이 SSR 프레임워크를 발표했습니다. 이 프레임워크는 소프트웨어 엔지니어링 Agent가 인간의 라벨링 없이 ‘Bug 주입’과 ‘Bug 수정’의 Self-play 메커니즘을 통해 스스로 학습할 수 있게 합니다. 이 방식은 소스 코드 샌드박스 접근만으로 가능하며, Agent는 자기 주도적 진화 루프 속에서 고품질의 난제를 생성하고 스스로 해결합니다. 실험 결과 SSR은 학습 과정에서 성능이 지속적으로 향상되었으며, 기존 Reinforcement Learning 방식보다 우수한 성과를 보였습니다. 이는 AI Agent가 ‘Super Intelligence’를 향해 나아가고 있으며, 시스템 이해 및 자율 소프트웨어 생성 측면에서 인간의 능력을 초월할 가능성을 시사합니다 (출처: Academic Headlines)

Meta, Self-play SWE-RL 출시

Liquid AI, 최강의 3B 모델 발표 및 Reinforcement Learning 효과 입증 : Liquid AI가 순수 Reinforcement Learning으로 구축된 실험적 모델 LFM2-2.6B-Exp를 출시했습니다. 이 모델은 지시 이행, 지식 및 수학 벤치마크에서 탁월한 성능을 보였으며, IFBench 점수는 규모가 263배 더 큰 DeepSeek R1을 능가했습니다. 커뮤니티 피드백에 따르면 이 모델은 ‘박사급 지식’을 갖추고 있으며 iPhone과 같은 온디바이스 환경에서도 원활하게 작동합니다. 이는 효율적인 알고리즘 설계와 RL 최적화를 통해 작은 파라미터 모델도 특정 분야에서 최상위 모델에 필적하는 성능을 낼 수 있음을 다시 한번 증명했습니다 (출처: maximelabonne, huggingface)

Liquid AI, 최강의 3B 모델 발표

ChatGPT 안드로이드 버전 코드에서 광고 삽입 계획 유출 : 개발자들이 ChatGPT 안드로이드 베타 버전 코드에서 ‘ads feature’, ‘search ad’ 등 광고 관련 문자열을 발견했습니다. Sam Altman은 광고가 ‘최후의 수단’이라고 언급한 바 있으나, 2025년 상반기 지출이 25억 달러에 달하는 재무적 압박 속에서 OpenAI가 무료 사용자 대상 수익화를 준비하기 시작한 것으로 보입니다. 계획된 광고 형태는 사이드바 스폰서 메시지나 ‘대화형 추천’ 등이 포함될 수 있으며, 자연스러운 대화를 방해하지 않으면서 의도 지향적인 수익화를 목표로 합니다. 이는 AI 검색이 ‘절대적 청정’ 시대를 마감할 것임을 예고합니다 (출처: Face AI)

NVIDIA, Long Context와 Agent 능력 강조한 Nemotron 3 시리즈 발표 : NVIDIA가 하이브리드 Mamba-Transformer 아키텍처와 Mixture-of-Experts(MoE) 기술을 채택한 Nemotron 3 제품군(Nano, Super, Ultra)을 출시했습니다. 이 시리즈는 최대 1M의 Context 길이를 지원하며, Agent 추론 및 다단계 도구 호출에 최적화된 Post-training을 거쳤습니다. Nano 버전은 동급 소형 모델 중 선도적인 정확도와 매우 낮은 추론 비용을 자랑하며, Ultra 버전은 SOTA급 추론 성능을 지향합니다. NVIDIA는 모델 가중치, 학습 소프트웨어 및 레시피를 오픈소스로 공개하여 생태계를 더욱 풍성하게 만들겠다고 약속했습니다 (출처: Reddit)

SAM 3: 픽셀 클릭에서 ‘개념 명명’으로 진화 : Meta가 SAM 3(Segment Anything with Concepts)를 발표하며 비디오 분할 기술을 ‘포인트 선택’ 모드에서 ‘개념 인식’으로 업그레이드했습니다. 사용자가 ‘안경 쓴 사람’이라고 입력하면 모델이 이미지나 비디오 내에서 해당 조건에 맞는 모든 객체를 자동으로 찾아냅니다. 400만 개의 고유 개념에 대한 자동화 학습을 통해 SAM 3는 복잡한 비디오 벤치마크인 MOSEv2에서 정확도를 47.9%에서 60.3%로 끌어올렸습니다. 이러한 돌파구는 시각 세계에 대한 AI의 의미론적 이해 능력을 크게 강화하여 비디오 분할의 가림 현상 및 일관성 문제를 해결했습니다 (출처: ylecun)

SAM 3

🧰 도구

GAIT 및 GaitHub: AI 추론을 위한 ‘Git’ 버전 관리 시스템 : AI 의사결정의 추적 및 재현 불가능 문제를 해결하기 위해 개발자들이 GAIT를 출시했습니다. 이 시스템은 AI 상호작용을 사용자 의도, 모델 응답, 추론 분기 및 메모리 상태를 포함하는 콘텐츠 주소 지정 객체로 간주합니다. GAIT를 통해 개발자는 코드를 관리하듯 AI 추론 과정에 대해 버전 관리, 분기 실험 및 의사결정 병합을 수행할 수 있습니다. 함께 제공되는 GaitHub 클라우드 플랫폼은 협업과 감사를 지원하여 기업급 AI 워크플로우에 필요한 엔지니어링 인프라를 제공하고, ‘AI가 왜 그렇게 결정했는가’라는 블랙박스 문제를 해결합니다 (출처: Reddit)

GAIT

DeepFabric: 특정 MCP 서비스를 위한 도구 호출 미세 조정 프레임워크 : DeepFabric은 개발자가 모든 MCP 서버나 도구 세트에 대해 도메인별 추론 데이터셋을 자동으로 생성할 수 있게 해주는 오픈소스 도구입니다. 격리된 WebAssembly 환경에서 실제 도구 궤적을 실행함으로써, 이 프레임워크는 Qwen3-4B와 같은 소형 모델을 미세 조정하여 특정 작업(예: Blender 제어)에서 Claude 4.5 및 Gemini 2.5를 능가하는 성능을 내게 합니다. 이는 고성능, 저비용의 수직 도메인 전문가 Agent를 구축하기 위한 명확한 경로를 제시합니다 (출처: Reddit)

Quint: CLI를 넘어 챗봇에 대화형 UI 도입 : Quint는 LLM 기반 상호작용을 순수 텍스트에서 구조화되고 확정적인 UI로 전환하기 위한 React 라이브러리입니다. 개발자가 명시적인 옵션을 정의하면 사용자가 클릭을 통해 특정 정보 표시나 구조화된 입력을 트리거할 수 있습니다. 핵심 개념은 모델 수신, 사용자 시각화 및 출력 렌더링을 분리하여 MCQs, 롤플레잉 분기 등의 시나리오에서 상호작용을 더욱 제어 가능하게 만드는 것입니다. Quint는 특정 AI 제공업체에 의존하지 않으며, 향후 LLM이 동적 UI 컴포넌트를 직접 렌더링하여 사용자 경험을 향상시킬 것임을 예고합니다 (출처: Reddit)

Quint

📚 학습

Hugging Face, 무료 AI 강의 시리즈 공개 : Hugging Face가 휴가 시즌을 맞아 최신 AI 기술을 아우르는 무료 강의 매트릭스를 출시했습니다. 내용에는 LeRobot을 사용한 로봇 제작 Robotics 강의, 모델 컨텍스트 프로토콜을 배우는 MCP 강의, Agent 구축 및 배포를 위한 Agents 강의, 그리고 LLM, Deep Reinforcement Learning, Diffusion 모델 등 심화 기술 튜토리얼이 포함됩니다. 이 강의들은 HF 생태계 라이브러리를 기반으로 하며, 개발자들이 기초 모델부터 최첨단 Agent 아키텍처까지 실전 기술을 빠르게 습득할 수 있도록 돕습니다 (출처: huggingface)

Hugging Face 강의

WildVideo: 비디오 QA 환각 현상을 체계적으로 분류한 최초의 벤치마크 : 국방과기대와 중산대 팀이 WildVideo 벤치마크를 발표했습니다. 멀티모달 모델의 비디오 상호작용 중 발생하는 ‘환각(Hallucination)’ 문제에 대해 지각, 인지 및 Context 이해 등 9가지 작업 유형을 정의했습니다. 실험 결과 GPT-4o조차 다중 라운드 작업에서의 정확도가 52.7%에 불과했으며, 1인칭 시점 비디오에서 특히 취약한 모습을 보였습니다. 이 벤치마크는 동적 지각, 심층 추론 및 긴 대화 일관성 측면에서 모델의 결함을 진단하는 정밀한 도구를 제공하며, 비디오 이해 평가를 실제 상호작용 수준으로 끌어올렸습니다 (출처: Sino Intelligence)

WildVideo

PhononBench: AI 생성 결정(Crystal) 안정성 평가를 위한 새로운 척도 : PhononBench는 AI가 생성한 결정의 동역학적 안정성을 평가하는 최초의 대규모 벤치마크입니다. MatterSim 포텐셜 함수를 통해 6개의 주요 생성 모델이 산출한 10만 개 이상의 구조에 대해 효율적인 계산을 수행했습니다. 결과적으로 현재 모델들의 보편적인 한계가 드러났는데, 평균 안정성이 25.83%에 불과했습니다. 이 연구는 생성 모델의 물리적 타당성 부족을 지적했을 뿐만 아니라, 포논(Phonon) 안정성이 확인된 2.8만 개의 결정 구조를 선별하여 향후 신소재 탐색을 위한 신뢰할 수 있는 후보군을 제공했습니다 (출처: HuggingFace)

💼 비즈니스

AI 거물들의 1,200억 달러 ‘유령 부채’ 우려 확산 : Meta, xAI 및 Oracle 등 빅테크 기업들이 특수목적법인(SPV)을 통해 1,200억 달러 이상의 데이터 센터 지출을 대차대조표 밖으로 이전하고 있습니다. 이러한 부외금융 방식은 기업의 신용 등급을 보호하지만, 거대한 금융 리스크를 은폐하기도 합니다. AI 수요가 기대에 미치지 못할 경우, 막대한 부채가 월가에 연쇄 반응을 일으킬 수 있습니다. UBS 데이터에 따르면 올해 약 1,250억 달러의 자금이 이러한 ‘프로젝트 파이낸싱’으로 유입되었으며, 이는 AI 군비 경쟁이 고위험 자본 게임 단계에 진입했음을 반영합니다 (출처: Cailian Press)

AI 유령 부채

인도 ‘AI 괴물주’, 550배 폭등했으나 칩 사업 전무한 것으로 밝혀져 : 인도의 RRP Semiconductor Ltd. 주가가 지난 20개월 동안 55,000% 폭등하며 시가총액이 17억 달러로 치솟아 NVIDIA의 상승폭마저 추월했습니다. 그러나 조사 결과, 이 회사는 정규 직원이 2명뿐이며 반도체 제조 활동을 전혀 수행하지 않았고 매출조차 마이너스인 것으로 드러났습니다. 이 황당한 현상은 AI 개념에 대한 인도 개인 투자자들의 맹목적인 추종과 규제 공백을 보여주며, 2025년 AI 거품의 가장 전형적인 투기 경고 사례가 되었습니다 (출처: Sino Intelligence)

인도 AI 괴물주

AI 컴퓨팅 수요로 256GB 메모리 가격이 RTX 5090 추월 : OpenAI 등 거대 기업들이 전 세계 DRAM 공급의 40%를 선점하면서 메모리 시장에 구조적 품귀 현상이 나타나고 있습니다. 단일 256GB DDR5 메모리의 시중 가격은 3,500~5,000달러까지 치솟아 최상위 그래픽카드 가격을 훨씬 넘어섰습니다. 이는 AI 서버용 HBM 및 고성능 메모리에 대한 높은 입찰가가 소비자용 생산 용량을 잠식하고 있음을 반영합니다. PC 부품뿐만 아니라 AI PC 개념에 따른 대용량 메모리 수요가 진입 장벽을 더욱 높였으며, 일반 소비자들은 AI 프리미엄으로 인한 하드웨어 비용 급증에 직면해 있습니다 (출처: Heart of the Machine)

메모리 가격 상승

🌟 커뮤니티

2025년 AI 핵심 키워드 결산: ‘Vibe Coding’부터 ‘Slop’까지 : 《MIT 테크놀로지 리뷰》가 올해의 AI 어휘를 선정했습니다. 사람이 목표만 말하면 AI가 구현을 담당하는 ‘Vibe Coding’이 1위를 차지했습니다. 또한 ‘추론 모델’, ‘세계 모델’은 기술적 깊이의 진화를 반영하며, ‘Slop(AI 쓰레기 콘텐츠)’과 ‘거품’은 콘텐츠 범람과 자본 과열에 대한 커뮤니티의 성찰을 보여줍니다. 아울러 ‘GEO(생성 엔진 최적화)’가 SEO를 대체하며 AI 시대 브랜드가 트래픽을 확보하는 새로운 전쟁터로 부상하고 있습니다 (출처: Tencent Technology, Silicon Star GenAI)

AI 핵심 키워드

Yann LeCun 공유: 인간과 LLM 판단력의 ‘일곱 가지 균열’ : 인간과 LLM의 7가지 인식 단계별 판단 차이를 비교한 논문이 화제입니다. 논문은 LLM이 지각 고정, 동기 유발, 인과 추론 및 메타 인지 측면에서 근본적인 결함이 있다고 지적합니다. LLM이 생성하는 언어는 유창하고 그럴듯해 보이지만, 본질은 ‘마음’이 아닌 확률적 예측입니다. 커뮤니티에서는 이러한 ‘인공지능의 똑똑해 보이는 느낌’이 검증 없이 사용될 때 매우 오도될 수 있으며, 인간이 ‘신뢰 편향’ 때문에 AI의 출력을 과도하게 믿는 것이 AI 시대의 구조적 도전 과제가 될 것이라고 논의하고 있습니다 (출처: ylecun)

판단력 균열

Reddit 열풍: ChatGPT를 인지 재활 도구로 활용 : PTSD 병력이 있는 한 사용자가 ChatGPT를 구조화된 인지 지원 도구로 활용한 경험을 공유했습니다. 장기간의 상호작용 대화를 통해 사용자는 감정 조절, 논리 정리 및 자기 옹호 측면에서 임상의가 인정할 만한 괄목할 성과를 거두었습니다. 커뮤니티는 AI가 어떻게 ‘일관된 거울’로서 심리 재활을 도울 수 있는지에 주목하는 동시에, 과도한 의존 및 AI가 생성할 수 있는 오도된 ‘에코 체임버’ 효과에 대해서도 경계하고 있습니다 (출처: Reddit)

💡 기타

알츠하이머병 동물 실험에서 완전 역전 성공 : 케이스 웨스턴 리저브 대학교 연구팀이 《Cell Reports Medicine》에 획기적인 연구 결과를 발표했습니다. 화합물 P7C3-A20을 통해 뇌의 NAD+ 균형을 복구함으로써 말기 알츠하이머병 쥐의 신경 기능을 완전히 회복시켰습니다. 단순히 NAD+를 보충하는 것과 달리, 이 요법은 정밀 조절에 집중하여 병리적 손상을 복구할 뿐만 아니라 기억 능력까지 되살렸습니다. 인체 적용까지는 시간이 걸리겠지만, 치매의 ‘완치’를 향한 희망의 문을 열었습니다 (출처: dotey)

알츠하이머병 돌파구

Stardust Intelligence, 로프 구동 로봇으로 럭키박스 판매 투입 : 크리스마스 당일, Stardust Intelligence가 개발한 로프 구동(Rope-driven) 휴머노이드 로봇 S1이 베이징, 상하이, 광저우 등 여러 상권에서 정식 ‘아르바이트’를 시작했습니다. 음성 응대, 럭키박스 잡기 및 상품 전달 업무를 수행했습니다. 로프 구동 기술은 로봇에게 인간의 근육과 같은 유연성과 정밀한 힘 제어 능력을 부여하여, 인간과의 상호작용에서 더 안전하고 민첩하게 반응하게 합니다. 회사가 제시한 ‘분신 지능’ 개념은 로봇이 원격 조작을 통해 위험한 실험실이나 원격 서비스 등 실제 현장에 먼저 진입하는 것을 목표로 합니다 (출처: Intelligent Emergence)

로프 구동 로봇

AI 음악 히트곡 《7일간의 연인》, 저작권과 주의력 전쟁 유발 : 한 프로그래머가 DeepSeek와 AI 음악 도구를 활용해 만든 《7일간의 연인(七天爱人)》이 NetEase Cloud Music에서 조회수 200만 회를 돌파하고 저작권이 수만 위안에 판매되었습니다. 이 사건은 AI 음악이 실제 수익 창출 능력을 갖추었으며 기존 저작권 체계에 충격을 주고 있음을 증명합니다. ByteDance의 Soda Music은 TikTok 생태계를 통해 히트 경로를 정의하고 있으며, Tencent와 NetEase는 심의 및 수익 배분에서 엄격한 방어 태세를 취하고 있습니다. AI가 가져온 ‘무한 공급’은 플랫폼들이 저작권 경쟁에서 주의력 배분 효율성 전쟁으로 전환하도록 강요하고 있습니다 (출처: Shixiang)

AI 음악