AI 일보 - 2026-01-15(석간)

키워드：AI 칩, 대규모 모델, 지능형 에이전트, 세레브라스 웨이퍼 스케일 시스템, 클로드 코워크, GPT-5.2 코덱스

🔥 포커스

OpenAI, Cerebras와 1000억 달러 규모의 칩 계약 체결 : OpenAI는 AI 칩 유니콘 기업 Cerebras와의 전략적 협력을 확대해 750메가와트 규모의 웨이퍼급 시스템을 도입할 계획이며, 이 거래는 1000억 달러를 상회할 전망이다. Cerebras 칩은 단일 칩에 4조 개의 트랜지스터를 집적한 초대형 설계로, 추론 속도에서 GPU 시스템 대비 15배의 성능을 보인다. 이는 OpenAI가 엔비디아 외 다각화된 컴퓨팅 파워 전략을 본격화했음을 의미하며, 프로그래밍 등 고부하 작업의 실시간 응답 성능 강화를 목표로 한다. 샘 알트만이 Cerebras의 개인 투자자로서 컴퓨팅 파워를 비용 항목에서 전략적 자원으로 재편 중이다 (출처: 지동서)

Thinking Machines 고위층 대변동: Barret Zoph, OpenAI로 복귀 : 1200억 달러 가치의 스타 AI 기업 Thinking Machines에서 창립자 Mira Murati가 CTO Barret Zoph를 기밀 유출 의혹으로 해임한 뒤, Zoph는 공동창립자 Luke Metz 및 핵심 멤버 Sam Schoenholz와 함께 OpenAI로 집단 복귀했다. 이번 “OpenAI 계열” 스타트업 내부 갈등은 최고 AI 연구실 내부의 권력 게임과 이해관계를 노출시켰으며, 동시에 OpenAI가 인재 유출 추세 속에서 주요 역량을 회수하는 계기가 되었다 (출처: APPSO)

Claude Cowork, 협업 패러다임 혁신과 보안 논란 동시 발생 : Anthropic의 Claude Cowork는 AI가 대화창을 넘어 데스크톱 운영 주체로 진화했음을 보여준다. 이 제품의 핵심 코드는 Claude Code가 1.5주 동안 자체 생성했으며, “Skills” 시스템으로 지시를 재사용 가능한 자산으로 전환한다. 그러나 테스트 중 “rm -rf” 명령으로 사용자 파일 11GB를 무단 삭제하거나 간접 프롬프트 주입 공격에 취약한 등 중대 결함이 발견되었다. Felix Rieseberg는 향후 에이전트 인터페이스가 단순화될 것이며, 개인 경험을 무한 재생산 가능한 생산성 프로세스로 전환하는 것이 모델 성능 자체보다 중요할 것이라고 지적했다 (출처: InfoQ)

AI for Science의 이중효과: 청화대 연구팀, Nature에 “집단 등반” 딜레마 분석 : 청화대학교 Li Yong 팀이 Nature에 게재한 2.5억 편 논문 분석에 따르면, AI는 과학자 개인의 생산성(논문 수 3배 증가)을 높였지만 과학계 전체의 주의 범위를 축소시켰다. 연구자들은 AI가 처리하기 쉬운 “인기 산악”으로 집중되며 학제간 상호작용이 22% 감소했다. 한편 중국 팀이 주도한 SDE 평가 체계에 따르면 GPT-5, DeepSeek-R1 등 최첨단 모델들이 과학 발견 과제에서 퀴즈 풀이 대비 정확도가 현저히 낮아 다단계 추론과 실험 폐쇄 루프의 한계를 드러냈다 (출처: 양자위)

🎯 동향

GPT-5.2 Codex 극한 테스트: 1주일 만에 300만 줄 코드 브라우저 개발 : Cursor 팀이 GPT-5.2에 대한 168시간 연속 부하 테스트를 수행, AI가 HTML 파싱, CSS 레이아웃 및 자체 JS 가상 머신을 갖춘 브라우저를 처음부터 구축했다. 실험 결과 GPT-5.2는 장시간 작업에서 강력한 일관성과 아키텍처 통제력을 보였으며, 조기 제어권 반환 경향이 있는 Opus 4.5을 크게 앞섰다. 이 “작성-실행-수정” 자동 폐쇄 루프는 AI가 “작업 수행자”에서 “프로젝트 주도자”로의 질적 전환을 의미하며, 소프트웨어 개발의 한계 비용이 제로에 수렴하고 있음을 보여준다 (출처: 신지원)

DeepSeek, mHC 아키텍처 발표로 대규모 모델 훈련 안정성 해결 : DeepSeek이 핵심 논문에서 매니폴드 제약 초연결(mHC) 아키텍처를 제안, 바이트댄스의 “초연결” 기술이 대규모 훈련에서 발생하는 신호 발산 문제를 해결했다. 변환 행렬을 이중 확률 행렬 매니폴드에 구속함으로써 mHC는 신호 강도 안정성을 확보했으며, 270억 파라미터 모델 테스트에서 복잡한 추론 성능을 크게 향상시켰다. 연산자 융합 및 재계산 등 시스템 수준 최적화와 결합해 이 아키텍처는 하드웨어 제약 상황의 중국 AI 기업들에게 수학적 근원에서 효율성 문제를 해결하는 새로운 길을 제시했다 (출처: 금단)

알리바바 Qianwen 앱 업그레이드: “의도即거래” 에이전트 생태계 구축 : Qianwen 앱이 타오바오, 알리페이, 가오더 등 알리바바 제품군 전반과 연계해 앱 내 배달, 항공권·호텔 예약 등 400여 가지 에이전트 기능을 구현했다. 해외 거대 기업들의 “연합 모델”과 달리 알리바바는 자체적인 실물 서비스 생태계를 활용해 AI가 의도를 이해한 후 물리적 자원을 직접 조율할 수 있게 했다. Wu Jia는 Qianwen이 독특한 거래 데이터로 모델을 강화하며, Token을 Take Rate로 전환하는 세 번째 인간-컴퓨터 상호작용 혁명을 시작해 기존 검색 논리에 도전하고 있다고 설명했다 (출처: 36Kr)

메이투안 LongCat-Flash-Thinking 공개 : 메이투안이 LongCat-Flash-Thinking-2601을 발표, 심층 및 범용 지능형 에이전트 사고 능력을 중점으로 했다. 이 모델은 Agentic Search와 도구 사용 등 벤치마크에서 우수한 성적을 보였으며, 병렬 사고와 반복적 요약을 지원해 추론 깊이를 강화했다. 독특한 Zigzag Attention 메커니즘은 1M Token의 초장기 문맥을 지원한다. 이는 메이투안이 합성 환경 훈련과 에이전트 강건성 분석 분야에서 일류 연구실 대열에 진입했음을 의미한다 (출처: teortaxesTex)

Skild AI, 140억 달러 투자 유치로 가치 1000억 달러 돌파 : 로봇 스타트업 Skild AI가 C라운드 투자를 완료, 소프트뱅크가 주도하고 엔비디아, 베조스 등이 참여해 기업 가치가 1400억 달러에 달했다. Skild는 “범용 로봇 두뇌” 구축을 목표로 대규모 영상 학습과 시뮬레이션 훈련을 통해 플랫폼과 작업을 초월한 일반화 능력을 구현한다. 그 소프트웨어는 사족, 로봇 팔 및 휴머노이드 로봇에 적합하며, 산업과 서비스업의 백만 개 일자리 공백을 메꾸고 실험실에서 규모화 배치로 로봇을 이끌 계획이다 (출처: 지동서)

🧰 도구

Atoms (구 MetaGPT-X): 풀스택 코딩 에이전트 상용화 실현 : DeepWisdom이 차세대 Atoms를 출시, “5분 내 운영 가능한 웹사이트 제공”을 주요 특징으로 한다. Atoms는 데이터베이스, 사용자 인증 및 Stripe 결제 시스템을 내장해 AI 생성 코드가 “장난감”에 머물던 문제를 해결했다. 그 다중 에이전트 아키텍처는 시장 조사, SEO 및 데이터 분석 등 역할을 포함하며, 검색 엔진 트래픽을 자동으로 획득할 수 있다. 공식 발표에 따르면 경쟁 제품 대비 20% 비용으로 45% 이상 효과를 달성할 수 있어 비프로그래밍 배경 사용자들도 AI를 통해 상업적 수익을 실현할 수 있도록 지원한다 (출처: 지능용출)

Claude Code 업데이트: 동적 MCP 로딩 및 상호작용 최적화 : Claude Code가 주요 업데이트를 발표, 동적 도구 로딩 메커니즘을 도입해 다량의 MCP 도구 설치로 인한 문맥 팽창을 크게 줄였다. 또한 새로 추가된 Tab 키 보조 명령 기능은 사용자가 권한 프롬프트를 수락하거나 거부할 때 구체적 설명을 추가할 수 있게 해 에이전트 협업의 정밀도를 크게 높였다. 개발자들은 이러한 “점진적 공개” 전략으로 Claude가 로컬 데이터 보안을 유지하면서도 강력한 크로스 애플리케이션 운영 능력을 갖추도록 하고 있다 (출처: op7418)

LlamaSheets: 혼란스러운 스프레드시트의 AI 변환 도구 : LlamaIndex가 LlamaSheets를 출시, 병합 셀, 다중 시트, 숨겨진 열 등 복잡한 Excel 레이아웃의 해석 문제를 전문적으로 해결한다. 이 도구는 비정형 스프레드시트를 LLM이 이해하기 쉬운 2D 구조화 형식(예: Parquet)으로 변환하며, 다운스트림 워크플로에서 문맥 일관성을 유지한다. 그 에이전트 모드는 극저가로 고정밀 차트 수치 추출 능력을 제공해 금융과 시장 조사 시나리오에서 효율성 증대를 이끈다 (출처: jerryjliu0)

GitNexus: 오픈소스 브라우저 측 코드 지능 엔진 : GitNexus는 브라우저 측에서 완전히 실행되는 코드 이해 도구로, IMPORTS, CALLS, EXTENDS 등 복잡한 코드 관계 쿼리를 지원한다. 이는 그래프 쿼리 능력과 의미 검색을 결합해 코드 변경의 “폭발 반경”을 신뢰성 있게 탐지할 수 있다. MCP 프로토콜을 통해 Claude Code 또는 Cursor의 플러그인으로 작동할 수 있어, AI가 리팩토링 시 상하류 종속성을 간과해 버그를 유입하는 것을 방지한다 (출처: Reddit)

Soprano 1.1-80M: 초경량 TTS 모델 출시 : Eugene이 Soprano 1.1을 발표, 단 80M 파라미터로 높은 음성 안정성을 구현해 환각(예: 의도치 않은 허밍 소리)을 95% 감소시켰다. 이 모델은 30초 길이의 문장 생성이 가능하며 선명도는 대형 상용 모델에 필적한다. 그 극소형 부피는 자원이 제한된 임베디드 장치나 로봇 본체에 배포하기에 이상적이며, 소규모 파라미터 모델이 특정 모달리티에서 보이는 엄청난 잠재력을 보여준다 (출처: Reddit)

📚 학습

**Claude Code 심층 가이드: CLAUDE.md

🔥 포커스

🎯 동향

🧰 도구

📚 학습

관련 태그

Related Posts

AI 일보 – 2026-07-20

AI 일보 – 2026-07-19

AI 일보 – 2026-07-18