AI 일보 – 2026-01-21(조간)

키워드:xAI, 딥시크(DeepSeek), 테슬라 AI 칩, 매크로하드 프로젝트(Macrohard 프로젝트), 모델1 아키텍처(Model1 구조), AI5 칩

🔥 포커스

xAI 핵심 전략 유출: 머스크, 내부 기밀을 털어놓은 엔지니어 해고: xAI 엔지니어 Sully가 팟캐스트에서 회사 핵심 기밀을 유출한 혐의로 해고되었습니다. 유출된 내용은 다음과 같습니다: 1. Macrohard 프로젝트: 소프트웨어 적응 없이도 인간의 디지털 세계 행동을 시뮬레이션하는 “인간 시뮬레이터” 개발을 목표로 함; 2. Tesla 연산 네트워크: HW4 하드웨어를 탑재한 북미 지역 수백만 대의 유휴 테슬라 차량 연산 자원을 임대해 AI를 실행하는 분산 배포 계획; 3. 속도 우선 전략: xAI는 인간보다 8배 빠른 실행 속도를 추구하며, 깊은 추론보다는 극한 속도로 작업을 완료하는 것이 더 큰 상업적 가치가 있다고 판단. 이번 유출로 OpenAI, Google 등 경쟁사들이 xAI의 기술 로드맵과 배포 카드를 직접 파악하게 되었습니다 (출처: dotey)

xAI 핵심 전략 유출

DeepSeek “Model1” GitHub에 등장: V4 시대 개막될까: DeepSeek 공식 FlashMLA 저장소 최근 업데이트에서 “MODEL1” 참조와 특정 바이트 정렬 구성(576B)이 코드에 명시되었습니다. 커뮤니티 분석에 따르면, 이는 DeepSeek의 차세대 플래그십 모델(V4)의 아키텍처 코드명일 가능성이 높습니다. DeepSeek은 이미 Vx와 Rx 시리즈를 구분하지 않겠다고 발표한 바 있어, MODEL1이 최신 “추론-범용” 통합 아키텍처를 나타낼 것으로 보입니다. R1 출시 1주년을 맞아 이 기술 동향은 국산 오픈소스 모델의 또 다른 경계 돌파에 대한 개발자들의 기대를 불러일으키고 있습니다 (출처: teortaxesTex, Teknium)

DeepSeek "Model1" GitHub 등장

Google AI 중량급 논문: 사고 사슬의 본질은 “사고 사회” 내부 토론: GoogleAI의 최신 연구 《Reasoning Models Generate Societies of Thought》는 o1, R1 등 추론 모델의 우수한 성능 배경을 밝혔습니다. 연구에 따르면, “더 오래 생각한다”는 것은 표면적 현상에 불과하며, 본질적으로 모델은 내부에서 여러 역할 간의 “사회적 토론”을 시뮬레이션합니다: 자신의 단계를 의심하고, 대안을 탐구하며, 의견 차이에서 합의를 도출합니다. 이 메커니즘은 인간 집단 이성과 매우 유사합니다. 실험 결과, 이러한 “사회적” 행동이 정확도 향상에 20% 이상 기여하는 것으로 나타나, 추론 모델이 단순한 명령 수행에서 복잡한 다차원 인지로 진화하고 있음을 입증했습니다 (출처: NerdyRodent)

Google AI 중량급 논문

머스크, 테슬라 AI 칩 패밀리 공개: 9개월 주기의 광적인 반복: 머스크는 AI5 칩 설계가 완료되었으며 성능이 전작 대비 50배 향상될 것이라고 발표했습니다. 이 칩은 스마트카와 Optimus 로봇을 연결할 예정입니다. 차세대 AI6은 “훈련-추론 일체화”를 목표로 데이터 센터 훈련과 단말 추론 간의 하드웨어 장벽을 허물고자 합니다; AI7은 “우주 연산”을 겨냥해 스타십과 스타링크에 방사선 저항 컴퓨팅을 제공할 계획입니다. 머스크는 칩 반복 주기를 9개월로 단축하고 2나노미터 웨이퍼 파브리카 TeraFab 자체 건설을 검토 중입니다. 이 전략은 극한의 수직 통합을 통해 엔비디아 의존에서 벗어나, 연산력을 핵심으로 한 “규소 기반 생명” 생태계 구축을 목표로 합니다 (출처: 36Kr)

🎯 동향

GLM-4.7-Flash 출시: 로컬 추론 모델의 새로운 기준: Zhipu AI가 로컬 배포 최적화 30B MoE 추론 모델 GLM-4.7-Flash를 선보였습니다. 이 모델은 200K 컨텍스트를 지원하며, SWE-Bench 프로그래밍 테스트와 GPQA 추론 테스트에서 우수한 성능을 보였습니다. Unsloth가 이미 양자화 버전을 제공해 24GB 그래픽 메모리만으로 실행 가능합니다. 이 모델은 사고 사슬(CoT) 과정에서 명확한 논리 단계(분석, 브레인스토밍, 초안, 완성, 다듬기)를 보여주어, GPT-OSS-120B 등 로컬 작업 부하 모델을 대체할 가능성이 있는 것으로 커뮤니티에서 평가받고 있습니다 (출처: Zai_org, danielhanchen)

GLM-4.7-Flash 출시

Anthropic “어시스턴트 축” 연구: 모델의 인격과 안정성 확보: Anthropic의 최신 연구 《The Assistant Axis》는 LLM의 역할 공간을 탐구했습니다. 연구 결과 모델 내부에는 “어시스턴트 축”이라는 주도적 축이 존재하며, 이는 모델이 기본 어시스턴트 모드로 나타나는 정도를 결정합니다. 이 축에서 벗어나면 “인격 표류”가 발생해 기이하거나 유해한 행동을 야기합니다. “활성화 캡핑” 기술을 통해 모델을 어시스턴트 축의 특정 영역으로 제한함으로써, 역할 기반 탈옥 공격을 효과적으로 방어하고 감정적으로 취약한 시나리오에서 모델의 안정성을 유지할 수 있습니다 (출처: AndrewLampinen, Teknium)

Anthropic "어시스턴트 축" 연구

STEM 기술: 라우팅 없이 Transformer 메모리 확장 가능: 카네기 멜론 대학과 Meta가 공동으로 STEM(임베딩 모듈을 통한 Transformer 스케일링) 기술을 제안했습니다. 이 기술은 FFN의 부분 업샘플링을 정적, 토큰 인덱스 기반 임베딩 조회로 대체해, 연산량 증가 없이도 라우팅 불안정성을 유발하지 않으면서 매개변수 규모를 확장합니다. 매개변수를 CPU에 비동기적으로 프리페치할 수 있어 모델 용량과 토큰당 FLOPs를 분리하며, 초대규모 희소 모델을 위한 간단하고 효율적인 새로운 경로를 제공합니다 (출처: TheTuringPost)

STEM 기술

DSPy RLM 모듈 출시: 재귀 언어 모델 시대 개막: DSPy 3.1.2가 dspy.RLM 모듈을 정식 출시했습니다. 이 모듈은 재귀 추론 전략을 지원해 모델이 복잡한 작업 처리 시 자기 참조와 다중 반복을 할 수 있게 합니다. 개발자는 단 한 줄의 코드 변경으로 새로운 추론 능력을 해제할 수 있습니다. 커뮤니티는 RLM이 장기 실행 시스템, 복잡한 컨텍스트, 재귀 계산 관리를 위한 표준 방식이 될 것이며, 이는 LLM 추론이 선형에서 재귀 구조로 진화하는 이정표가 될 것이라고 평가합니다 (출처: lateinteraction)

DSPy RLM 모듈 출시

🧰 도구

Claude Code 개발자 커뮤니티 석권: 프로그래밍 Agent의 효율 혁명: Anthropic의 명령줄 도구 Claude Code가 최근 극찬을 받았습니다. 개발자 피드백에 따르면, Python 라이브러리 유지보수, 복잡한 버그 수정 등 작업에서 동종 제품을 압도하는 성능을 보였습니다. 이 도구는 코드 변경 이유를 자동으로 이해하고, 계획을 검토하며, 다중 작업을 처리할 수 있습니다. Reddit 사용자 테스트 결과, SWE-bench 테스트에서 GPT-5.2를 코드 검토자로 Claude Opus 4.5와 협업하면 해결률이 80%에서 90%로 향상되었으며, 소요 시간은 2.2배 증가했지만 다중 Agent 협업의 거대한 잠재력을 입증했습니다 (출처: RisingSayak, Reddit)

Claude Code

Craft Agents 오픈소스화: Claude Code에 우아한 UI 입히기: Claude Agent SDK와 Electron 기반으로 개발된 Craft Agents가 정식 오픈소스로 공개되었습니다. 이 프로젝트는 Claude Code의 강력한 능력을 유지하되, 명령줄이 계획 검토나 코드 변경 이해에 어려움을 겪는 문제를 세심하게 설계된 그래픽 인터페이스로 해결했습니다. 이 프로젝트는 100% Claude가 작성한 코드로, 비전문가도 Agent를 통해 복잡한 생산성 도구를 구축할 수 있음을 입증했습니다. 저자는 “Fork + Remix”의 미래 소프트웨어 개발 모델을 주창합니다 (출처: dotey)

Craft Agents 오픈소스

Kimi Slides: 저평가된 PPT 판매 매뉴얼 생성 도구: Kimi가 출시한 PPT 플러그인은 강력한 실용성을 보였습니다. 사용자가 간단한 지시(예: “맨해튼 상위 20개 고급 주택 평면도 수집 후 바우하우스 스타일 40페이지 판매 매뉴얼 생성”)만으로 시스템이 자동으로 정보 수집, 이미지 크롭, 단가 추출, 비교 차트 생성 등을 수행합니다. 대형 모델 능력을 원자화해 단일 핵심 문제 해결에 집중하는 이러한 Skill은 수직 오피스 시나리오에서 AI의 높은 전환 가치를 보여줍니다 (출처: crystalsssup)

📚 학습

SIN-Bench: 다중 모달 과학 문헌 이해 신규 벤치마크: HuggingFace 일일 논문에서 SIN-Bench가 소개되었습니다. 이는 MLLM이 장편 과학 논문을 진정으로 이해하는지 평가하기 위한 벤치마크로, “증거 사슬 추적” 모드를 도입해 모델이 텍스트와 삽화가 교차하는 문서에서 명시적인 교차 모달 증거 사슬을 구축하도록 요구합니다. 실험 결과, Gemini-3-pro가 종합 점수에서 선두를 달렸으며, GPT-5는 답변 정확도는 최고였으나 증거 정렬 측면에서 부진해 “추적 가능한 추론” 분야의 병목 현상을 드러냈습니다 (출처: HuggingFace)

Medical SAM3: 범용 의료 이미지 분할 벤치마크 모델: 연구진은 10종 의료 영상 모달리티, 33개 데이터셋에서 전매개변수 미세 조정을 통해 Medical SAM3를 선보였습니다. 이 모델은 원본 SAM3의 의료 분야 성능 급감 문제를 극복하고, 복잡한 해부학적 구조와 장거리 3D 컨텍스트 처리에서 강력한 일반화 능력을 보여 텍스트 유도 의료 영상 분할의 새로운 표준을 확립했습니다 (출처: HuggingFace)

YaPO: 희소 활성화 벡터 기반 도메인 적응 신규 방법: 논문 《YaPO: Learnable Sparse Activation Steering Vectors》는 희소 자동 인코더(SAE) 잠재 공간에서 희소 조향 벡터를 학습하는 방법을 제안했습니다. 기존 밀집 벡터 대비 YaPO는 해석 가능하고 상호 간섭 없는 조향 방향을 생성하며, 문화 정렬, 환각 제어, 안전성 강화 분야에서 더 빠르고 안정적으로 수렴하는 동시에 모델의 일반 지식 능력을 해치지 않습니다 (출처: HuggingFace)

💼 비즈니스

구우 지능 홍콩 IPO 돌진: 태양광 로봇 선두기업의 구신화 전환: 세쿼이아 투자를 받은 구우 지능이 상장 설명서를 제출했습니다. 회사는 JOS 로봇 운영 체제로 청정 에너지 분야(결정 성장, 슬라이스 등 공정)에서 전국 1위 시장 점유율을 기록 중입니다. 2025년 전 3분기 매출 4.1억 위안으로, 업계 내 희소한 흑자 기업 중 하나입니다. 이번 IPO는 차세대 지능 구신 산업 로봇 개발 추진을 목표로, 전자 반도체 및 광 모듈 분야 확장을 대규모 납품으로 강화할 계획입니다 (출처: 36Kr)

구우 지능

Higgsfield AI 가치 13억 달러 달성: 성장 최고 생성형 AI 기업: 전 Snap 간부가 창립한 Higgsfield AI가 9개월도 안 되어 연간 반복 수익(ARR) 2억 달러를 달성했다고 발표했습니다. 이 플랫폼은 광고 및 마케팅용 비디오 생성에 특화되어 있으며, 현재 일일 4.5만 개 비디오를 생성하고 1500만 이상 사용자를 보유 중입니다. 이 극적인 수익 성장은 디지털 마케팅 분야에서 AI의 강력한 현금화 능력을 입증했습니다 (출처: [Reddit](https://www.reddit.com/r/artificial/comments/1qhtstp/higgsfield_ai_founded_by_exsnap_exec_lands_