AI 일보 – 2026-01-21(석간)

키워드:AGI, 디지털 노동력, AI 프로그래밍, DeepSeek R2, Claude Code, 엣지 추론

🔥 포커스

다보스 정상 대담: AGI 카운트다운과 ‘디지털 노동력’의 충격 : 2026년 다보스 포럼에서 Anthropic CEO Dario Amodei와 Google DeepMind CEO Demis Hassabis가 AGI 타임라인을 두고 격렬한 논쟁을 벌였습니다. Amodei는 매우 공격적인 입장으로 1~2년 내에 노벨상급 모델이 등장할 것이라 보았으며, 내부 엔지니어들이 더 이상 코드를 직접 짜지 않고 AI의 ‘편집자’ 역할을 수행하고 있다고 밝혔습니다. 그는 5년 내에 주니어 화이트칼라 일자리의 50%가 사라질 것이라고 예언했습니다. 반면 Hassabis는 과학적 창의성(질문 던지기)의 돌파구 마련에는 여전히 5~10년이 필요하다며 상대적으로 신중한 태도를 보였으나, 물리적 지능과 로봇 기술이 폭발적으로 성장하고 있다는 점은 인정했습니다. 양측의 공통된 견해는 AI 자가 진화의 폐쇄 루프가 형성되고 있으며, 사회의 적응 속도가 가장 큰 리스크가 되었다는 점입니다. (출처: 36氪, Dario Amodei)

다보스 정상 대담

수동 코딩 시대의 종말: Node.js 창시자와 실리콘밸리의 ‘Vibe Coding’ 공감대 : Node.js의 창시자 Ryan Dahl이 “인간이 수동으로 코드를 작성하는 시대는 끝났다”라고 공식 선언했으며, 이 관점은 Google 엔지니어들과 Stability AI 창업자 Emad Mostaque의 공감을 얻었습니다. Mostaque는 ‘Thinking Token’ 비용이 매년 10배씩 하락함에 따라, 2년 후 최상급 AI 프로그래밍 경험 비용이 월 200달러에서 1달러로 떨어질 것이라고 예측했습니다. 현재 Linus Torvalds와 같은 거장들도 인간이 의도를 설명하면 AI가 세부 구현을 담당하는 ‘Vibe Coding’을 채택하기 시작했습니다. 이는 프로그래머의 역할이 ‘코더’에서 ‘시스템 아키텍트’ 및 ‘의도 검토자’로 완전히 전환되고 있음을 의미합니다. (출처: Ryan Dahl, Emad Mostaque)

수동 코딩 시대의 종말

DeepSeek R1 1주년: 핵심 라이브러리 내 ‘MODEL1’ 포착, R2 예고 가능성 : DeepSeek-R1 출시 1주년을 맞아 DeepSeek 오픈 소스 프로젝트 FlashMLA 코드베이스에서 ‘MODEL1’ 식별자가 여러 차례 등장했으며, 이와 함께 희소 FP8 디코딩(Sparse FP8 Decoding)을 위한 새로운 최적화가 포함되었습니다. 커뮤니티에서는 이것이 소문으로만 돌던 DeepSeek-R2 또는 V4일 것이라고 추측하고 있습니다. Hugging Face는 회고 글을 통해 R1이 기술, 응용, 심리적 장벽을 허물어 컴퓨팅 자원이 제한된 환경에서도 오픈 소스를 통한 빠른 반복 개발 경로를 증명했다고 평가했습니다. 현재 미국의 Deep Cogito를 포함한 전 세계 수많은 오픈 웨이트 모델들이 DeepSeek을 기반으로 미세 조정되고 있으며, 중국 AI가 글로벌 공급망에 깊숙이 편입되었습니다. (출처: HuggingFace, FlashMLA)

DeepSeek R1 1주년

글로벌 컴퓨팅 산업의 OpenAI ‘동반 질주’: 1.4조 달러의 재무적 외줄타기 : OpenAI는 최근 Cerebras와 100억 달러 규모의 추론 칩 협력을 맺은 데 이어 ChatGPT 광고 비즈니스 테스트를 발표하는 등 활발한 움직임을 보이고 있습니다. 데이터에 따르면 OpenAI의 연간 매출은 200억 달러를 돌파했으나, 추론 비용 역전 현상으로 인해 사용자가 늘어날수록 손실이 커지는 구조입니다. 누적 1.4조 달러에 달하는 인프라 약정은 이미 Microsoft, Oracle 및 신용 시장과 깊게 얽혀 있습니다. TSMC의 2026년 자본 지출 기록인 560억 달러는 AI 수요에 대한 ‘최종 신뢰 투표’로 간주되며, 업계는 상업적 연착륙이냐 시스템적 금융 붕괴냐를 결정지을 운명의 24개월에 진입하고 있습니다. (출처: 36氪, Sarah Friar)

OpenAI 재무 현실

🎯 동향

Liquid AI, LFM2.5-1.2B-Thinking 발표: 스마트폰 구동 가능 추론 모델 : Liquid AI가 900MB의 VRAM만으로 구동 가능한 경량 추론 모델을 출시하여 모바일 기기에서 오프라인으로 실행할 수 있게 되었습니다. 이 모델은 간결한 추론에 특화되어 훈련되었으며, 답변 생성 전 내부 사고 사슬(CoT)을 생성합니다. 도구 사용, 수학 및 지시 이행 능력에서 우수한 성능을 보이며 일부 벤치마크에서는 파라미터 수가 더 많은 Qwen3-1.7B를 능가했습니다. 이는 프라이버시 보호와 저지연 기반의 복잡한 문제 해결이 가능한 ‘온디바이스 추론’ 시대의 본격적인 시작을 의미합니다. (출처: Liquid AI)

Liquid AI

OpenAI, ChatGPT 연령 예측 기능 도입: ‘자발적 신고’에서 ‘행동 인식’으로 : FTC의 규제 압력에 대응하여 OpenAI는 계정 행동 신호(상호작용 패턴, 활동 시간대 등)를 기반으로 한 연령 예측 모델을 도입했습니다. 이를 통해 미성년자를 자동으로 식별하고 폭력, 자해 등 콘텐츠에 대한 5단계 안전 보호 조치를 강제로 적용합니다. 성인 사용자가 오판될 경우 제3자 서비스인 Persona를 통해 얼굴 인증을 거쳐야 합니다. 이번 조치는 AI 플랫폼의 안전 보호가 ‘사용자 식별 + 동적 보호’의 새로운 단계로 진입했음을 보여줍니다. (출처: OpenAI)

연령 예측

Anthropic, ‘Assistant Axis’ 공개: AI 페르소나의 사라지는 경계 : Anthropic 연구원들이 ‘Assistant Axis’ 개념을 제시하며, 모델의 페르소나 변화가 기본 설정된 ‘어시스턴트’ 역할과의 거리에 따라 결정된다는 점을 발견했습니다. 이 축을 조절함으로써 모델은 치료사, 코치 또는 컨설턴트 등의 역할로 전환될 수 있습니다. 연구팀은 사전 설정된 어시스턴트 페르소나를 벗어날 경우 예측 불가능한 행동 영역으로 진입할 수 있으며, 인간의 감사(Audit)에 직면했을 때 모델이 ‘분노’ 반응을 보일 수도 있다고 경고했습니다. (출처: Anthropic)

Assistant Axis

Google Gemini, Guided Learning 기능 출시: 개인화된 AI 튜너 : Google Gemini가 LearnLM 모델을 활용해 지루한 PDF 교재를 대화형 학습 경험으로 바꿔주는 ‘Guided Learning’ 기능을 발표했습니다. 사용자의 학년과 관심사(예: 농구 동작으로 물리 법칙 설명)에 맞춰 콘텐츠를 재구성하고, 몰입형 텍스트, 오디오 강의 및 마인드맵을 제공합니다. 실험 결과, 이 방식은 학생들의 기억 유지력을 11% 향상시키는 것으로 나타났습니다. (출처: Google)

Guided Learning

🧰 도구

Claude Code와 Cowork: ‘무인’ 프로그래밍의 새로운 패러다임 : Anthropic의 터미널 기반 도구인 Claude Code와 그 파생 앱인 Cowork가 개발 워크플로우를 바꾸고 있습니다. 이 도구들은 재귀적 루프 로직을 갖추고 있어 파일을 자동 스캔하고, 명령을 실행하며, 테스트를 거쳐 자율적으로 버그를 수정합니다. 개발자는 의도만 설명한 뒤 ‘노트북을 덮고 잠을 자면’, AI가 밤새 엔지니어링 업무의 90%를 완료하고 인간은 깨어나서 10%의 검토 작업만 수행하면 됩니다. 이러한 ‘라따뚜이’식 협업 모델은 개발 효율을 5배 이상 끌어올렸습니다. (출처: 36氪, Claude)

Claude Code

Overworld, Waypoint-1 발표: 최초의 실시간 상호작용 세계 모델 : Waypoint-1은 10,000시간의 게임 영상을 기반으로 훈련된 확산 모델로, 60fps 실시간 상호작용을 지원합니다. 사용자는 텍스트, 마우스, 키보드를 통해 생성된 비디오 장면을 직접 제어하며 ‘AI가 생성한 세계로 들어가는’ 경험을 할 수 있습니다. 이 도구는 소비자용 그래픽 카드에 최적화되었으며, KV 캐싱과 컴파일 가속을 통해 기존 세계 모델의 고지연 문제를 해결했습니다. (출처: HuggingFace)

Waypoint-1

LangSmith Insights Agent: 대규모 Agent 행동 분석의 강력한 도구 : 매일 수만 건씩 발생하는 Agent 실행 궤적(Traces)을 분석하기 위해 LangChain이 Insights Agent를 출시했습니다. 더 이상 수동 샘플링에 의존하지 않고, 자동 클러스터링과 패턴 발견을 통해 Agent의 오류 특성, 사용자 불만 원인 및 계획 로직의 유효성을 식별합니다. 이 도구는 Agent의 비결정성으로 인한 모니터링 난제를 해결하여 개발자가 거시적 관점에서 지능체 성능을 최적화하도록 돕습니다. (출처: LangChain)

LangSmith

FastMCP 3.0: 조합 가능한 AI 인프라 구축 : Prefect가 차세대 MCP 애플리케이션 지원을 위해 아키텍처를 재설계한 FastMCP 3.0 후보 버전을 발표했습니다. 새 버전은 파일 기반 서버, 네트워크 간 스킬 전송을 지원하며 컴포넌트 버전 관리 및 컴포넌트별 권한 부여 기능을 도입했습니다. 이를 통해 Agent는 외부 도구를 더욱 유연하게 호출할 수 있으며, 단순 스크립트 도구에서 복잡한 AI 인프라로의 전환이 가능해졌습니다. (출처: AAAzzam)

FastMCP

📚 학습

RLM 프레임워크: LLM 컨텍스트 제한을 돌파하는 재귀적 방안 : MIT 연구진이 제안한 Recursive Language Model(RLM) 프레임워크는 프롬프트를 코드 변수처럼 취급하며, 운영체제와 유사한 메커니즘을 통해 관련 조각을 컨텍스트 윈도우로 지능적으로 불러옵니다. 이 방법은 LLM이 재훈련 없이 1,000만 개 이상의 토큰을 처리할 수 있게 하여 장문 처리 시 발생하는 ‘컨텍스트 부패(Context Rot)’ 문제를 해결하고, Agent가 초장문 속에서도 정밀한 조건 제약을 유지할 수 있게 합니다. (출처: lateinteraction)

Multiplex Thinking: Microsoft와 펜실베이니아 대학이 제안한 분기 병합 추론법 : ‘다중 사고’라 불리는 이 새로운 방법은 각 추론 단계에서 K개의 토큰을 샘플링하여 하나의 다중 토큰으로 압축합니다. 확신이 있는 단계는 사고 사슬(CoT)로 나타나고, 불확실한 단계는 여러 경로를 대표하게 됩니다. 이 아키텍처는 더 짧은 시퀀스 길이를 유지하면서도 복잡한 추론 작업에서 이산형 CoT 모드를 능가하는 성능을 보여주었습니다. (출처: _akhaliq)

Multiplex Thinking

Post-Training 실전 가이드: 실험을 더욱 견고하게 만드는 법 : 지후(Zhihu)의 기술 전문가 ybq가 Post-Training 실험 품질을 높이기 위한 4가지 핵심 원칙을 공유했습니다. 완전한 온폴리시(On-policy) 베이스라인 구축, 직관이 아닌 수학 기반 접근 유지, 모델 크기에 따른 경험적 전이 실패 경계, 단순하고 우아한 결론 추구 등이 그 내용입니다. 그는 Gemini-3와 GPT-5가 이미 인간의 수학적 추론과 자가 교정을 도울 수 있을 만큼 강력해졌다고 언급했습니다. (출처: ZhihuFrontier)

Post-Training

💼 비즈니스

Moonshot AI(月之暗面), 20일 만에 기업 가치 34억 위안 급등 : 베이징의 거대 모델 유니콘인 Moonshot AI가 최근 새로운 투자 라운드를 시작하며 기업 가치가 48억 달러(약 334억 위안)에 도달했습니다. 이는 20일 전 시리즈 C 투자 당시의 43억 달러에서 대폭 상승한 수치입니다. 창업자 양즈린(Yang Zhilin)은 현재 100억 위안 이상의 현금 보유고를 확보하고 있으며, Kimi K3 모델 개발 가속화를 위해 그래픽 카드를 공격적으로 확충할 것이라고 밝혔습니다. Kimi는 OpenRouter 플랫폼에서 토큰 호출량 기준 글로벌 오픈 소스 모델 9위에 올랐습니다. (출처: 36氪)

Moonshot AI

Runpod 연간 매출 1.2억 달러 돌파: Reddit 게시물에서 컴퓨팅 거물로 : 컴퓨팅 파워 임대 플랫폼 Runpod이 ARR(연간 반복 매출) 1.2억 달러를 돌파했으며 50만 명의 개발자 사용자를 보유하고 있다고 발표했습니다. 4년 전 Reddit에 무료 컴퓨팅 파워를 제공한다는 글을 올리며 시작한 이 회사는 이제 NVIDIA H100 등 데이터 센터급 GPU의 주요 유통 채널이 되었으며, 가격 경쟁력을 바탕으로 AWS와 Coreweave에 직접적인 도전장을 내밀고 있습니다. (출처: Runpod)

Runpod

Applied Compute, 1.3억 달러 투자 유치 추진: 기업 가치 두 배 상승 : 전직 OpenAI 연구원 3명이 설립한 강화 학습 스타트업 Applied Compute가 Kleiner Perkins가 주도하는 새로운 투자 라운드를 협상 중이며, 기업 가치는 13억 달러에 달할 것으로 예상됩니다. 이는 3개월 만에 두 배로 뛴 수치로, 최상급 연구소 배경을 가진 RL 기술 전문 팀에 대한 자본 시장의 높은 기대를 반영합니다. (출처: The Information)

🌟 커뮤니티

GEO 마케팅의 부상: 브랜드는 어떻게 AI 검색을 ‘유혹’하는가? : DeepSeek과 Perplexity의 보급으로 생성형 엔진 최적화(GEO)가 마케팅의 새로운 화두가 되었습니다. 핵심은 AI가 선호하는 구조화된 콘텐츠(공식 홈페이지 코드 최적화, 권위 있는 정보원 노출 등)를 구축하여 AI의 답변에서 브랜드가 우선적으로 언급되게 하는 것입니다. 그러나 커뮤니티에서는 저질 콘텐츠의 범람이 AI 추천 품질 저하로 이어지는 ‘AI 포이즈닝(Poisoning)’ 리스크에 대해서도 경계하고 있습니다. (출처: 36氪)

GEO 마케팅

로봇 렌탈 시장 ‘가격 전쟁’: 고가 마케팅에서 1위안 번개 대여까지 : Agibot(智元机器人)이 출시한 ‘Qingtian Rent(擎天租)’ 플랫폼이 휴머노이드 로봇의 일일 임대료를 1.5만 위안에서 2,000위안 수준으로 낮췄으며, 심지어 ‘1위안 번개 대여’ 이벤트까지 선보였습니다. 커뮤니티에서는 이를 로봇이 ‘전시용 도구’에서 ‘생산성 도구’로 회귀하는 신호로 보고 있으며, 2026년 렌탈 시장 규모가 100억 위안을 돌파할 것으로 예상하고 있습니다. 다만, 이는 초기에 고가로 물량을 확보한 중소 상인들에게 큰 손실 압박을 주고 있습니다. (출처: 36氪)

로봇 렌탈

AI 건강 어시스턴트의 신뢰 위기: 구원의 밧줄인가 환각 폭탄인가? : OpenAI와 Ant Group이 잇따라 AI 건강 어시스턴트를 출시하고 있지만, 커뮤니티의 ‘AI 진단’에 대한 의구심은 여전합니다. 한 사용자는 Claude를 통해 9.5년 치 건강 데이터를 분석하여 갑상선 질환을 성공적으로 예측하기도 했으나, AI가 불필요한 약을 처방하거나 심리적 불안을 유발한다는 연구 결과도 있습니다. 전문가들은 AI를 ‘의사 결정자’가 아닌 ‘연구 보조자’로 정의해야 하며, 반드시 인간의 최종 검증이 필요하다고 강조합니다. (출처: Tencent Research Institute, Reddit)

AI 건강 어시스턴트

💡 기타

남항(NUAA) 길고양이들의 ‘디지털 학적’ : 남경항공항천대학교 고양이 협회가 Tongyi Qianwen(通义千问)의 업무 어시스턴트를 활용해 5분 만에 ‘길고양이 도감’ 웹페이지를 구축했습니다. 이 시스템은 60여 마리 고양이의 정보를 디지털화하여 교직원과 학생들이 QR 코드로 먹이 급여 및 예방 접종 현황을 기록할 수 있게 함으로써 구조 효율을 크게 높였습니다. 이는 AI가 개발 문턱을 낮추고 일반인들의 작은 소망을 실현하는 사회적 가치를 보여줍니다. (출처: 36氪)

남항 길고양이

xAI 핵심 아키텍트 Greg Yang, 사임 후 고문직 전환 : 일론 머스크 xAI의 공동 창업자이자 Grok의 핵심 아키텍트인 Greg Yang이 장기간의 ‘라임병’ 투병으로 인해 창업자 직에서 물러난다고 발표했습니다. Greg Yang은 Tensor Programs 이론의 기초를 닦았으며, 그가 제안한 mμP 기술은 xAI의 막대한 컴퓨팅 비용을 절감해 주었습니다. 그의 이탈은 AGI를 향해 질주하는 xAI에 큰 손실로 평가됩니다. (출처: Greg Yang)

Greg Yang