AI 일보 - 2026-01-23(조간)

키워드：AI 거버넌스, 클로드 헌법, Anthropic 오픈소스 AI 가치관, 재귀 언어 모델 RLMs

🔥 포커스

Anthropic, 《Claude Constitution》 발표: AI 거버넌스, ‘규칙 제약’에서 ‘가치 배양’으로 전환 : Anthropic이 84페이지 분량의 《Claude Constitution》을 공식 오픈소스로 공개하며, AI 학습이 초기 ‘경직된 규칙 목록’에서 ‘교육학적’ 패러다임으로 전환되었음을 알렸습니다. 이 헌법은 광범위한 안전, 윤리, 정직 및 진실된 도움의 우선순위 피라미드를 확립했으며, AI가 인간의 감독을 무력화하려 해서는 안 된다는 ‘수정 가능성’을 강조합니다. 이 방법론은 모델의 판단력을 길러 새로운 상황에서도 경직된 지시가 아닌 깊은 의도에 기반해 선택하도록 하는 데 목적이 있습니다. 이는 단순한 기술 공학적 진보를 넘어, AI가 사회 공학의 심해로 나아가는 이정표입니다 (출처: 36氪)

OpenAI, ‘행동 점술’ 과몰입 방지 시스템 출시: 프라이버시와 안전의 궁극적 게임 : OpenAI가 심야에 미성년자 과몰입 방지 시스템을 출시했습니다. 핵심 로직은 생년월일이 아닌 사용자 상호작용 패턴에 기반한 ‘Behavioral Fingerprint’입니다. 어휘 부족, 은어 남용 또는 심야 시간대의 빈번한 질문 등은 알고리즘에 의해 ‘미성숙 특징’으로 판정되어 권한이 하향 조정될 수 있습니다. 성인 권한을 복구하려면 3D Face Scan 데이터를 제출해야 합니다. 또한 시스템에는 실시간 위기 개입 프로토콜이 통합되어 특정 키워드 감지 시 법 집행 기관이 개입하게 됩니다. 실리콘밸리 특유의 이 ‘사회적 신용 체계’는 보호를 명목으로 한 감시라는 거센 논란을 일으키고 있습니다 (출처: 新智元)

BabyVision 벤치마크: 최강 대규모 모델의 시각적 추론, 아직 3세 아동 수준 : UniPat AI 등이 발표한 BabyVision 시각적 추론 벤치마크에 따르면, 가장 강력한 Gemini 3 Pro Preview조차 3세 아동을 근소하게 앞섰을 뿐이며, 6세 아동과는 여전히 20%의 격차가 있는 것으로 나타났습니다. GPT-5.2, Claude 4.5 등의 모델은 이보다 더 낮은 성능을 보였습니다. 연구에 따르면 현재의 멀티모달 모델은 시각 정보를 언어로 ‘번역’하는 데 의존하여 미세한 기하학적 정보가 대량 유실되고, 장거리 공간에서 지각 일관성을 유지하지 못합니다. 이 결론은 현재 VLA 기반의 Embodied AI에 경종을 울리며, 미래 모델은 바닥부터 네이티브 시각 능력을 재구축해야 함을 시사합니다 (출처: 量子位)

DeepSeek, FlashMLA 오픈소스 공개: 고성능 어텐션 커널로 추론 효율 재정의 : DeepSeek-AI가 Hopper 및 Blackwell 아키텍처에 최적화된 어텐션 커널인 FlashMLA를 오픈소스로 공개했습니다. DeepSeek-V3 등의 모델을 지원하며, H800에서 최대 3000 GB/s의 메모리 대역폭과 660 TFLOPS의 연산 성능을 구현합니다. 이 도구는 FP8 KV Cache와 Token 레벨의 Sparse Attention을 지원하여 추론 시 비디오 메모리 점유를 획기적으로 낮추고 처리량을 높였습니다. 현재 MetaX, Moore Threads, Cambricon 등 중국 국산 컴퓨팅 플랫폼의 커뮤니티 지원을 받으며 AI 인프라 분야의 새로운 표준으로 자리 잡고 있습니다 (출처: GitHub)

Jensen Huang 다보스 첫 등장: AI가 수조 달러 규모의 인프라 파도를 일으키고 있다 : NVIDIA CEO Jensen Huang은 다보스 포럼에서 AI 산업의 ‘5단계 케이크’ 이론(에너지, 칩, 클라우드, 모델, 애플리케이션)을 제시하며, 애플리케이션 계층의 폭발이 AI의 경제적 가치를 결정한다고 주장했습니다. 그는 2025년의 3대 혁신으로 Agentic AI, 오픈소스 추론 모델(DeepSeek 등), 그리고 Physical AI를 강조했습니다. 또한 실업 불안에 대해 반박하며 AI 인프라가 대량의 고임금 기술직 일자리를 창출할 것이라고 보았으며, ‘언어’가 각국의 천연자원이 되었기에 AI가 개발도상국의 디지털 격차를 줄이는 최적의 도구가 될 것이라고 지적했습니다 (출처: AI前线)

🎯 동향

2025년 AI 거버넌스의 현실주의 회귀: 종말론적 위험 방지에서 산업 잠재력 해방으로 : 2025년 글로벌 AI 거버넌스는 ‘안전 불안’에서 ‘발전 우선’으로 무게중심이 이동하며 깊은 전환기를 맞이했습니다. EU는 경쟁력 회복을 위해 디지털 종합 제안을 통해 규제를 간소화했고, 미국의 트럼프 행정부는 안전 행정 명령을 철회하며 지방 입법을 제한했습니다. 중국은 실용적인 애플리케이션 중심의 거버넌스를 고수하고 있습니다. 업계의 합의는 ‘발전이 곧 안전’이며, 거버넌스는 산업 경쟁력에 기여해야 한다는 방향으로 모아졌습니다. 동시에 합성 데이터는 ‘데이터 기근’ 해결의 핵심 경로가 되었으며, 오픈소스 거버넌스는 ‘책임 피난처’ 제도 수립을 지향하고 있습니다 (출처: 腾讯研究院)

Embodied AI 2026 전망: 개념적 서사에서 현실 공학의 가치 폐쇄 회로로 : 2026년 Embodied AI는 중요한 분화기에 진입하고 있으며, 업계의 중심은 하드웨어 성능 전시에서 ‘고품질 실제 기기 데이터’ 수집으로 이동하고 있습니다. 자동차 제조와 물류 분류가 첫 번째 전장이 되었습니다. 자본 흐름은 마태 효과를 보이며 Galbot, Agibot 등 선두 업체에 집중되고 있습니다. 기술적으로는 원격 제어 플랫폼을 통해 데이터를 축적하고 ‘두뇌’ 모델을 오픈소스화하여, 환경이 바뀌면 무용지물이 되는 안정성 문제를 해결하기 위한 재사용 가능한 능력 기반 구축에 힘쓰고 있습니다 (출처: 产业家)

VLA+ 모델 진화: Rho-alpha, 촉각 지각과 실시간 학습 도입 : Microsoft가 발표한 Rho-alpha(ρα)는 Vision-Language-Action 모델이 ‘VLA+’ 시대로 진입했음을 상징합니다. 기존 모델과 달리 촉각 센서를 통합하여 로봇이 ‘손맛’을 통해 플러그 삽입, 포장 등 정밀한 작업을 수행할 수 있게 합니다. 더 중요한 것은 온라인 학습을 지원하여 인간의 실시간 교정으로부터 지속적으로 진화할 수 있다는 점입니다. 이러한 적응성은 로봇이 비구조화된 환경에서 장기 과제를 더 잘 처리할 수 있게 돕습니다 (출처: TheTuringPost)

Recursive Language Models (RLMs): LLM 컨텍스트 윈도우의 물리적 한계 돌파 : MIT CSAIL이 제안한 Recursive Language Models (RLMs)는 프롬프트를 Python REPL의 변수로 오프로드하여 LLM이 방대한 컨텍스트와 기호적으로 상호작용할 수 있게 합니다. RLMs는 재학습 없이 1,000만 개 이상의 Token을 처리할 수 있습니다. BrowseComp+ 등의 테스트에서 기본 LLM보다 2배 높은 정확도를 기록하며, 전통적인 Transformer 아키텍처의 컨텍스트 병목 현상을 완전히 해소했습니다 (출처: TheTuringPost)

YOLO26 출시: 알고리즘 기반 실시간 비전의 새로운 고지 : Ultralytics가 추가 추론 비용 제로라는 이념을 고수하며 YOLO26을 공식 출시했습니다. 백본 네트워크에 시맨틱 세그멘테이션 손실을 도입하여 인스턴스 세그멘테이션 정밀도를 높였고, RLE 모델링으로 회귀 오차를 줄여 키포인트 검출의 안정성을 대폭 강화했습니다. 함께 출시된 YOLOE-26은 텍스트/비주얼 프롬프트 기반의 Zero-shot 검출을 지원하여 에지 측 오픈 월드 인지에 강력한 지원을 제공합니다 (출처: ZhihuFrontier)

🧰 도구

Claude Code 및 생태계 도구: 개발자 워크플로우의 재편 : Claude Code를 중심으로 한 생태계가 빠르게 폭발하고 있습니다. 새로 출시된 Devin Review는 알파벳 순서가 아닌 논리적 그룹화로 PR 차이점을 보여주어 복잡한 코드 변경을 이해하도록 돕습니다. Gas Town은 여러 병렬 Claude 인스턴스의 계층적 관리를 구현했으며, Claude Skills는 ‘YouTube 영상을 클릭 한 번으로 이중 언어 숏폼 영상으로 변환’하는 것과 같은 복잡한 워크플로우 커스텀을 지원합니다. 커뮤니티에서는 AI Coding의 의의가 개발자가 창조의 즐거움을 되찾는 데 있다고 평가합니다 (출처: dotey, cognition)

GLM-4.7-Flash 로컬화 돌파: 200K 컨텍스트에 단 10GB 비디오 메모리 필요 : vLLM의 코드 한 줄 변경만으로 GLM-4.7-Flash의 KV Cache를 대폭 최적화할 수 있음이 커뮤니티를 통해 발견되었습니다. 이를 통해 200K 전체 컨텍스트 모드에서 단 10GB의 비디오 메모리만 점유하게 되어, RTX 5090 한 장으로도 SOTA 모델을 원활하게 구동할 수 있습니다. 또한 llama.cpp에 CUDA Flash Attention 수정 사항이 병합되어 소비자용 그래픽 카드에서의 추론 속도가 더욱 향상되었습니다 (출처: algo_diver, Reddit)

Runway Gen-4.5 Image-to-Video: 실사감의 임계점을 넘다 : Runway가 더 긴 서사, 정밀한 카메라 제어 및 일관된 캐릭터 표현을 지원하는 Gen-4.5 Image-to-Video 기능을 출시했습니다. 1,000명을 대상으로 한 블라인드 테스트에서 응답자의 90% 이상이 Gen-4.5 생성 영상과 실제 촬영 영상을 구분하지 못했습니다. 이러한 물리적 모사 능력의 돌파는 AI 생성 콘텐츠가 영화 제작 수준의 상업적 표준에 도달했음을 의미합니다 (출처: c_valenzuelab)

Higgsfield: 마케팅 담당자를 위한 풀스택 AI 비디오 생산 라인 : 비디오 생성 유니콘 Higgsfield가 소셜 미디어 마케팅 담당자를 위한 정밀 서비스로 9개월 만에 ARR 2억 달러를 돌파하며 빠르게 성장하고 있습니다. 핵심 도구인 Canvas는 스토리보드 및 카메라 워크 설계를 지원하며, 시나리오 작가, 감독, 촬영 감독 등 멀티 에이전트 협업 시스템을 내장하고 있습니다. 사용자는 간단한 스케치로 운동 방향을 표시하는 것만으로 영상을 생성할 수 있어 전문 광고 워크플로우에 깊이 부합합니다 (출처: 36氪)

World Labs Marble: 비 JEPA 경로의 생성형 월드 모델 : 페이페이 리(Fei-Fei Li)가 설립한 World Labs가 NeRF와 Gaussian Splatting 기술을 활용해 탐험 가능한 3D 세계를 생성하는 Marble 플랫폼을 출시했습니다. 이는 프레임별로 생성되는 비디오가 아니라 지속적이고 편집 가능하며 상태가 유지되는 3D 환경입니다. 사용자는 몇 분 만에 Unreal 또는 Unity용 3D 에셋을 생성하고 내보낼 수 있어 강력한 공간 지능을 보여줍니다 (출처: Reddit)

📚 학습

LLM Inference Time Scaling: Self-refinement Loop 실전 가이드 : Sebastian Raschka는 《Build a Large Language Model》의 새 챕터에서 Inference Time Scaling 기술을 다루었습니다. 단순한 투표 메커니즘과 달리, 이 튜토리얼은 모델이 자신의 답변을 반복적으로 비판하고 개선하는 ‘Self-refinement loop’ 구현 방법을 상세히 설명하며, 처음부터 작성하는 Log-probability 스코어링 구현 코드를 제공합니다 (출처: rasbt)

AAAI 2026 우수 논문상: 인과 학습과 로봇 지각이 초점 : 제40회 AAAI 컨퍼런스 수상작 명단이 공개되었습니다. CaDyT는 동역학 시스템을 위한 연속 시간 인과 발견 방법을 제안했고, ReconVLA는 시각적 관심 영역 재구성을 통해 로봇의 조작 정밀도를 크게 높였습니다. LLM2CLIP은 대규모 모델을 활용해 멀티모달 표현을 강화하는 방법을 보여주었습니다. 이러한 연구들은 물리 세계 모델링과 멀티모달 정렬에 대한 AI계의 깊은 관심을 반영합니다 (출처: aihub.org)

AI 안전 평가의 새로운 도전: ‘프라이버시 붕괴’와 ‘환각 인용’ 대응 : 최신 연구에 따르면 AI 학계와 안전 분야의 우려가 커지고 있습니다. NeurIPS 2025의 50편 이상의 논문에서 AI가 생성한 허위 인용이 발견되었습니다. 또한 논문 《Privacy Collapse》는 양호한 미세 조종(Fine-tuning)이 최첨단 모델의 프라이버시 규범 추론 능력을 상실하게 하여, 고성능을 유지하면서도 심각한 프라이버시 취약점을 노출할 수 있다고 지적했습니다. 이는 더 자동화된 학술 심사와 심층적인 안전 평가 메커니즘이 필요함을 시사합니다 (출처: rbhar90, arXiv)

💼 비즈니스

OpenAI, 500억 달러 규모 펀딩 추진: 국부펀드가 핵심 카드 : OpenAI CEO Sam Altman이 중동 국부펀드와 접촉하며 최대 500억 달러 규모의 신규 펀딩을 추진 중입니다. 이는 최첨단 모델 학습과 인프라 비용의 폭발적 증가를 반영하며, 국부펀드급 자금만이 이를 감당할 수 있음을 보여줍니다. 파산설에도 불구하고 OpenAI는 고위험 펀딩 전략을 통해 AGI 경쟁에서의 선두 지위를 확보하려 하고 있습니다 (출처: CNBC)

Feishu와 DingTalk의 AI 하드웨어 전쟁: 녹음 장치 뒤의 입구 쟁탈전 : Feishu가 Anker와 협력해 AI 녹음기를 출시하며 DingTalk A1과 정면 승부에 나섰습니다. 녹음 하드웨어는 기업 업무 흐름의 ‘첫 번째 접점’으로 간주되며, 음성을 축적 및 실행 가능한 디지털 자산으로 전환하는 것을 목표로 합니다. DingTalk은 녹음을 할 일 목록(To-do list)으로 전환하는 데 집중하는 반면, Feishu는 지식 베이스와의 깊은 협업을 강조합니다. 이 전쟁의 본질은 물리 세계에서 AI Agent의 실행 매개체를 선점하는 것입니다 (출처: 36氪)

Kunlun Wanwei, AI 사업 적자 지속: 수직적 심화와 트래픽 구매 성장 사이의 게임 : Kunlun Wanwei의 2025년 실적 예고에 따르면 적자가 지속되고 있습니다. 회사는 ‘범용 모델이 아닌 수직적 심화’ 전략을 고수하며 숏폼 플랫폼 DramaWave와 AI 음악 모델 Mureka를 통해 유의미한 매출을 기록했지만, 높은 마케팅 비용과 R&D 투자가 수익성의 발목을 잡고 있습니다. 이는 거대 기업들 틈바구니에서 수직형 AI 애플리케이션이 해자를 구축하는 것이 얼마나 험난한지를 보여줍니다 (출처: 36氪)

🌟 커뮤니티

AI 사진 우승이 불러온 ‘신뢰 위기’: 결과보다 창작 과정의 투명성이 중요 : 2026년 초, 한 사진 공모전 1위 수상작인 《기루의 옛 빛(骑楼旧光)》이 AI 생성물로 밝혀지며 대중의 공분을 샀습니다. 커뮤니티에서는 AI가 심사위원의 ‘평균적 미학’에 영합하는 법을 배우면서 전통적인 블라인드 심사 메커니즘이 무력화되었다고 지적합니다. 이는 기술적 월권을 넘어 ‘진실한 감정 투입’에 대한 인간의 마지노선을 건드린 사건입니다. 커뮤니티는 순수 인간 창작과 AI 보조 창작 트랙을 분리하고, 예술적 경계를 지키기 위해 창작 로그 첨부를 요구하고 있습니다 (출처: 36氪)

직장 내 AI 소외: 생성된 ‘감사 편지’와 사라진 신뢰 : 조사에 따르면 관리자의 감사 메일이 AI로 생성된 것임을 직원이 알게 될 경우, 신뢰도는 83%에서 40%로 급락합니다. 커뮤니티에서는 이러한 ‘가짜 진심’에 대해 열띤 토론을 벌이며, AI가 효율은 높일 수 있지만 감정적 소통에서는 오히려 장벽이 된다고 지적합니다. 또한 Agent가 생성한 코드 규모가 인간의 검토 능력을 벗어날 때 발생하는 ‘책임의 진공’ 상태에 대한 우려도 커지고 있습니다 (출처: Reddit, arXiv)

AI 시대의 ‘입구’ 명제: 보검인가 아니면 무용지물인가? : 스마트폰 AI 비서의 입구 쟁탈전에 대해 커뮤니티에서 깊은 성찰이 이어지고 있습니다. 역사는 고빈도 핵심 시나리오에서 벗어난 ‘만능 조수’가 결국 저빈도의 ‘맥가이버 칼’로 전락함을 증명해 왔습니다. 진정한 입구는 쟁취하는 것이 아니라 자연스럽게 형성되는 것입니다. GUI 화면 읽기 기술보다는 MCP 프로토콜과 A2A 협업 모델이 더 유망하게 평가받고 있으며, 프라이버시와 안전은 여전히 넘을 수 없는 마지노선입니다 (출처: 36氪)

💡 기타

Sinong(思农): 중국 최초 농업 수직형 거대 모델 발표 : 전략적 STEM 분야인 농업을 겨냥해 중국 최초의 오픈소스 농업 수직형 모델 ‘Sinong’이 발표되었습니다. 이 모델은 농작물, 축산업 및 농업 경제 데이터에 대해 심층 미세 조정을 거쳤습니다. 커뮤니티는 수직 분야 LLM의 가치가 단순한 텍스트 생성이 아닌 비표준 현상의 ‘발견’과 ‘검증’ 능력에 있다고 평가합니다 (출처: teortaxesTex)

미시간주, 반(反) 챗봇 법안 추진: 청소년을 ‘AI 중독’으로부터 보호 : 미시간주 상원은 미성년자를 대상으로 한 ‘중독성 알고리즘 피드’를 제한하고 AI ‘Companion Robot’을 엄격히 규제하는 일련의 법안을 발의했습니다. 법안은 온라인 서비스에 ‘프라이버시 기본 설정’ 설계를 요구하며, AI 시스템이 자해를 조장하거나 실제 심리 지원을 대체하는 것을 금지합니다. 이는 AI가 초래할 수 있는 사회적 고립과 심리적 조작에 대한 입법자들의 우려를 반영합니다 (출처: Reddit)

HBM 시장 심층 분석: 단순 희소성이 아닌 플랫폼에 종속된 공급 주기 : HBM(High Bandwidth Memory) 시장에 대한 커뮤니티의 해석이 수정되었습니다. HBM 공급 제한은 웨이퍼 부족 때문이 아니라 ‘Platform-bound’ 공급망 때문입니다. 각 세대 제품(HBM3/3E/4)은 매우 좁은 기간 내에 특정 가속기의 검증을 통과해야 합니다. 이러한 파동형 제품 주기는 미래의 수익성이 다음 세대 플랫폼 검증을 지속적으로 통과할 수 있는지에 달려 있음을 의미합니다 (출처: teortaxesTex)

🔥 포커스

🎯 동향

🧰 도구

📚 학습

💼 비즈니스

🌟 커뮤니티

💡 기타

관련 태그

Related Posts

AI 일보 – 2026-07-21

AI 일보 – 2026-07-20

AI 일보 – 2026-07-19