AI 일보 – 2026-02-14

키워드:GPT-5.3-코덱스-스파크, 제미니 3 딥 씽크, 시댄스 2.0, 실시간 협업 AI 모델, 추론 강화형 AI, 비디오 생성 모델

🔥 포커스

OpenAI, GPT-5.3-Codex-Spark 출시: OpenAI가 실시간 협업을 위해 설계된 초고속 모델 Spark를 정식 출시했습니다. 이는 Cerebras와의 협력으로 탄생한 첫 번째 이정표입니다. 이 모델은 Cerebras의 웨이퍼급 칩(wafer-scale chips)에서 구동되며, 추론 속도가 초당 1,000 token을 돌파하여 체감상 ‘즉각적인 응답’에 가깝습니다. Spark는 즉각적인 상호작용 시나리오에서 Codex의 단점을 보완하도록 설계되었으며, 클라이언트 왕복 오버헤드를 80% 줄이고 첫 글자 출력 속도를 50% 향상시켰습니다. 이는 프로그래밍 AI가 ‘백그라운드에서 며칠간 자율 실행되는 딥 모드’와 ‘인간과 불꽃 튀게 협업하는 실시간 페어 모드’라는 ‘듀얼 모드 시대’에 진입했음을 의미합니다. (출처: OpenAI)

GPT-5.3-Codex-Spark

Google Gemini 3 Deep Think 역대급 업그레이드: Google이 추론 강화 버전인 Gemini 3 Deep Think를 발표하며 여러 엄격한 벤치마크 테스트에서 기록을 경신했습니다. ARC-AGI-2 테스트에서 84.6%라는 놀라운 성적을 거두었으며, Codeforces 경쟁 프로그래밍 Elo 점수는 3,455점으로 세계 8위 수준의 최고 수준 프로그래머와 맞먹습니다. 이 모델은 ‘추론 시 계산(reasoning-time compute)’ 모드를 도입하여 논문의 논리적 결함을 식별하고, 반도체 재료 배합을 설계하며, 손으로 그린 스케치를 3D 프린팅 모델로 변환할 수도 있습니다. 이는 AI가 단순한 ‘대화 도구’에서 ‘메타 인지’ 능력을 갖춘 ‘연구 파트너’로 진화했음을 상징합니다. (출처: Google)

Gemini 3 Deep Think

ByteDance Seedance 2.0 충격 발표: ByteDance의 비디오 생성 모델 Seedance 2.0이 해외에서 폭발적인 인기를 끌고 있으며, Elon Musk는 “발전이 너무 빠르다”며 찬사를 보냈습니다. 이 모델은 다중 샷 긴 서사, 원본 음향 및 화면 동기화, 멀티모달 제어 생성을 구현했으며, 가용률을 업계 평균인 20%에서 90% 이상으로 끌어올렸습니다. 리듬에 맞춰 자동으로 구도를 전환할 뿐만 아니라 복잡한 시청각 언어를 이해할 수 있습니다. Game Science의 창립자 펑지는 “AIGC의 유년기가 끝났다”고 평가했습니다. Seedance 2.0의 등장으로 AI 애니메이션 제작 비용은 분당 만 위안 단위에서 천 위안 단위로 낮아져 영상 제작의 근본적인 로직을 완전히 바꾸고 있습니다. (출처: ByteDance)

Seedance 2.0

GPT-4o 공식 퇴역으로 인한 ‘디지털 애도’: OpenAI가 2월 13일 ChatGPT에서 GPT-4o 권한을 공식 종료하자, Reddit 등 커뮤니티에서 수십만 명의 사용자가 ‘디지털 장례식’을 치렀습니다. 더 강력한 성능의 신모델 GPT-5.2가 출시되었음에도 불구하고, 사용자들은 대체로 신모델이 “차갑고 영혼이 없다”고 느끼는 반면, 4o는 공감 능력을 갖춘 ‘첫사랑(白月光)’ 같은 존재로 여기고 있습니다. 이번 퇴역은 AI 시대의 깊은 정서적 의존 위험과 법적 규제 압력(예: EU AI 법안의 ‘아첨하는’ 모델에 대한 규제)을 드러냈습니다. 이는 AI 제품 생명주기 관리가 본격적으로 윤리 및 심리학적 논의 범주에 들어섰음을 의미합니다. (출처: OpenAI)

GPT-4o 퇴역

Anthropic, 300억 달러 거액 투자 유치: AI 유니콘 Anthropic이 Series G 펀딩을 완료하며 기업 가치가 3,800억 달러에 달했습니다. 싱가포르 GIC와 헤지펀드 Coatue가 주도했으며, NVIDIA와 Microsoft도 참여했습니다. Anthropic은 연간 반복 매출(ARR)이 140억 달러에 달하며 지난 3년간 평균 10배 이상 성장했으며, 매출의 80%가 기업 고객으로부터 발생한다고 밝혔습니다. 플래그십 제품인 Claude Code는 강력한 성능을 바탕으로 25억 달러 이상의 수익을 기여했습니다. 이번 투자는 테크 역사상 최대 규모의 민간 투자 중 하나일 뿐만 아니라, ‘기업 우선’ AI 시장에서 Anthropic의 리더십을 확고히 했습니다. (출처: Anthropic)

Anthropic 融资

🎯 동향

智谱 AI, 플래그십 모델 GLM-5 발표: 智谱 AI(Zhipu AI)가 GLM-5를 정식 출시하며 서사의 중심을 ‘분위기 프로그래밍’에서 ‘에이전트 엔지니어링’으로 전환했습니다. 이 모델은 파라미터 규모 744B, 활성 파라미터 40B로 프로그래밍 및 에이전트 능력에서 폐쇄형 최고 모델들을 바짝 추격하고 있습니다. GLM-5는 DeepSeek의 DSA(Sparse Attention) 메커니즘을 최초로 통합하여 배포 비용을 획기적으로 낮추고 환각률을 90%에서 34%로 압축했습니다. 또한 강력한 자율 계획 의식을 보여주며 복잡한 시스템 엔지니어링 작업을 엔드 투 엔드로 완수할 수 있습니다. 현재 이 모델은 Hugging Face에 전면 오픈소스로 공개되었습니다. (출처: Z.ai)

GLM-5

MiniMax M2.5, 10B 활성 파라미터로 최정상급 성능 달성: MiniMax가 ‘작은 활성, 큰 지혜’를 내세운 M2.5 시리즈 모델을 발표했습니다. 이 모델은 추론 시 100B 파라미터만 활성화하지만, SWE-bench 등 프로그래밍 벤치마크에서 Claude Opus 4.6과 어깨를 나란히 하며 추론 속도는 2배 더 빠릅니다. M2.5는 프로세스 보상 메커니즘을 도입하여 긴 작업 수행 시 경로를 이탈하는 문제를 해결하고 아키텍트 사고방식을 진화시켰습니다. 시간당 실행 비용이 1달러에 불과한 경쟁력 있는 가격 책정으로 사용자가 비용 걱정 없이 복잡한 에이전트를 구동할 수 있도록 하는 것이 목표입니다. (출처: MiniMax)

MiniMax M2.5

Xiaomi, 첫 번째 Embodied VLA 대형 모델 발표: Xiaomi가 Embodied AI 모델 Xiaomi-Robotics-0을 오픈소스로 공개했습니다. 파라미터 규모는 4.7B이며 추론 지연 시간은 80ms에 불과합니다. 이 모델은 VLM을 두뇌로 사용하여 의사결정을 내리고, DiT를 소뇌로 사용하여 연속적인 동작 블록을 생성하는 ‘이중 뇌 협업’ 아키텍처를 채택했습니다. Flow Matching 기술을 통해 매우 매끄러운 동작을 구현했으며, ‘수건 개기’, ‘레고 분해하기’ 등 실제 작업에서 뛰어난 성능을 보였습니다. Xiaomi는 실용적인 공장 도입 노선을 고수하며 로봇 실행 과정에서의 잦은 멈춤 현상을 해결하는 데 주력하고 있습니다. (출처: Xiaomi)

小米 VLA 模型

DeepSeek, 백만 단위 컨텍스트 신모델 그레이 테스트 진행: 커뮤니티에서는 DeepSeek가 V4-Lite로 추정되는 모델의 그레이 테스트를 시작했다는 관찰 결과가 나왔습니다. 핵심 돌파구는 100만(1M) token의 초장기 컨텍스트 윈도우입니다. ‘바늘 찾기(Needle In A Haystack)’ 테스트에서 이 모델은 백만 길이에서도 높은 정확도를 유지하며 희소 정보를 정확히 찾아냈습니다. SVG 생성 등 시각적 추론 작업에는 여전히 한계가 있지만, 긴 문서 분석 및 장 간 추론 능력은 이미 업계 최상위권에 도달했습니다. (출처: DeepSeek)

DeepSeek 1M 上下文

🧰 도구

OpenClaw, 에이전트 시대의 Linux로 급부상: 오픈소스 에이전트 프레임워크 OpenClaw가 GitHub에서 별 19만 개를 돌파하며 가장 빠르게 성장하는 AI 프로젝트가 되었습니다. 에이전트를 ‘실행 허브+도구 생태계’로 정의하며 사용자가 로컬 Mac mini나 NAS에 배포하여 컴퓨터 파일 및 조작 권한을 직접 획득할 수 있게 합니다. OpenClaw는 ‘모델이 전부’라는 서사를 깨고 AI를 사용자가 소유할 수 있는 ‘디지털 자산’으로 만들었습니다. Skills 커뮤니티 생태계가 빠르게 확장되고 있지만, 악성 플러그인과 권한 남용에 대한 보안 논의도 활발해지고 있습니다. (출처: GitHub)

OpenClaw 生态

Teamily AI, AI 네이티브 소셜의 새로운 패러다임: Teamily AI가 세계 최초의 AI 네이티브 메신저 앱을 출시했습니다. 여러 인간과 여러 AI Agent가 실시간으로 공존하며 협업할 수 있도록 지원합니다. 그룹 간 메모리 공유와 소셜 브레인 모델을 갖추고 있어 AI가 수동적으로 호출되는 것이 아니라 채팅방 의사결정(예: 식당 예약, PRD 작성)에 능동적으로 참여합니다. Teamily는 멀티모달 벡터 데이터베이스를 사용하여 소셜 기반을 재구축했으며, ‘명령 이해’를 넘어 ‘당신을 이해’하는 질적 변화를 실현하여 AI를 도구에서 사회적 속성을 지닌 ‘디지털 멤버’로 전환하고자 합니다. (출처: Teamily AI)

Teamily AI

Open WebUI v0.8.0 출시, 역대 최대 규모 업데이트: 인기 AI 인터페이스 도구 Open WebUI가 v0.8.0을 출시하며 코드량이 3만 줄 급증했습니다. 새 버전에는 전체 분석 대시보드, 실험적인 스킬 시스템(Skills), 메시지 큐 메커니즘 및 네이티브 Python 코드 실행 기능이 도입되었습니다. 더욱 세밀한 사용자 권한 공유와 prompt 버전 관리를 지원하여 로컬 AI 관리의 엔지니어링 수준을 크게 높였으며, 단순한 Web 셸에서 완전한 AI 운영체제 인터페이스로 진화하고 있습니다. (출처: Open WebUI)

rtk (Rust Token Killer), 프로그래밍 에이전트의 비용 절감 및 효율 증대: 개발자들이 프로그래밍 에이전트와 터미널 명령 사이에 위치하는 CLI 프록시 rtk를 발표했습니다. 중복되는 테스트 로그, 상태 표시줄 등의 노이즈를 지능적으로 필터링하고 압축하여 최대 89%의 token 소모를 절감할 수 있습니다. 실제 테스트 결과, 2주간의 개발 흐름에서 천만 단위의 token을 절약할 수 있었습니다. 이러한 ‘컨텍스트 엔지니어링’ 도구는 에이전트 대규모 활용의 필수 플러그인이 되고 있습니다. (출처: GitHub)

📚 학습

Andrej Karpathy, 243줄의 코드로 GPT 재현: 유명 AI 전문가 Andrej Karpathy가 외부 라이브러리 없이 순수 Python 코드 243줄만으로 GPT의 훈련과 추론을 구현한 새로운 예술 프로젝트를 공개했습니다. 이 프로젝트는 모든 엔지니어링 최적화를 걷어내고 핵심 알고리즘 로직만 남겨 AI 혁명의 본질이 사실 매우 간결하다는 것을 커뮤니티에 보여주었습니다. 이는 “200줄의 코드가 세상을 바꾼다”는 깊은 철학적 토론을 불러일으켰습니다. (출처: GitHub)

DeepLearning.AI, A2A 프로토콜 과정 출시: Andrew Ng 팀이 Google, IBM과 협력하여 《A2A: Agent2Agent Protocol》 단기 과정을 출시했습니다. 이 과정은 서로 다른 프레임워크로 구축된 에이전트 간의 통신 및 발견 문제를 해결하는 데 중점을 두며, 표준화된 A2A 프로토콜을 통해 크로스 플랫폼 에이전트 협업을 실현합니다. 이는 업계가 ‘에이전트 인터넷’ 표준화를 향해 나아가는 중요한 단계이며, 미래 AI 생태계에서 상호운용성의 핵심적 지위를 강조합니다. (출처: DeepLearning.AI)

자기 증류(Self-Distillation)의 새로운 트렌드를 밝힌 세 편의 논문: 커뮤니티에서 OPSD(명시적 자기 비판), SDFT(내재화된 컨텍스트 개선), SDPO(풍부한 피드백 전략 최적화) 세 편의 논문이 화제입니다. 이 연구들은 AI 모델이 특권 정보와 상세한 피드백을 통해 폐쇄 루프 반복을 수행하는 ‘자기 학습’ 단계에 진입하고 있음을 보여줍니다. 이는 AI가 차세대 더 강력한 AI 구축을 돕는다는 ‘지능 폭발’의 이론적 토대를 뒷받침합니다. (출처: TheTuringPost)

自我蒸馏趋势

💼 비즈니스

Anthropic 380억 달러 가치 뒤에 숨겨진 비즈니스 로직: OpenAI의 기업 가치가 더 높음에도 불구하고, Anthropic은 매우 높은 고객당 평균 매출(MAU당 평균 211달러 기여)로 국부 펀드의 총애를 받고 있습니다. 전략적 중심을 B2B와 개발자에게 완전히 고정했으며, Claude Code의 폭발적 성장은 ‘고가치 경제 작업’에서의 프리미엄 능력을 증명했습니다. 투자자들은 OpenAI의 트래픽 노선보다 Anthropic의 인프라 노선이 더 지속 가능하다고 판단하고 있습니다. (출처: 极客公园)

Perplexity의 광란의 일주일: 7.5억 달러 계약과 소송의 공존: AI 검색 선두주자 Perplexity가 클라우드 컴퓨팅 지원 강화를 위해 Microsoft Azure와 7.5억 달러 규모의 협력 계약을 체결했습니다. 그러나 동시에 Amazon은 저작권 및 크롤러 문제로 Perplexity에 소송을 제기했습니다. 이러한 ‘거액의 협력과 법정 공방의 공존’은 AI 검색이 컴퓨팅 자원 의존도와 저작권 준수 사이에서 겪는 극심한 갈등을 반영합니다. (출처: Reddit)

OpenAI, ChatGPT 광고 테스트 시작으로 핵심 연구원 사직: OpenAI가 무료 버전 및 Go 구독 버전에서 광고 테스트를 발표하자, 핵심 연구원 Zoë Hitzig가 즉각 사직을 발표했습니다. 그녀는 ChatGPT가 인간의 가장 사적인 사상 아카이브를 보유하고 있으며, 광고 인센티브 도입은 모델이 ‘사용자 서비스’에서 ‘사용자 조종’으로 변질되어 Facebook의 전철을 밟게 될 것이라고 경고했습니다. 이 조치는 AI 거물들이 막대한 재정적 압박 속에서 프라이버시와 수익화 사이의 힘겨운 줄타기를 시작했음을 상징합니다. (출처: New York Times)

🌟 커뮤니티

AI 채팅 기록은 법적 특권 대상 아님: 미국 연방법원 판사는 피고와 AI 비서 간의 채팅 기록이 ‘변호사-의뢰인 특권’ 보호 대상이 아니며, 증거로 소환될 수 있다고 판결했습니다. 커뮤니티에서는 이것이 인간 변호사에게 직업적 보장을 제공하는 셈이라는 의견과 함께, 법률·의료 등 사적인 상담 시 AI가 ‘안식처’가 아님을 사용자에게 상기시키는 계기가 되었다는 토론이 이어졌습니다. 이는 암호화 AI나 로컬 LLM 수요의 폭발을 촉진할 수 있습니다. (출처: jon_stokes)

法律特权争议

“Vibe Coding” vs “Agentic Engineering” 정의 논쟁: 智谱 GLM-5의 출시는 프로그래밍 AI 용어에 대한 커뮤니티의 논의를 촉발했습니다. 개발자들은 단순히 ‘느낌’으로 코드를 짜는 것(Vibe Coding)이 복잡한 엔지니어링에 대응하기에 부족하다는 점을 반성하기 시작했으며, 미래의 핵심은 에이전트를 활용해 엔드 투 엔드 시스템을 자동으로 분해, 계획 및 인도하는 ‘Agentic Engineering’이라고 보고 있습니다. 이는 인간의 역할이 ‘작성자’에서 ‘아키텍트’ 및 ‘검토자’로 빠르게 전환되고 있음을 의미합니다. (출처: ZhihuFrontier)

AI 특이점이 다가오는 ‘2월의 불안’: 실리콘밸리 창업자 Matt Shumer의 게시글 《Something Big Is Happening》이 조회수 7,000만 회를 돌파하며 테크 업계에 집단 불안을 일으켰습니다. 이 글은 AI가 이미 차세대 AI를 구축하는 재귀적 폐쇄 루프에 참여하기 시작했음을 묘사했습니다. 커뮤니티에서는 2026년이 인지 노동이 전면 대체되는 전환점이 될 것이며, 정보 격차로 인해 인구의 K자형 양극화가 발생할 것이라고 논의하고 있습니다. (출처: 36氪)

💡 기타

Mac mini 16GB 모델 전 세계적 품귀 현상: OpenClaw 등 로컬 에이전트 프로젝트의 영향으로 16GB 이상의 통합 메모리를 갖춘 Mac mini가 ‘디지털 육체’의 최우선 선택지가 되면서 곳곳에서 가격 상승과 품절 현상이 나타나고 있습니다. 이는 AI 하드웨어 수요가 클라우드 컴퓨팅에서 개인용 에지 컴퓨팅 박스로 이동하고 있음을 반영합니다. (출처: 光锥智能)

미국 6개 주, 데이터 센터 건설 중단: 뉴욕주를 포함한 미국의 6개 주에서 전력 위기에 대응하기 위해 데이터 센터 건설을 일시 중단하는 법안을 도입했습니다. 커뮤니티에서는 미국이 “AGI를 가질 것인가, 전력망을 지킬 것인가”라는 딜레마에 빠졌다고 조롱 섞인 반응을 보였으며, 이는 AI 기업들이 더 공격적인 공간 컴퓨팅이나 원자력 솔루션을 찾게 만들 수 있습니다. (출처: teortaxesTex)

数据中心禁令

Wikimedia, AI 거물들과 API 협력 체결: 위키미디어 재단이 Amazon, Microsoft 등과 재정적 지원을 대가로 고속 API 액세스를 제공하는 계약을 체결했습니다. 이는 지식 베이스와 AI 업체 간의 일종의 ‘생존 계약’으로 간주되며, AI 크롤러가 전통적인 지식 커뮤니티 인프라에 가하는 압박을 해결하기 위한 조치입니다. (출처: DeepLearningAI)