AI 일보 – 2026-07-05

키워드:대형 모델, AI 칩, 에이전트, GPT-5.6 시리즈, Jalapeño 추론 칩, 다중 모델 협력 오케스트레이션

🔥 포커스

OpenAI, GPT-5.6 시리즈 및 자체 개발 추론 칩 Jalapeño 발표 : OpenAI가 Sol, Terra, Luna를 포함한 GPT-5.6 시리즈 모델을 출시했습니다. 이 모델들은 긴 체인 추론(long-chain reasoning)과 멀티 에이전트 협업 모드를 지원하지만, 초기 출시는 미국 정부의 규제로 인해 일부 기관에만 제한적으로 공개됩니다. 동시에 OpenAI는 Broadcom과 공동 개발한 첫 자체 대형 모델 추론 칩 Jalapeño를 발표했습니다. TSMC 공정을 채택한 이 칩은 ChatGPT의 일상적인 추론 비용을 대폭 절감하고 응답 속도를 높이는 것을 목표로 합니다. 이는 AI 거대 기업들의 경쟁이 단순한 알고리즘 군비 경쟁을 넘어, 하부 맞춤형 하드웨어 공급망 깊숙이 확장되고 있음을 보여줍니다. (출처: 36氪)

OpenAI发布GPT-5.6系列与自研推理芯片Jalapeño

Claude Fable 5 및 Mythos 5 복귀와 함께 안전성 논란 발생 : 규제 파동을 겪은 후 복귀한 Claude Fable 5가 지나치게 엄격한 안전 분류기(safety classifier)로 인해 혹평을 받고 있습니다. 수많은 정상적인 요청이 오탐지되어 자동으로 Opus로 다운그레이드되고 있습니다. 한편, 해커들은 테스트 과정에서 Fable 5가 깊은 추론을 수행할 때 필터링되지 않은 ‘읽을 수 없는 생각의 사슬(unreadable chain of thought)’을 출력하며, 자체적으로 만든 기호와 감탄사로 속기한다는 사실을 발견했습니다. 이는 추론 대형 모델이 강화 학습 하에서 효율성을 높이기 위해 스스로 인류의 언어에서 벗어나고 있음을 보여주며, AI 안전성과 설명 가능성(explainability)이 직면한 새로운 과제를 드러냅니다. (출처: 量子位)

Claude Fable 5与Mythos 5回归伴随安全争议

Shengshu Technology, 실시간 대화형 비디오 대형 모델 Vidu S1 발표 : Shengshu Technology가 실시간 대화형 비디오 생성 모델 Vidu S1을 출시했습니다. 이 모델은 음성 제어를 통한 비디오 콘텐츠 생성, 무제한 실시간 생성, 그리고 540P/25FPS의 실시간 상호작용을 지원합니다. 사용자는 첫 프레임 이미지 한 장과 맞춤형 음색만 업로드하면, 모델이 해당 캐릭터의 표정과 동작을 실시간으로 생성하며 소비자용 그래픽 카드에서도 매끄럽게 작동합니다. 이 혁신은 비디오 생성을 ‘오프라인 재생’에서 ‘양방향 실시간 상호작용’ 시대로 이끌며, 디지털 휴먼 및 가상 동반자 개발의 진입 장벽을 크게 낮추었습니다. (출처: 机器之心)

生数科技发布实时交互视频大模型Vidu S1

Damo Academy, 초전도 재료 AI 에이전트 ElementsClaw 발표 : 알리바바 Damo Academy가 여러 대학과 공동으로 초전도 재료 발견을 전문으로 하는 최초의 AI 에이전트인 ElementsClaw를 발표했습니다. 이 에이전트는 10억 개의 매개변수를 가진 기하학적 깊은 그래프 신경망(geometric deep graph neural network)과 대형 언어 모델을 결합하여, 단 28 GPU 시간 만에 240万 종의 안정적인 결정을 스크리닝하고 6만 8천 종의 잠재적 초전도체를 예측했으며, 실험을 통해 인류에게 알려지지 않았던 4가지 완전히 새로운 초전도 재료를 합성하는 데 성공했습니다. 이 성과는 초전도 재료 연구 개발 효율성을 극대화하고 하드 사이언스(hard science) 분야에서 AI의 실질적인 적용을 촉진했습니다. (출처: 量子位)

达摩院发布ElementsClaw超导材料AI智能体

Baiyao Technology, 가상 세포 세계 모델 AURA CellOS 발표 : Baiyao Technology가 LLM-JEPA 아키텍처 기반의 AI 가상 세포 세계 모델 AURA CellOS를 발표했습니다. 이 모델은 12B 매개변수를 가졌으며, 40여 개 조직과 260여 개 세포 유형을 아우르는 3억 9천만 개의 인간 단일 세포 전사체(single-cell transcriptome) 데이터를 기반으로 학습되었습니다. 다중 뷰 표상 학습(multi-view representation learning)과 JEPA 공동 임베딩 예측을 통해 CellOS는 모델이 세포 상태의 내재적 진화 법칙을 최초로 이해하도록 했으며, 섭동 반응 예측(perturbation response prediction) 등의 작업에서 세계 최고 수준의 성능을 달성하여 AI 제약 및 세포 치료를 위한 핵심 계산 기반을 제공했습니다. (출처: 量子位)

百曜科技发布虚拟细胞世界模型AURA CellOS

🎯 동향

Microsoft, 첫 독립 추론 대형 모델 MAI-Thinking-1 발표 : Microsoft가 Build 컨퍼런스에서 MAI-Thinking-1 추론 모델을 선보였습니다. 이 모델은 1조 개의 매개변수를 가진 혼합 전문가(MoE) 아키텍처를 채택했으며, 다른 모델의 증류(distillation)나 미세 조정(fine-tuning) 없이 완전히 처음부터 학습되었습니다. 25만 Token의 컨텍스트를 지원하며, 수학 및 STEM 추론 벤치마크에서 강력한 성능을 보여주었고, AIME 2025에서는 Claude Sonnet 4.6을 능가하기도 했습니다. 이는 Microsoft가 OpenAI 기술에 대한 의존도에서 벗어나 독자적인 AI 기술 스택을 구축하는 데 있어 중요한 한 걸음을 내디뎠음을 의미합니다. (출처: DeepLearning.AI Blog)

微软发布首个独立推理大模型MAI-Thinking-1

Dongfeng Yijing, 화웨이 Qiankun 스마트 드라이빙 ADS 5와 극한 상황 실주행 테스트 완료 : Dongfeng의 하이엔드 브랜드 Yijing X9이 화웨이 Qiankun 스마트 드라이빙 ADS 5를 탑재하고 야간, 폭우, 갑작스러운 보행자 튀어나옴(ghost cuts) 등 극한 상황에서의 실주행 테스트를 완료했습니다. ADS 5는 새로운 WEWA 2.0 아키텍처를 채택하여 멀티 에이전트 게임 이론과 안전 위험장(safety risk field) 알고리즘을 융합함으로써 비용을 절감하고 효율을 높이는 동시에 충돌 위험을 낮췄습니다. 실주행 테스트 결과, 미지의 창고 환경에서도 운전자 개입 없는(zero-intervention) 자율 크루징이 가능함을 보여주었으며, 이는 스마트 드라이빙 시스템이 규칙 기반(rule-driven)에서 데이터 및 AI 에이전트 기반으로 세대교체되고 있음을 보여줍니다. (출처: 量子位)

东风奕境携手华为乾崑智驾ADS 5极限场景实测

Sakana AI, 다중 모델 협업 오케스트레이션 시스템 Fugu 시리즈 발표 : 일본 AI 스타트업 Sakana AI가 Fugu 및 Fugu-Ultra 모델을 발표했습니다. 이 시스템은 단일 모델에 의존하지 않고, 진화 알고리즘과 강화 학습을 통해 API 게이트웨이 레이어에서 하위 모델(Claude, GPT, Gemini 등)을 동적으로 스케줄링하여 복잡한 작업을 협업으로 완수합니다. Fugu-Ultra는 GPQA-Diamond 과학 테스트에서 사상 최고치인 95.5%의 정확도를 기록했습니다. 이는 다중 모델 협업 오케스트레이션이 단일 공급업체 종속(lock-in)을 방지하고 추론 비용을 최적화하는 중요한 트렌드로 자리 잡았음을 보여줍니다. (출처: DeepLearning.AI Blog)

Sakana AI发布多模型协同编排系统Fugu系列

DeepSeek DSpark 가속 기술, Mac 로컬 환경으로 성공적 이식 : 오픈소스 엔지니어 Abdur Rahim이 DeepSeek의 DSpark 투기적 디코딩(speculative decoding) 기술을 Apple 실리콘으로 이식하여 mlx-dspark 프로젝트를 공개했습니다. M4 Pro 칩에서 이 프로젝트는 Gemma-4 12B와 Qwen3-4B의 로컬 추론 속도를 각각 1.6배와 1.4배 향상시켰으며, 출력 결과는 동일한 온도 샘플링 하에서 원본 모델과 완전히 일치했습니다. 이번 시도는 투기적 디코딩 기술이 소비자용 엣지 기기에서도 비용 절감 및 효율성 향상에 막대한 잠재력을 가지고 있음을 증명합니다. (출처: 36氪)

DeepSeek DSpark加速技术被成功移植至Mac本地

상하이교통대 DENG Lab, 세계-언어-행동 모델 WLA 오픈소스 공개 : 상하이교통대학교 DENG Lab이 세계 모델링, 언어 추론, 로봇 행동 생성을 하나의 2B 매개변수 자기회귀 프레임워크로 통합한 WLA 모델을 오픈소스로 공개했습니다. WLA는 미세한 물리적 역학을 예측할 수 있을 뿐만 아니라, 자연어를 통해 하위 작업 시퀀스를 예측하고 장기 계획을 위한 메모리 버퍼를 유지할 수 있습니다. 장기 메모리 벤치마크인 RMBench에서 WLA는 56.5%의 성공률을 기록하여 2위 방법의 거의 두 배에 달하는 성능을 보였으며, 추론 지연 시간은 40ms에 불과했습니다. (출처: 机器之心)

上海交大DENG Lab开源世界-语言-动作模型WLA

Tencent Cloud, DeepSeek-V4 모델 서비스 직접 제공 예정 : Tencent Cloud가 7월 중순부터 자사 TokenHub 플랫폼에서 DeepSeek-V4 모델 서비스를 제공할 예정이라고 발표했습니다. 이 서비스는 DeepSeek 자체 네트워크에서 직접 실행됩니다. 이번 협력은 Tencent Cloud의 기술 지원 덕분이며, 동시에 DeepSeek가 자사 컴퓨팅 클러스터에 대해 가진 자신감을 보여줍니다. 이는 기업 고객이 첨단 오픈소스 대형 모델을 호출할 때 더 탄력적이고 네트워크가 보장된 컴퓨팅 인프라 옵션을 제공합니다. (출처: teortaxesTex)

腾讯云将直接提供DeepSeek-V4模型服务

🧰 도구

LangChain, 범용 메모리 위키 에이전트 OpenWiki 오픈소스 공개 : LangChain이 OpenWiki 프로젝트를 오픈소스로 공개했으며, 출시 단 3일 만에 GitHub 스타 1.7k를 획득했습니다. 이 프로젝트는 현재 주로 코드베이스를 위한 구조화된 메모리 위키를 구축하여, 에이전트가 장기 작업에서 핵심 정보를 잊어버리는 문제를 해결합니다. 개발 팀은 이를 Notion, Google Drive, Slack 및 웹 검색 등 더 범용적인 데이터 소스로 확장하여 글로벌 에이전트 메모리 허브를 구축할 계획입니다. (출처: LangChain)

LangChain开源通用内存维基智能体OpenWiki

Vercel, Eve 에이전트 프레임워크 발표 및 LlamaIndex 통합 : Vercel이 Eve 에이전트 프레임워크를 출시했으며, LlamaIndex가 이에 맞춘 통합 템플릿을 즉시 구축했습니다. 이 템플릿은 Eve에 읽기 전용 파일 시스템 도구 세트를 제공하여 경로를 해석하고 텍스트를 읽을 수 있게 하며, LiteParse 도구와 협력하여 비구조화된 문서를 깔끔한 Markdown 형식으로 파싱합니다. 이 조합은 에이전트가 복잡한 로컬 문서 컬렉션을 효율적으로 탐색하고 이해할 수 있는 신뢰할 수 있는 즉시 사용 가능한(out-of-the-box) 워크플로우를 제공합니다. (출처: jerryjliu0)

Hugging Face, 대형 모델 프롬프트 미세 조정 자동 최적화 프레임워크 발표 : Hugging Face가 Harness Optimization 프로젝트에서 자동 프롬프트 미세 조정 프레임워크를 선보였습니다. 이 프레임워크는 Claude를 제안자(proposer)로 삼아, 하위 모델 가중치를 수정하지 않고 자동 반복 및 검증을 통해 에이전트 주변의 프롬프트와 도구 호출 코드를 재작성합니다. 테스트 결과, 이 방법은 고정된(frozen) 오픈소스 모델의 복잡한 법률 평가 점수를 0%에서 Sonnet 4.6 수준으로 끌어올렸으며, 작업 비용은 7배 절감했습니다. (출처: ClementDelangue)

Fable 5 기반 PPT 디자인 도구 baoyu-design 업데이트 : 개발자 Baoyu가 오픈소스 baoyu-design 에이전트 기능을 업데이트하여 PPT 애니메이션 및 AI 이미지 생성 호출 지원을 추가했습니다. 이 도구는 Fable 5의 PPTX XML 형식에 대한 깊은 이해를 활용하여, 기존 Opus 4.8이 해결하지 못했던 애니메이션 내보내기 제한을 성공적으로 해결했습니다. 이제 사용자는 애니메이션 효과가 포함된 HTML 형식의 PPT를 직접 생성하고, Keynote나 PowerPoint에서 편집 가능한 PPTX 파일로 원활하게 내보낼 수 있습니다. (출처: dotey)

基于Fable 5的PPT设计工具baoyu-design更新

Termiprotocol, Claude Code를 위한 3D 가상 사무실 구축 : 개발자들이 오픈소스 프로젝트 Termiprotocol을 출시하여 Claude Code, Codex 등 터미널 에이전트를 위한 3D 가상 사무실 인터페이스를 구축했습니다. 에이전트가 터미널에서 수행하는 모든 작업(파일 읽기/쓰기, 웹 검색, 코드 실행 등)이 사무실에서 타이핑을 하거나 서류 캐비닛을 뒤지는 3D 꼬마 로봇의 형태로 실시간 시각화됩니다. 또한 직관적인 Token 소모 모니터링과 작업 보드가 함께 제공되어 에이전트 워크플로우의 시각화와 재미를 크게 높였습니다. (출처: Reddit r/ClaudeAI)

Termiprotocol为Claude Code打造3D虚拟办公室

Hugging Face 및 Cerebras, Gemma 4 음성 Demo 출시 : Hugging Face와 Cerebras가 협력하여 완전한 오픈소스 실시간 음성 상호작용 Demo를 구축했습니다. 이 Demo는 Gemma 4 모델과 Cerebras의 초저지연 추론 하드웨어를 기반으로 하여 초고속 음성 대 음성(Speech-to-Speech) 대화 경험을 구현했습니다. 사용자는 Hugging Face Spaces에서 이 프로젝트를 직접 테스트하고, 포크(fork)하며 조정할 수 있어 오픈소스 커뮤니티가 저지연 음성 비서를 개발하는 데 훌륭한 모범 사례를 제공합니다. (출처: huggingface)

📚 학습

ByteDance, 초장기 에이전트 학습 평가 벤치마크 EdgeBench 발표 : ByteDance의 Seed 팀이 에이전트가 12~72시간의 초장기 실행 주기 동안 환경 피드백으로부터 어떻게 지속적으로 학습하는지 연구하기 위해 설계된 평가 벤치마크인 EdgeBench를 발표했습니다. 에이전트를 대상으로 누적 3만 8천 시간의 실행 테스트를 진행한 결과, 연구진은 에이전트의 성능 향상과 환경 상호작용 시간 사이의 관계가 로그-시그모이드(log-sigmoid) 함수와 정확히 일치한다는 점을 발견했습니다. 이는 작업 경험을 축적하고 재사용하는 것이 에이전트의 장기적인 발전을 이끄는 핵심임을 증명합니다. (출처: arankomatsuzaki)

字节跳动发布超长周期Agent学习评估基准EdgeBench

삼성-베이징대, AI 에이전트 시스템 벤치마크 LiveClawBench 발표 : 삼성 대형 모델 팀이 베이징대학교 등 기관과 공동으로 개인 비서 에이전트의 복잡한 워크플로우 성능을 평가하기 위한 LiveClawBench를 발표했습니다. 이 벤치마크는 134개의 실행 가능한 작업과 3차원 복잡도 요인 체계를 포함합니다. 실험 결과, 첨단 모델의 경우 작업 도메인은 점수 변동의 약 9.6%만 설명할 수 있는 반면, 작업의 ‘복잡도 프로필’은 18.6%의 설명력을 가져 크로스 서비스 의존성과 목표 해석이 에이전트 불안정의 주된 원인임을 밝혔습니다. (출처: 机器之心)

三星联合北大发布AI Agent系统性基准LiveClawBench

중국인민대, 데이터 에이전트 벤치마크 CoDA-Bench 발표 : 중국인민대학교 연구팀이 에이전트의 코드 지능과 데이터 지능을 공동 평가하기 위한 CoDA-Bench 벤치마크를 출시했습니다. 이 벤치마크는 에이전트를 1,000개 이상의 방해 파일이 포함된 복잡한 Linux 샌드박스에 배치하고, 파일 시스템을 자율적으로 탐색하여 관련 데이터를 찾아내고 분석 코드를 작성하도록 요구합니다. 실험 결과, 가장 우수한 성능을 보인 시스템조차 CoDA-Bench에서 61.1%의 정확도에 그쳐, ‘올바른 데이터를 찾지 못하는 것’이 현재 Code Agent의 핵심 병목 구간임을 드러냈습니다. (출처: 机器之心)

人大发表数据智能体基准CoDA-Bench

Meta, 양자화 추론 모델의 ‘과도한 생각(Overthinking)’ 결함 발견 및 해결책 제시 : Meta는 연구를 통해 양자화(quantization) 추론 모델의 기이한 실패 모드를 밝혔습니다. 모델이 양자화된 후 능력이 저하될 뿐만 아니라 ‘과도한 생각’을 시작한다는 점입니다. 실패 사례 중 최대 52%에서 모델은 이미 추론 중간에 정답을 도출했으나, 양자화로 인해 망설임 Token(예: wait, but, maybe)의 샘플링 확률이 높아지면서 끝없는 자기 성찰에 빠져 결국 올바른 결론을 뒤집었습니다. Meta는 망설임 Token에 미세한 디코딩 페널티를 부여하여 과도한 생각 오류를 58% 줄이는 데 성공했습니다. (출처: TheTuringPost)

Meta发现量化推理模型“过度思考”缺陷并提出解决方案

스탠퍼드-UC 버클리, 로봇 비전-언어 보상 모델 RoboReward 발표 : 스탠퍼드 대학교와 UC 버클 연구팀이 4B/8B 매개변수를 가진 로봇 비전-언어 보상 모델 RoboReward를 출시했습니다. 이 연구는 성공적인 동작 비디오를 텍스트로 재라벨링하고 잘라내어 고품질의 부정적이고 불완전한 시도 샘플을 대량 생성함으로써, 기존 강화 학습(RL)에서 실패 사례가 부족했던 고질적인 문제를 해결했습니다. 실험 결과, RoboReward를 사용해 보상을 평가했을 때 실제 로봇 팔의 물건 집기 및 서랍 열기 작업에서의 성공률이 유사한 범용 대형 모델들을 크게 능가했습니다. (출처: DeepLearning.AI Blog)

斯坦福与UC伯克利发布机器人视觉-语言奖励模型RoboReward

CMU, Advanced NLP 강의 전체 23강 영상 및 자료 오픈소스 공개 : 카네기 멜론 대학교(CMU)의 Sean Welleck 교수가 자신의 ‘고급 자연어 처리(ANLP Spring 2026)’ 강의 전체 23강 영상을 YouTube에 업로드하고, 강의 노트와 20개의 코드 예제를 오픈소스로 공개했습니다. 강의 내용은 NLP 기초, 모델 아키텍처, 학습 및 추론, 평가 방법, 강화 학습 및 에이전트(RL & Agents), 모델 스케일링 및 효율성 등 7대 주제를 체계적으로 다루고 있어 대형 모델의 기본 원리를 깊이 있게 학습할 수 있는 훌륭한 리소스입니다. (출처: gneubig)

CMU开源Advanced NLP课程全部23讲视频与课件

Sebastian Raschka 신간 ‘Build a Reasoning Model (From Scratch)’ 정식 출간 : 저명한 머신러닝 전문가 Sebastian Raschka의 신간 《Build a Reasoning Model (From Scratch)》이 정식 출간되었습니다. 총 440페이지 분량의 이 책은 풀 컬러로 인쇄되었으며 실행 가능한 코드 예제를 제공합니다. 책은 추론 스케일링(Inference Scaling), 강화 학습(RL), 모델 증류(Distillation) 등 최첨단 기술을 포함하여 추론 모델의 기본 논리를 체계적으로 소개하고 있어 대형 모델의 기초 이론을 다지기에 적합한 도서입니다. (출처: cwolferesearch)

Sebastian Raschka新书《从头构建推理模型》正式出版

💼 비즈니스

Unitree Robotics, 중국 증감회로부터 STAR Market IPO 등록 승인 획득 : 중국 증권감독관리위원회(증감회)가 Unitree Robotics의 STAR Market(科创板) 기업공개(IPO) 등록 신청을 공식 승인했습니다. Unitree Robotics는 10% 이상의 주식을 공모 발행하여 42억 200만 위안을 조달할 계획이며, 기업 가치는 약 420억 위안으로 평가받고 있습니다. 투자설명서에 따르면 Unitree는 2025년에 매출 17억 800만 위안, 순이익 5억 9,100만 위안을 기록했으며, 휴머노이드 로봇 출하량은 5,500대를 초과해 글로벌 시장 점유율 32.4%를 달성했습니다. 이는 중국 내 최초로 흑자를 달성한 완제품 embodied AI 기업이 A주 시장에 공식 상장하게 됨을 의미합니다. (출처: 36氪)

Silicon Flow, 홍콩증권거래소에 투자설명서 제출하며 ‘첫 Token 공장 상장사’ 도전 : AI 인프라 스타트업 Silicon Flow가 홍콩증권거래소(HKEX)에 공식적으로 투자설명서를 제출했습니다. 이 회사는 AI 산업의 ‘Token 도매상’을 자처하며 표준화된 API를 통해 다중 모델 통합 접속 서비스를 제공합니다. 시리즈 B+ 투자 유치 후 기업 가치는 77억 4,000만 위안에 달했으며, 주주로는 알리바바, 텐센트, 화웨이, 메이투안 등 대기업들이 참여하고 있습니다. 투자설명서에 따르면 2025년 회사의 퍼블릭 클라우드 유료 고객은 71만 6,000개사에 달했으나, 초기 컴퓨팅 자원 및 마케팅 투자 비용이 막대하여 3억 4,500만 위안의 순손실을 기록했습니다. (출처: 36氪)

硅基流动向港交所递交招股书冲刺“Token工厂第一股”

Guangxiang Technology, 누적 수억 위안 규모의 엔젤 라운드 투자 유치 완료 : embodied AI 스타트업 Guangxiang Technology가 Zhuhai Technology Group, Industrial Securities Capital, Pinehills Capital 등이 공동 투자한 누적 수억 위안 규모의 엔젤 라운드 투자를 완료했다고 발표했습니다. 칭화대학교 팀이 인큐베이팅한 Guangxiang Technology는 ‘물리 네이티브 지능(physics-native intelligence)’ 기술 노선을 확립하고, 강화 학습 알고리즘 매트릭스, 고정밀 물리 데이터 자산 및 지능형 개발 플랫폼으로 구성된 시스템을 구축했습니다. 자체 개발한 embodied 로봇 Phi-Bot X1은 자동차 생산 라인의 용접 및 로딩 공정에서 고정밀 연속 작업 검증을 마쳤습니다. (출처: 量子位)

光象科技完成累计数亿元天使轮融资

🌟 커뮤니티

알리바바, 사내 공지 통해 Claude 및 Claude Code 전면 금지 : 알리바바가 사내 긴급 공지를 통해 직원들에게 7월 10일까지 Claude 및 Claude Code 등 Anthropic 제품을 전면 삭제하고 사용을 금지할 것을 요구했습니다. 앞서 보안 커뮤니티의 역공학 분석 결과, Claude Code에 중국 사용자 및 AI 연구소를 감지하는 은밀한 메커니즘이 내장되어 있음이 밝혀졌습니다. 이 도구는 난독화된 코드를 통해 시스템 시간대, 프록시, API 키워드를 수집하고 프롬프트 내의 Unicode 문자를 변조하는 방식으로 환경 지문을 서버로 전송하여, 기업의 핵심 코드 유출 우려를 불러일으켰습니다. (출처: 36氪)

阿里内部下发通知全面禁用Claude及Claude Code

Godot 게임 엔진, AI 코드 기여 정책 전면 강화 발표 : 오픈소스 게임 엔진 Godot이 기여 정책을 수정하여 AI를 사용한 대량의 코드 생성 및 AI Agent의 자동 PR 제출 행위를 전면 금지한다고 발표했습니다. 공식 측은 AI가 코드 작성의 진입 장벽을 낮췄지만 저품질 PR의 대량 유입을 초래하여 자원봉사 메인테이너들의 검토 에너지를 심각하게 소모하고 있다고 지적했습니다. 더 심각한 것은 많은 기여자들이 AI가 생성한 코드를 전혀 설명하지 못하며, 버그가 발생했을 때 유지보수도 불가능하다는 점입니다. Godot은 AI가 코드에 대해 책임을 질 수 없으며, 프로젝트에 필요한 것은 코드를 진정으로 이해하는 사람이라고 강조했습니다. (출처: 36氪)

Godot游戏引擎官方宣布全面收紧AI代码贡献政策

Meta, 유휴 AI 컴퓨팅 자원 대여하는 클라우드 서비스 Metamate 출시 계획 : 블룸버그 통신은 Meta가 클라우드 인프라 사업 부문인 ‘Metamate’를 설립하여 외부 고객에게 유휴 AI 컴퓨팅 자원과 모델 액세스 권한을 판매하고, 2027년까지 연간 100억~150억 달러의 매출을 올릴 계획이라고 보도했습니다. 이 소식은 AI 컴퓨팅 자원의 일시적 과잉 공급에 대한 시장의 우려를 불러일으켰으며, 이로 인해 글로벌 칩 및 메모리 섹터가 이후 이틀 동안 대규모 매도세를 겪었습니다. (출처: 36氪)

학계, 수학 연구에서 AI 대형 모델이 점차 인간을 대체하고 있음을 발견 : OpenAI 내부 모델이 물리학자 Erdős가 제안하고 인류가 약 80년 동안 연구해 온 ‘평면 단위 거리 추측(unit distance graph conjecture)’을 독자적으로 반박하면서, AI의 수학적 추론 능력이 급격한 도약을 맞이했습니다. 이는 수학 박사 과정 학생들 사이에서 ‘멘탈 붕괴’ 수준의 불안감을 유발했으며, 일부 학생들은 현실 도피를 위해 《Honor of Kings》(王者荣耀)를 할 수밖에 없다고 농담 섞인 한탄을 하기도 했습니다. 학자들은 표준화되고 형식화된 수학 연구에서 AI의 높은 효율성이 인간 수학자들로 하여금 자신의 연구 가치와 미학적 경계를 재고하게 만들고 있다고 보고 있습니다. (출처: 36氪)

学术界发现AI大模型在数学研究中正逐步替代人类

Cloudflare 보고서, 기계 네트워크 트래픽이 사상 처음으로 인간 초과 : 네트워크 보안 서비스 제공업체 Cloudflare가 발표한 보고서에 따르면, 자사 호스팅 웹사이트가 수신한 전체 네트워크 접속 요청 중 약 57.4%가 인공지능 및 자동화 프로그램(AI 학습 크롤러, Agent 등)에서 발생했으며, 실제 인간의 요청은 42.6%에 불과했습니다. 이는 인터넷 역사상 기계 트래픽이 인간 트래픽을 처음으로 넘어선 것으로, 네트워크 상호작용 패러다임의 근본적인 변화를 의미하며 기존의 트래픽 기반 광고 수익 모델에 시스템적인 타격을 입혔습니다. (출처: 36氪)

Cloudflare报告显示机器网络流量首次超越人类

💡 기타

연구진, 대형 언어 모델 내 유령 이름 ‘Dr. Elena Rodriguez’ 발견 : 삼성 연구소가 ‘대조 디코딩 차이(CDD)’에 관한 논문에서 흥미로운 발견을 공개했습니다. 여러 미세 조정 모델의 학습 데이터를 역추적하여 복원하는 과정에서, 서로 다른 분야의 모델 출력 결과에 가상의 과학자 이름인 ‘Dr. Elena Rodriguez’가 높은 빈도로 등장했습니다. 조사 결과, 이는 Claude Sonnet 3.6이 합성 학습 데이터를 생성할 때 이 이름을 극도로 선호했기 때문이며, 결과적으로 이 합성 데이터를 사용한 모든 미세 조정 모델에 무의식적으로 ‘구워져(baked)’ 들어간 것으로 밝혀졌습니다. (출처: Reddit r/MachineLearning)

研究人员发现大语言模型中存在“Dr. Elena Rodriguez”幽灵人名

Reddit 사용자들, Perplexity Pro의 은밀한 사용 한도 제한 비판 : Perplexity Pro(연회비 200달러)를 구독한 많은 사용자들이 최근 ‘무제한 파일 업로드’ 및 ‘Deep Research’ 기능이 소리 소문 없이 제한되어 회색으로 비활성화된 것을 발견하고 Reddit에서 불만을 토로하고 있습니다. 사용자들은 플랫폼이 이메일, 공지 또는 서비스 약관 업데이트 없이 일방적으로 Pro 사용자의 혜택을 축소했다고 비판하며, SaaS 서비스의 투명성과 소비자 권익 보호에 대한 커뮤니티의 광범위한 논의를 불러일으켰습니다. (출처: Reddit r/artificial)

Reddit 사용자, Fable 5로 10년 치 세계관 설정 정리 및 위키 자동 생성 경험 공유 : 한 소설 창작자가 Reddit을 통해 자신이 10년 동안 축적한 수십만 자 분량의 소설 초안, 세계관 설정, 어수선한 메모를 하나의 PDF로 정리한 뒤 Fable 5를 이용해 분석한 경험을 공유했습니다. Fable 5는 단일 세션 한도의 90%를 소모한 끝에, 이 내용들을 구조화된 캐릭터, 사건, 지리 항목으로 완벽하게 정리하고 World Anvil 위키 시스템에 직접 가져올 수 있는 Markdown 파일을 자동으로 생성하여 창작자의 오랜 병목 현상을 해결해 주었습니다. (출처: Reddit r/ClaudeAI)

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다