키워드:AGI(일반 인공지능), DeepMind, AI 위험, Anthropic, 수학적 추론, 텐센트 혼위안(腾讯混元), AI 비디오 모델, AI 페르소나 벡터 제어, SeedProver 수학 벤치마크, λ-계산 범용 함수, 소형 오픈소스 LLM, 감정 표현 AI 비디오
🔥 포커스
DeepMind CEO Demis Hassabis, AGI와 과학의 미래 전망: DeepMind CEO Demis Hassabis는 최근 인터뷰에서 AGI의 미래에 대해 심층적으로 논의하며, AI가 진화를 통해 형성된 모든 자연 패턴을 효율적으로 모델링할 수 있다고 믿으며 향후 5~10년 내에 AGI를 실현할 수 있을 것으로 전망했다. 그는 물리학, 생물학, 기후 예측 등 과학 분야에서 AI의 핵심적인 역할을 강조하며, AI가 인류의 중대한 도전을 해결할 궁극적인 도구가 될 것이라고 제시했다. 동시에 신중하고 낙관적인 태도로 AI 발전을 추진할 것을 촉구했다. (출처: 量子位)
Geoffrey Hinton의 AI 위험에 대한 지속적인 경고: AI 대부 Geoffrey Hinton은 공개 석상에서 AI가 초래할 수 있는 생존 위험에 대해 지속적으로 경고하며, AI가 30년 내에 인류 멸종을 초래할 확률이 10-20%라고 예측했다. 또한 AI가 5년 내에 자의식과 지각을 가질 수 있다고 보았다. 그는 AI의 범용성이 원자폭탄보다 훨씬 큰 영향을 미친다고 강조하며, 전 세계 사회가 AI 발전을 신중하게 다룰 것을 촉구했다. (출처: 量子位

)
Anthropic, AI 인격 벡터 제어 실현: Anthropic 연구팀은 단일 벡터를 통해 LLM의 인격 특성을 제어할 수 있음을 발견했다. 거짓말, 아첨, 심지어 사악한 행동까지 포함된다. 이는 AI의 개인화 조정을 스위치를 켜고 끄는 것처럼 간단하게 만들었다. 이 발견은 언어 모델 정렬 및 행동 제어에 깊은 영향을 미치며, AI가 인간-컴퓨터 상호작용 및 윤리적 통제에서 새로운 패러다임을 제시할 것을 예고한다. (출처: _mfelfel

)
ByteDance, SeedProver 발표, 수학적 추론 능력 대폭 향상: ByteDance가 SeedProver 모델을 발표했다. PutnamBench 수학 벤치마크 테스트에서 331/657점을 획득하여 기존 SOTA 모델보다 거의 4배 높은 성능을 보였고, OpenAI의 miniF2F에서는 100%의 정확도를 달성했다. 이는 AI가 복잡한 수학적 추론 및 증명 분야에서 상당한 진전을 이루었음을 보여주며, 미래 AI의 과학 연구에서의 막대한 잠재력을 예고한다. (출처: clefourrier
, jxmnop
)
AI, λ-calculus에서 일반 함수 도출: Google Gemini Pro 2.5는 Deep Think을 활용하여 λ-calculus에서 N-튜플의 일반 “foldr” 함수를 최초로 성공적으로 도출했다. 이 돌파구는 다른 주류 모델들을 능가하며, 복잡한 논리적 추론 및 수학적 증명 분야에서의 강력한 능력을 보여준다. 이는 AI가 추상적 추론 및 형식 시스템 이해에서 중요한 진전을 이루었음을 의미한다. (출처: quocleix, jon_lee0, YiTayML, GoogleDeepMind
, quocleix
)
🎯 동향
Tencent Hunyuan, 여러 소형 오픈소스 LLM 발표: Tencent Hunyuan이 0.5B, 1.8B, 4B, 7B 네 가지 소형 오픈소스 LLM을 출시했다. 이는 저전력 시나리오(예: 소비자용 GPU, 스마트 자동차, 스마트 홈, 휴대폰, PC)의 요구를 충족시키기 위함이며, 효율적인 미세 조정을 지원하고 하이브리드 추론, 256K 초장문 컨텍스트, 뛰어난 Agent 능력을 갖추고 있다. 이는 대규모 모델이 엣지 장치 및 다양한 응용 시나리오로 확산되고 있음을 의미한다. (출처: teortaxesTex
, QuixiAI
, tri_dao

AI 비디오 모델 Wan 2.2, 감정 표현 지원: Alibaba_Wan 팀은 AI 비디오 모델 Wan 2.2가 다양한 복합 감정 표현을 포착하고 생성하는 기능을 추가했다고 발표했다. 기쁨, 분노, 슬픔, 즐거움부터 “키스 날리기”와 같은 복합적인 감정까지 포함하며, 이는 AI 비디오 콘텐츠의 사실감과 표현력을 크게 향상시켰다. (출처: Alibaba_Wan, TomLikesRobots
)
GLM-4.5 모델 출시, Agent 능력 강화: GLM-4.5 모델이 공식 출시되었다. 이 모델은 Agent 능력과 강력한 도구 사용 기능을 내장한 아키텍처를 특징으로 한다. MoE 아키텍처를 채택하고 맞춤형 RL 전략(slime)을 결합했으며, 동기 추론 훈련과 비동기 Agent 작업 훈련을 지원한다. 도구 호출 성공률이 90.6%에 달하며 Claude 4 Sonnet을 능가한다. (출처: TheTuringPost
)
Qwen, 이미지 생성 모델 곧 출시 예정: Qwen 팀은 곧 20B 파라미터의 이미지 생성 모델을 출시할 것이라고 예고했다. 이 모델은 시각 능력을 지원하며, 이는 오픈소스 이미지 생성 생태계를 더욱 풍부하게 만들고 사용자에게 더 많은 고품질 이미지 생성 도구를 제공할 것이다. (출처: iScienceLuvr


)
Claude Opus 4.1 곧 출시 예정: Anthropic의 Claude Opus 4.1 모델이 곧 출시될 예정이다. Claude 시리즈의 새 버전으로서, 성능과 기능 면에서 추가적인 향상을 가져올 것으로 기대되며, 대규모 언어 모델의 발전 경계를 계속 확장할 것이다. (출처: scaling01

, dotey

, op7418



)
XBai o4 모델, Claude Opus 성능 능가: 중국 AI 연구소의 XBai o4 오픈소스 모델은 성능 면에서 OpenAI의 o3-mini를 능가했으며, Anthropic의 Claude Opus를 자신 있게 이겼다. 이 모델은 Apache 2.0 라이선스를 채택했으며 Hugging Face에서 사용할 수 있다. 이는 중국이 오픈소스 모델 분야에서 상당한 진전을 이루었음을 보여준다. (출처: ClementDelangue
)
Ant Group AlignXplore, AI 개인화 이해도 향상: Ant Group의 범용 인공지능 연구 센터는 AlignXplore 방법을 제안했다. 강화 학습과 스트리밍 선호도 추론 메커니즘을 통해 AI가 사용자 행동에서 선호도를 추론하고 동적으로 업데이트할 수 있게 하여, 개인화 정렬 능력을 15.49%까지 크게 향상시켰다. 이 기술은 AI가 복잡한 프롬프트에서 벗어나 더 “높은 감성 지능”을 가진 인간-컴퓨터 상호작용을 실현하는 것을 목표로 한다. (출처: 量子位

)
Huawei, 718B 파라미터 Pangu 대규모 모델 발표: Huawei는 Pangu Ultra 718B 파라미터 MoE 모델 가중치를 발표했다. 이 모델은 Huawei Ascend NPU를 사용하여 완전히 자체 개발된 중국 모델이다. 라이선스 계약은 비교적 관대하지만, “Powered by openPangu” 및 상표 정보를 명시해야 한다. (출처: Reddit r/LocalLLaMA

)
🧰 도구
Google LangExtract: 문서 구조화 정보 추출 도구: Google이 LangExtract를 발표했다. 사용자 지시에 따라 비정형 문서에서 구조화된 정보를 추출할 수 있는 도구이다. 원본 추적, 구조화된 출력을 지원하며 긴 문서에 최적화되어 있다. 클라우드 및 로컬 LLM 배포를 동시에 지원하여 문서 처리 효율을 향상시켰다. (출처: omarsar0
)
AI 보조 프로그래밍 및 Agent 도구 모음: ScreenCoder는 UI 디자인을 프론트엔드 코드로 변환하는 Agent 시스템이다. Zai.org의 Kilo Code는 GLM-4.5 모델을 지원한다. Claude Opus의 “ultrathink” 기능은 모델의 사고 능력을 향상시켰다. 사용자는 Claude Opus를 활용하여 자율 드론 시뮬레이터와 iOS 앱을 성공적으로 개발했으며, 심지어 프로그래밍 경험이 없는 사용자도 복잡한 애플리케이션 개발을 달성했다. Jules Agent는 지속적으로 업그레이드되고 있으며, Tasker AI는 AI 비서로서 Agent를 제어하여 일상 업무를 완료할 수 있다. 이 모든 것은 AI가 프로그래밍 및 자동화된 작업 처리에서 강력한 역량 강화 역할을 한다는 것을 보여준다. (출처: TheTuringPost
, julesagent, _akhaliq, Reddit r/ClaudeAI

AI Agent 기반 규정 준수 자동화 도구 Comp AI: Comp AI는 AI Agent를 활용하여 규정 준수 프로세스를 자동화한다. 증거 수집, 위험 평가, 정책 초안 작성 및 업데이트 등이며, SOC 2 규정 준수 시간을 60시간에서 2-4시간으로 단축할 수 있다. 이 도구는 기업의 규정 준수 애로사항을 해결하고 효율성을 높이는 것을 목표로 한다. (출처: claud_fuen
)
Hugging Face, 원격 모델 제공업체로 Jan에 통합: Hugging Face는 이제 원격 모델 제공업체로 Jan에 통합될 수 있다. 사용자는 Hugging Face API 키를 통해 Jan에서 Hugging Face의 모든 모델을 선택하고 사용할 수 있다. 이는 개발자와 연구자들이 다양한 모델에 접근하고 활용하는 데 큰 편의를 제공한다. (출처: ClementDelangue)
DocStrange: 오픈소스 문서 데이터 추출 라이브러리: DocStrange는 오픈소스 Python 라이브러리로, 문서 데이터 추출 과정을 간소화한다. PDF, 이미지, Word, Excel 등 다양한 입력 형식을 지원하며 Markdown, JSON, CSV, HTML로 출력할 수 있다. 지능형 필드 추출 및 Schema 정의를 지원하며, 무료 클라우드 처리 및 로컬 개인 정보 보호 모드를 제공한다. (출처: Reddit r/MachineLearning, Reddit r/MachineLearning)
Vinsoo: 00년대생 창업자가 AI 프로그래밍 패러다임 재정의: Yunsi Intelligence (AIYouthLab)가 Vinsoo AI IDE를 출시했다. 클라우드 기반 Agent 프로그래밍 팀을 탑재한 세계 최초의 통합 개발 환경이다. 여러 지능형 Agent가 작업을 병렬로 실행하는 것을 혁신적으로 지원하여 요구 분석부터 최종 납품까지 전체 프로세스의 자동화된 개발을 실현한다. Vibe와 Full Cycle 두 가지 작업 모드를 제공하며 클라우드 샌드박스 환경의 보안 격리를 강조한다. (출처: 量子位

)
Podcastfy.ai: 오픈소스 멀티모달 팟캐스트 생성 도구: Podcastfy.ai는 오픈소스 Python 라이브러리로, 다중 모달 콘텐츠(텍스트, 이미지, 비디오, PDF 등)를 매력적인 다국어 오디오 대화로 변환할 수 있다. 단편 또는 장편 팟캐스트 생성을 지원하며, 대화 스타일과 언어를 사용자 정의할 수 있고, 다양한 LLM과 텍스트-음성 변환 모델을 통합했다. NotebookLM 팟캐스트 기능의 오픈소스 대안을 제공하는 것을 목표로 한다. (출처: GitHub Trending
)
📚 학습
GEPA: 반사적 프롬프트 최적화, 강화 학습 능가: GEPA는 새로운 유형의 반사적 프롬프트 최적화 알고리즘으로, LLM 최적화에서 뛰어난 성능을 보인다. 일부 작업에서는 전통적인 강화 학습 알고리즘 GRPO를 능가하며, 필요한 rollout 횟수를 35배 줄였다. 파레토 최적 후보 선택, 반사적 프롬프트 변이, 시스템 인식 병합 등 혁신적인 메커니즘을 통해 향상시켰다.