AI 日報 AI日報 – 2025-12-12(夕刊) Agentツール呼び出しAIモデルARC-AGI-1ブレークスルーGDPvalベンチマークテストGPT-5.2GPT-5.2 ThinkingモデルSWE-Bench Pro記録コンテキストウィンドウナレッジベース更新専門業務能力統計的学習理論視覚能力 AI 日報 AI日報 – 2025-07-11(夕刊) 256kコンテキストウィンドウGrok 4Grok 4 HeavyHLEベンチマークテストxAIイーロン・マスクの見解引用コンテキストウィンドウベンチマークテストモデルのバイアス大規模言語モデル数学的推論長文理解能力
AI 日報 AI日報 – 2025-07-11(夕刊) 256kコンテキストウィンドウGrok 4Grok 4 HeavyHLEベンチマークテストxAIイーロン・マスクの見解引用コンテキストウィンドウベンチマークテストモデルのバイアス大規模言語モデル数学的推論長文理解能力