AI 日報 AI日報 – 2025-07-11(夕刊) 256kコンテキストウィンドウGrok 4Grok 4 HeavyHLEベンチマークテストxAIイーロン・マスクの見解引用コンテキストウィンドウベンチマークテストモデルのバイアス大規模言語モデル数学的推論長文理解能力