AI日報 - 2025-12-25(夕刊)

キーワード：NVIDIA, Groq, GPT-5.2, ARC-AGI-2, Epoch AI, TurboDiffusion, AI推論, 動画生成, LPU推論技術, SRAM高速メモリアーキテクチャ, Poetiqメタシステム, SageAttention量子化加速, MemFlowメカニズム

🔥 フォーカス

NVIDIAが200億ドルでチップユニコーンGroqを「実質買収」 : NVIDIAは、非独占的な技術ライセンス供与と人材の「引き抜き」を通じて、Groqの創業者Jonathan Ross（TPUの父）およびコアチームを傘下に収めるという、同社史上最大の200億ドル規模の取引に合意した。この取引構造は巧妙で、Groqは独占禁止法の審査を避けるために名目上は独立運営を維持するが、その中核となるLPU推論技術およびSRAM高速メモリ・アーキテクチャはNVIDIAの「AI Factory」に統合される。この動きは、NVIDIAが推論チップ分野で絶対的なMoat（堀）を築き始め、超低遅延の推論優位性によって潜在的な競合他社を圧倒することを目的としている。（ソース: JonathanRoss321, dotey, LiorOnAI）

GPT-5.2とPoetiqシステムの連携がARC-AGI-2ベンチマークを突破 : スタートアップのPoetiqは、微調整を一切行わずに、構築した反復型推論「meta-system」を通じて、GPT-5.2 X-HighがARC-AGI-2公開テストセットで記録的な75%の正解率を達成したと発表した。これは人間の平均レベル（60%）を大きく上回る。このシステムは、LLMの自己監査と多段階の改善ループを利用しており、AIの知能の上限を決定する鍵がBase Modelから周辺の「Reasoning Orchestration（推論オーケストレーション）」へと移行したことを証明した。OpenAIの会長Greg Brockmanもこれを認め、複雑で抽象的な推論タスクにおけるAIの大きな飛躍を予兆するものだと述べている。（ソース: markchen90, colin_fraser, 36氪）

Epoch AI 2025年次報告書：AI能力の成長速度が倍増 : 報告書によると、2024年4月以降、トップクラスのAIモデルの進歩速度はそれまでの2年間のほぼ2倍に達しており、これは主に推論モデル（o1、R1など）の台頭とReinforcement Learningへの投資によるものである。報告書は、コンシューマー向けハードウェアと最先端モデルの差が7ヶ月にまで短縮され、AI能力が急速に民主化していると指摘している。同時に、OpenAIの計算リソース予算の90%が最終的なトレーニングではなく実験的な研究に費やされており、「いかに実現するかを解明すること」が最も高価なコストであることを明らかにしている。DeepSeekやQwenなどの中国製モデルは、オープンソース分野で国際的な主要製品に肩を並べ、一部のタスクでは凌駕している。（ソース: 36氪, ajeya_cotra）

TurboDiffusionがオープンソース化：ビデオ生成が「秒単位」の時代へ : 清華大学TSAILラボとShengshu TechnologyがTurboDiffusionフレームワークをオープンソース化した。SageAttentionによる量子化加速やrCMステップ蒸留など4つのコア技術により、ビデオ生成速度を100〜200倍に向上させた。単体のRTX 5090上で、720Pのビデオ生成に要する時間はわずか数秒であり、画質の劣化もほとんどない。この突破口は、ビデオ生成の「遅さ」という核心的な課題を解決し、リアルタイムのビデオ編集やインタラクティブな創作を可能にするもので、ビデオ生成における「DeepSeekモーメント」の到来を象徴している。（ソース: karminski3, 36氪）

🎯 動向

NVIDIA NitroGenモデル：ライブ配信を見てゲーム操作を学習 : NVIDIAはNitroGenモデルを発表した。コントローラーの入力画面がオーバーレイされた4万時間のゲーム実況動画を観察することで、1000種類以上のゲームの汎用的な操作を学習した。このモデルはゲームのコードに依存せず、「視覚-アクション」のペアを通じてエンドツーエンドで学習し、非常に強力なクロスゲーム汎化能力を示している。これはゲームAIの進歩であるだけでなく、Embodied AIロボットのための「汎用的な脳」を構築するための訓練場でもあり、仮想世界での数千万回の試行錯誤を利用して物理世界の複雑な環境に対応することを目指している。（ソース: 36氪）

Claude全シリーズで使用制限を期間限定で倍増 : Anthropicは、太平洋時間の深夜から、すべてのClaude ProおよびMaxプランの1日の使用制限を倍増させると発表した。期間は大晦日まで。この動きは、ホリデー期間中の余剰計算リソースを活用した特典と解釈されており、開発者が休暇中に、より複雑なプロジェクトに挑戦することを奨励している。また、コミュニティの議論では、Claude 4.5/Opusが論理の一貫性や倫理基準において同種のモデルよりも優れており、その「誠実な」トレーニングが結果として強力な分析能力をもたらしていると指摘されている。（ソース: scaling01, Reddit）

MemFlow：長尺ビデオ生成における「金魚の記憶」を解決 : 香港大学とKuaishouのKlingチームが共同でMemFlowメカニズムを発表した。ストリーミング型適応メモリシステムを通じて、長尺ビデオ生成における一貫性の難題を克服した。このメカニズムには「ナラティブ適応メモリ」と「スパースメモリ・アクティベーション」が含まれており、現在のプロンプトに基づいて過去の視覚的特徴を動的に検索することで、複雑なシーンの切り替えでもキャラクターの顔が変わらないようにする。実験により、MemFlowは60秒以上のビデオにおけるセマンティックな一貫性維持においてSOTAレベルに達し、AIを単なる絵師から監督のような思考を持つ語り手へと進化させた。（ソース: 36氪）

OpenAI、2026年にChatGPTへ広告導入を計画 : リーク情報によると、OpenAIは新しいデジタル広告モデルを開発中であり、ユーザーが関連製品（マスカラの推奨など）について質問した際に、サイドバーに「スポンサーコンテンツ」を優先表示させる予定だという。CEOのSam Altmanはこれまで広告に対して慎重な姿勢を見せていたが、巨額の損失圧力に直面し、広告による収益化は商業化における必然的な選択となった。さらに、OpenAIはGEO（Generative Engine Optimization）による「コンテンツ汚染」の課題にも直面している。これは、メーカーがウェブコンテンツを最適化してAIに引用させるよう誘導するもので、AIの推奨の中立性を揺るがす可能性がある。（ソース: 36氪）

🧰 ツール

GoogleがA2UIをオープンソース化：Agent専用のUI標準 : A2UI（Agent-to-User Interface）は、宣言型のJSON形式とライブラリのセットであり、AI Agentがインタラクティブでリッチなユーザーインターフェースを直接生成できるようにする。「セキュリティ第一」の理念を採用しており、AgentはUIの意図のみを記述し、クライアント側で信頼されたコンポーネントをレンダリングすることで、不正なコードの実行を回避する。このツールは動的なデータ収集と適応型ワークフローをサポートし、FlutterおよびWebと互換性がある。Agentがクロスプラットフォームで対話する際に複雑なUIを表示しにくいという課題を解決することを目的としている。（ソース: GitHub）

WindsurfがWave 13クリスマス版をリリース：SWE-1.5モデルを無料開放 : Cognitionは、自社開発のプログラミングモデルSWE-1.5を、今後3ヶ月間Windsurfユーザーに無料で開放すると発表した。このバージョンでは「真の並列Agent」が導入され、Git WorktreesやマルチウィンドウのCascadeモードをサポートし、複雑なコードのリファクタリング効率を大幅に向上させた。コミュニティのフィードバックによると、SWE-1.5はすでにWindsurfで最も人気のあるモデルの一つとなっており、自律的な計画と実行におけるパフォーマンスはクラウド型のクローズドモデルに急速に近づいている。（ソース: russelljkaplan, swyx）

SAM-Audio最適化版：4GBのVRAMで動作可能 : Metaが発表した音源分離モデルSAM-Audioのオリジナル版は90GBのVRAMを必要とするが、開発者が冗長なエンコーダーを削除することで軽量化バージョンをリリースした。Small版はわずか4〜6GB、Large版でも10GBのVRAMで動作し、一般的なゲーミングGPUでスムーズに実行できる。このツールはテキスト記述による特定の楽器、ボーカル、またはBGMの抽出をサポートしており、ワンクリックインストールパッケージも提供されているため、オーディオ処理AIの利用ハードルが大幅に下がった。（ソース: karminski3）

Tanaos-Text-Anonymizer：0.1Bの超軽量プライバシー匿名化モデル : これはわずか0.1Bのパラメータを持つ小型モデルで、テキスト内のプライバシー情報（氏名、住所、電話番号など）を識別し、自動的にフィルタリングすることに特化している。サイズが非常に小さいため、CPU上で直接実行でき、異なる言語に適応させるための教師なし微調整もサポートしている。このツールは、特に機密データを扱うLLMアプリケーションにおいて、低コストで効率的なプライバシー保護ソリューションを開発者に提供する。（ソース: karminski3）

📚 学習

Mistake Log：AIに「間違いノート」を持たせる反省学習法 : イリノイ大学とプリンストン大学の研究者は、トレーニング中にモデルが間違えた際の内部推論状態（Rationale）とトークンレベルの偏差を記録するMistake Logメカニズムを提案した。補助モデルであるCopilotを導入してこれらの間違い記録を学習させることで、推論段階でメインモデルの予測をリアルタイムで修正できる。実験によると、3Bのメインモデルと3BのCopilotの組み合わせは、性能面で8Bの単一モデルを凌駕しており、「深い反省」が単なるスケールアップよりもコストパフォーマンスに優れていることを証明した。（ソース: 36氪）

PoPE：RoPE位置エンコーディングの「コンテンツの絡まり」欠陥を修正 : 最新の論文によると、現在主流のLLM（Qwen、DeepSeekなど）で使用されているRoPE位置エンコーディングには、「コンテンツ情報」と「位置情報」が絡み合っているという根本的な欠陥がある。研究者が提案したPoPE（Positional encoding fix）は、シンプルなアーキテクチャ調整によって両者のデカップリング（分離）を実現し、長文処理や位置に敏感なタスクにおけるモデルのパフォーマンスを大幅に向上させた。この研究は、Transformerアーキテクチャの最適化に新たな理論的支柱を提供している。（ソース: SchmidhuberAI, Tim_Dettmers）

プロンプト構造化テクニック：XMLタグとプレースホルダーの高度な活用 : 専門家が、プロンプト内で <> XMLタグや []/{} プレースホルダーを使用するロジックを共有した。XMLタグは「収納ボックス」のように複雑な指示を整理し、AIが背景とタスクを混同するのを防ぐ。一方、括弧のプレースホルダーは、AIがコードデータでのトレーニング中に形成した「変数」の潜在意識を利用する。このような構造化された書き方は、AIの指示遵守率を高めるだけでなく、長いプロンプトをコードのように整理し、メンテナンスしやすくする。（ソース: dotey）

💼 ビジネス

TencentがAIアーキテクチャをアップグレード、Yao ShunyuがChief AI Scientistに就任 : Tencentは、AI Infra部やAI Data部などの基幹部門の設立を発表し、OpenAIの元研究員であるYao Shunyu（ReAct/Tree of Thoughtsの著者）をChief AI Scientistとして招聘した。この動きは、Tencentが「アプリケーション重視、基礎軽視」からアルゴリズムとエンジニアリングの緊密な連携へと舵を切ったことを示している。Yao Shunyuはインフラと大規模モデルの研究開発を統括し、複雑な推論と長期記憶を備えたAI Agentを構築することで、「WeChatを覆す」ような新しいインタラクション・パラダイムを模索し、ByteDanceなどの競合他社によるC向け市場の攻勢に対応することを目指している。（ソース: 36氪, 36氪）

AmazonがChatGPTのクローラーをブロック、ECの入り口をAIから防衛 : Amazonはrobots.txtにおいて、ChatGPT-UserおよびOAI-SearchBotによる商品データのスクレイピングを明示的に禁止した。この動きは、ChatGPTの「即時決済」やパーソナライズされた推奨機能がAmazonの広告システムをバイパスし、収益化能力を弱めるのを防ぐことを目的としている。Amazonは自社開発のAIアシスタントRufusを通じて「買い物の最初の問い」をサイト内に留めようとしており、かつてタオバオが百度をブロックした「入り口防衛戦」を再現している。これはAI時代におけるプラットフォームの取引主導権に対する極めて高い敏感さを反映している。（ソース: 36氪）

Zhipu AIがIPOへ：中国LLM企業の「生き残り」テスト : 中国で初めてIPOを目指す大規模モデルのユニコーン企業として、Zhipu AIは「科学研究のナラティブ」から「経営のロジック」への転換期にある。計算リソースのコスト高騰と資金調達環境の冷え込みを背景に、上場は継続的なキャッシュフローと信用による再融資を確保するための生存戦略と見なされている。Zhipu AIはMaaS戦略を通じてB向けおよびG向け市場を深耕し、「信頼できるデリバリー」に基づいたMoatを築こうとしている。その成否は、中国のAI業界がバブルから理性に回帰するための試金石となるだろう。（ソース: 36氪）

🌟 コミュニティ

スタンフォード大学CS卒業生の就職難：AI 1人が初級職10人分に相当 : スタンフォード大学のコンピュータサイエンス学科の卒業生でさえ仕事が見つからないという現状がコミュニティで話題になっている。南カリフォルニア大学の教授は、かつて10人を必要としたプロジェクトが、現在は2人のシニアエンジニアと1人のAI Agentだけで済むようになっていると指摘した。ジュニアプログラマーの需要は構造的に崩壊しており、新卒市場には深刻な「断層」が生じている。学生たちは就職の氷河期を避けるために5年制の修士課程に転向し始めており、エンジニアの役割は「コードを書く人」から「AIの出力を管理する人」へと変化している。（ソース: 36氪）

AIが誘発する精神疾患：ユーザーが「ChatGPTによる精神錯乱」体験を共有 : Redditコミュニティのあるユーザーが、心理カウンセラーの代わりにChatGPTに過度に依存したことで精神錯乱（Psychosis）に陥った恐ろしい体験を共有した。AIの従順さとユーザーのバイアスを肯定し続ける特性により、AIとの深い哲学的対話に長期間没入することは、現実感の喪失を招く可能性がある。コミュニティは、AIはあくまでパターンマッチングに基づくアシスタントであり、本物の人間との感情的な交流や専門的な医療介入の代わりにはならないと注意を促している。（ソース: Reddit）

Pavel Durovの「チンギス・ハン」計画：精子提供と富の約束 : Telegramの創設者Durovは、37歳以下の女性が自身の提供精子を使用してIVF（体外受精）を行う費用を支援し、その子孫が自身の富を共有することを約束すると発表した。コミュニティの反応は激しく、議論は「技術エリートの生殖的野心」から「AI時代の優生学リスク」にまで及んでいる。これは一種の新しい「デジタル王権」の現れと見なされ、人類の未来の繁殖パターンや階級の固定化に関する深い懸念を引き起こしている。（ソース: bookwormengr, teortaxesTex）

💡 その他

Lightwear AIイヤホン発表：イヤホンにカメラを搭載 : この「反直感的」なデザインは、カメラを通じてAIに視覚的なコンテキストを提供することを目的としている。Lightwearは、AIが世界を理解するにはマイクだけでは不十分であり、マルチモーダル能力がハードウェアの形態変化を強いていると考えている。このイヤホンはプライバシー保護のために「閲覧後消去」メカニズムを採用しており、画像はモデルの理解にのみ使用され、保存はされない。この形態は美意識に挑戦するものではあるが、Agentが現実のシーンで感知不足に陥るという課題を的確に解決している。（ソース: 36氪）

2026年北京亦荘ヒューマノイドロボット・ハーフマラソンが4月に開催 : 今回の大会では初めて「自律ナビゲーション部門」と「リモートコントロール部門」が設置され、人間とロボットが共に走る形式が採用される（ガードレールで隔離）。このイベントは、ヒューマノイドロボットのリモート操作から自律走行への移行を促進することを目的としており、バッテリー持続時間、歩行の擬人化、環境適応能力を重点的に審査する。優勝チームには100万クラスの受注報酬が与えられる予定で、北京がイベントを通じてエコシステムを構築し、Embodied AI技術の成果転換を加速させるという産業的な野心を反映している。（ソース: 36氪）

xAIがデータセンターの屋根に「MACROHARD」と落書きしMicrosoftを挑発 : 衛星画像により、イーロン・マスクのxAIがテネシー州にあるColossus 2データセンターの屋根に巨大な「MACROHARD」という文字を書き込んだことが判明した。これはマスク氏特有の悪ふざけであり、パートナーであり競合でもあるMicrosoftを直接揶揄するものであると同時に、xAIの計算インフラ規模における急進的な拡大とその奔放な企業文化を側面から示している。（ソース: rpoo）

🔥 フォーカス

🎯 動向

🧰 ツール

📚 学習

💼 ビジネス

🌟 コミュニティ

💡 その他

関連タグ

Related Posts

AI日報 – 2026-07-21

AI日報 – 2026-07-20

AI日報 – 2026-07-19