AI日報 - 2025-12-26(夕刊)

キーワード：大規模言語モデル, AIユニコーン企業, OpenAI, NVIDIA, Meta, AI推論, AIコンピューティングパワー, AI音楽, GLM-4.7モデル, GPT-5.2-Codex-XMas, Groq LPUアーキテクチャ, Self-play SWE-RL, Nemotron 3シリーズ

🔥 フォーカス

Zhipu AIとMiniMaxが「世界初の大規模言語モデル（LLM）上場企業」の座を争う : 北京のZhipu AI（智譜華章）とMiniMax（稀宇科技）が相次いで香港証券取引所のリスティングを通過し、目論見書を公開した。これは中国のAIユニコーン企業が資本化プロセスを先導して開始したことを象徴している。Zhipu AIの2024年の収入は3.12億元に達し、複合成長率は130%を超えたが、計算リソースコストの急増により、2025年上半期の損失は23.58億元に達した。同時に、Zhipu AIはGLM-4.7モデルをリリースおよびオープンソース化し、プログラミングアリーナCode Arenaでオープンソース部門1位を獲得、GPT-5.2を超えるなど、極めて強力な技術反復能力を示した。今回のIPOは単なる資金調達ではなく、純粋なLLM企業の価値を市場が定義するための「ベンチマーク」となる出来事である（出典：36氪、市值水晶）

OpenAIがクリスマス限定版Codexをリリース、「Agentic Programming」を深化 : OpenAIはクリスマス期間中にGPT-5.2-Codex-XMasをリリースした。このモデルはGPT-5.2の性能を維持しつつパーソナライズされたアップグレードが行われ、サブスクリプションユーザーには2倍の使用制限枠が提供された。今回の更新は単なる季節限定のマーケティングではなく、OpenAIがCodexを「エンジニアリングエージェント」として位置づける戦略的転換を反映している。具体的には、長いコンテキストの理解、複数ファイルにわたるタスク処理、およびWindowsネイティブツールチェーンの最適化が強化された。開発者からは、複雑なプロジェクトの実装における完成度が多くの競合モデルを上回っているとの声があり、2026年には「AIがコードを書く」時代から「AIがエンジニアリングを管理する」時代へと進化することを予感させている（出典：新智元、op7418）

Axiom Math：AI推論の「検収」新基準を定義 : 24歳のスタンフォード大学中退者Carina Hongが設立したAxiom Mathが6,400万ドルの資金調達を実施し、評価額は3億ドルに達した。同社は、論理的な正しさを自律的に検証できる「AI数学者」の開発に注力している。核心的な突破口はLeanプログラミング言語の導入にあり、AIの推論の各ステップに形式的な証明を持たせることで、LLMの結果を「検収」することが困難だった信頼性の問題を解決した。Putnam数学競技会において、同社のシステムは9つの難問を自律的に解決し、すべて検証を通過した。この進展は、AIが曖昧な「回答生成」から厳密な「論理の自己証明」へと移行していることを意味し、科学研究や産業分野における信頼できるパートナーとなるだろう（出典：AI 深度研究员）

NVIDIAがGroqと技術ライセンス契約を締結、演算能力とメモリのボトルネックに対応 : HBMメモリの価格高騰と供給不足に直面する中、NVIDIAはGroqと非独占的な技術ライセンス契約を締結した。Groqの創設者およびコアチームはNVIDIAに加わり、同社の推論技術の統合を支援する。GroqのLPUアーキテクチャはSRAMをメインメモリとして採用しており、帯域幅は従来のHBMの数倍に達するため、推論プロセスにおけるメモリアクセスのボトルネックを大幅に緩和する。この動きは、NVIDIAが「メモリ不足」を背景に切り開いた第二の戦線と見なされており、新しいメモリ技術のパスを模索することで、DRAMサプライチェーンのリスクをヘッジし、AI推論市場における支配的地位を固めることを目的としている（出典：机器之心、op7418）

🎯 トレンド

MetaがSelf-play SWE-RLをリリース、Agentの自己進化を実現 : Metaの研究チームはSSRフレームワークを発表した。これにより、ソフトウェアエンジニアリングAgentは人間のアノテーションを必要とせず、「Bug注入」と「Bug修正」の自己対戦メカニズムを通じて自己学習を行うことが可能になる。この手法はソースコードのサンドボックスへのアクセスのみを必要とし、Agentは自己駆動型の進化ループの中で高品質な課題を継続的に生成し、自律的に解決する。実験の結果、SSRは学習プロセスを通じて性能が向上し続け、ベースラインの強化学習手法を上回ることが証明された。これはAI Agentが「スーパーインテリジェンス」へと歩みを進めていることを示しており、システムの理解と自律的なソフトウェア作成において人間の能力を超えることが期待されている（出典：学术头条）

Liquid AIが最強の3Bモデルをリリース、強化学習の効果が顕著 : Liquid AIは実験的モデルLFM2-2.6B-Expをリリースした。純粋な強化学習を通じて構築されたこのモデルは、指示への追従、知識、および数学のベンチマークテストで卓越したパフォーマンスを示した。そのIFBenchスコアは、サイズが263倍大きいDeepSeek R1をも上回った。コミュニティのフィードバックによると、このモデルは「博士レベルの知識」を備えており、iPhoneなどのエッジデバイス上でもスムーズに動作する。この進展は、効率的なアルゴリズム設計とRLの最適化により、小規模なパラメータモデルでも特定の領域でトップクラスのモデルに匹敵する性能を発揮できることを改めて証明した（出典：maximelabonne、huggingface）

ChatGPT Android版のコードから広告導入計画が漏洩 : 開発者がChatGPT Androidテスト版のコード内で「ads feature」や「search ad」といった広告関連の文字列を発見した。サム・アルトマンはかつて広告を「最後の手段」と述べていたが、2025年上半期の支出が25億ドルに達した財務的圧力の下、OpenAIは明らかに無料ユーザー向けの収益化の準備を開始している。計画されている広告形式には、サイドバーのスポンサー情報や「対話型レコメンデーション」が含まれる可能性があり、自然な会話を妨げることなく意図に基づいた収益化を実現することを目指している。これは、AI検索が「絶対的な純粋さ」の時代に別れを告げることを予兆している（出典：直面AI）

NVIDIAがNemotron 3シリーズをリリース、長文コンテキストとAgent能力を重視 : NVIDIAはNemotron 3ファミリー（Nano, Super, Ultra）を発表した。ハイブリッドなMamba-TransformerアーキテクチャとMixture-of-Experts（MoE）技術を採用している。このシリーズは最大1Mのコンテキスト長をサポートし、Agentの推論や多段階のツール呼び出しに特化した事後学習の最適化が行われている。Nanoバージョンは同クラスの小規模モデルの中でトップレベルの精度を誇り、推論コストも極めて低い。一方、UltraバージョンはSOTAレベルの推論性能を追求している。NVIDIAはモデルの重み、学習ソフトウェア、およびレシピをオープンソース化することを約束し、オープンソースエコシステムをさらに豊かにする（出典：Reddit）

SAM 3：ピクセルクリックから「概念の命名」へ進化 : MetaはSAM 3（Segment Anything with Concepts）をリリースした。ビデオセグメンテーション技術を「ポイント選択」モードから「概念認識」へとアップグレードさせた。ユーザーが「眼鏡をかけた人」と入力するだけで、モデルは画像やビデオ内の条件に一致するすべてのオブジェクトを自動的に特定できる。400万個のユニークな概念を用いた自動学習により、SAM 3は複雑なビデオベンチマークMOSEv2での精度を47.9%から60.3%へと向上させた。この突破口は、視覚世界に対するAIのセマンティックな理解能力を大幅に強化し、ビデオセグメンテーションにおける遮蔽や一貫性の課題を解決した（出典：ylecun）

🧰 ツール

GAITとGaitHub：AI推論のための「Git」型バージョン管理システム : AIの意思決定が追跡不能で再現性がないという課題に対し、開発者はGAITをリリースした。このシステムはAIのインタラクションを、ユーザーの意図、モデルの応答、推論の分岐、およびメモリ状態を含むコンテンツアドレス指定可能なオブジェクトとして扱う。GAITを使用することで、開発者はコードを管理するようにAIの推論プロセスをバージョン管理し、分岐実験や意思決定の統合を行うことができる。付随するGaitHubクラウドプラットフォームはコラボレーションと監査をサポートし、企業レベルのAIワークフローに必要なエンジニアリングインフラを提供することで、「AIがなぜそう判断したのか」というブラックボックス問題を解決する（出典：Reddit）

DeepFabric：特定のMCPサービス向けツール呼び出しファインチューニングフレームワーク : DeepFabricは、開発者が任意のMCPサーバーまたはツールセットに対して、特定のドメインの推論データセットを自動生成できるようにするオープンソースツールである。隔離されたWebAssembly環境で実際のツール軌跡を実行することにより、このフレームワークはQwen3-4Bなどの小規模モデルを微調整し、特定のタスク（Blenderの制御など）においてClaude 4.5やGemini 2.5を上回るパフォーマンスを発揮させることができる。これは、高性能かつ低コストな垂直ドメインの専門家Agentを構築するための明確な道筋を提供している（出典：Reddit）

Quint：CLIに別れを告げ、チャットボットにインタラクティブUIを導入 : Quintは、LLM駆動のインタラクションを純粋なテキストから構造化された確定的なUIへと移行させることを目的としたReactライブラリである。開発者が明示的な選択肢を定義し、ユーザーがクリックすることで特定の情報の表示や構造化された入力をトリガーできるようにする。核心となる理念は、モデルの受信、ユーザーの視覚、および出力のレンダリングを分離することであり、MCQsやロールプレイングの分岐といったシナリオでのインタラクションをより制御可能にする。Quintは特定のAIプロバイダーに依存しておらず、将来的にLLMが動的なUIコンポーネントを直接レンダリングし、ユーザーエクスペリエンスを向上させることを予見させている（出典：Reddit）

📚 学習

Hugging Faceが一連の無料AIコースを公開 : Hugging Faceは休暇期間中に、最新のAI技術を網羅した無料コースのマトリックスをリリースした。内容には、LeRobotを使用したロボット構築のRoboticsコース、モデルコンテキストプロトコルを学ぶMCPコース、Agentの構築とデプロイに特化したAgentsコース、さらにLLM、深層強化学習、拡散モデルなどの高度な技術チュートリアルが含まれている。これらのコースはHFのエコシステムライブラリを活用しており、開発者が休暇中に基礎モデルから最先端のAgentアーキテクチャまでの実践的なスキルを迅速に習得できるよう支援することを目的としている（出典：huggingface）

WildVideo：ビデオQ&Aにおけるハルシネーションを系統的に分類する初のベンチマーク : 国防科学技術大学と中山大学のチームがWildVideoベンチマークを発表した。マルチモーダルモデルのビデオインタラクションにおける「ハルシネーション」問題に対し、知覚、認知、およびコンテキスト理解など9つのタスクカテゴリを定義した。実験によると、GPT-4oであっても複数ターンのタスクにおける精度はわずか52.7%であり、一人称視点のビデオでは特にパフォーマンスが低下した。このベンチマークは、動的知覚、深い推論、および長い対話の一貫性におけるモデルの欠陥を診断するための精密なツールを提供し、ビデオ理解の評価を実際のインタラクションへと前進させる（出典：新智元）

PhononBench：AIが生成した結晶の安定性を評価する新基準 : PhononBenchは、AIが生成した結晶の動力学的安定性に焦点を当てた初の本格的なベンチマークである。MatterSimポテンシャル関数を通じて、6つの主要な生成モデルから出力された10万以上の構造に対して効率的な計算を行った。結果として、現在のモデルの普遍的な限界が明らかになり、平均安定性はわずか25.83%であった。この研究は、生成モデルの物理的な実現可能性における弱点を指摘するだけでなく、フォノン安定性を持つ2.8万個の結晶構造を選別し、将来の新材料探索のための信頼できる候補プールを提供した（出典：HuggingFace）

💼 ビジネス

AI大手の1200億ドルに及ぶ「幽霊債務」が懸念を呼ぶ : Meta、xAI、およびOracleなどのテクノロジー大手は、特別目的事業体（SPV）を通じて1,200億ドルを超えるデータセンター支出を貸借対照表から除外している。このオフバランス・ファイナンス・モデルは企業の信用格付けを保護する一方で、巨大な金融リスクを隠蔽している。AI需要が予想を下回った場合、巨額の債務がウォール街で連鎖反応を引き起こす可能性がある。UBSのデータによると、今年約1,250億ドルの資金がこのような「プロジェクト・ファイナンス」に流入しており、AI軍拡競争が高リスクな資本ゲームの段階に入ったことを反映している（出典：财联社）

550倍に急騰したインドの「AI怪しい銘柄」、半導体事業の実体がないことが判明 : インドのRRP Semiconductor Ltd.の株価が過去20ヶ月で55,000%急騰し、時価総額は17億ドルに達し、NVIDIAの伸び率さえも上回った。しかし調査の結果、同社には正社員が2名しかおらず、半導体製造活動を一切行っておらず、売上もマイナスであることが判明した。この荒唐無稽な現象は、インドの個人投資家によるAIコンセプトへの盲目的な追随と規制の不備を浮き彫りにしており、2025年のAIバブルにおける最も典型的な投機的警告となっている（出典：新智元）

AI演算需要により256GBメモリの価格がRTX 5090を上回る : OpenAIなどの巨頭が世界のDRAM供給の40%を確保したことで、メモリ市場に構造的な不足が生じている。単一の256GB DDR5メモリの市場価格は3,500〜5,000ドルに急騰し、トップクラスのグラフィックカードを遥かに上回っている。この現象は、AIサーバーによるHBMおよび高性能メモリへの極めて高い入札が、コンシューマー向けの生産能力を「横取り」していることを反映している。PCパーツだけでなく、AI PCコンセプトによる大容量メモリへの必須需要がさらにハードルを押し上げており、一般消費者はAIプレミアムによるハードウェアコストの激増に直面している（出典：机器之心）

🌟 コミュニティ

2025年度AIトレンドワードまとめ：「Vibe Coding」から「Slop」まで : 『MITテクノロジーレビュー』が年間のAI用語を選出した。「Vibe Coding（雰囲気プログラミング）」が首位となり、人間は目標を伝えるだけでAIが実装を担当するスタイルが強調された。同時に、「推論モデル」や「世界モデル」は技術的な深化を反映し、「Slop（AIゴミコンテンツ）」や「バブル」はコンテンツの氾濫と資本の過熱に対するコミュニティの反省を映し出している。また、「GEO（生成エンジン最適化）」がSEOに代わり、AI時代にブランドがトラフィックを獲得するための新しい戦場となっている（出典：腾讯科技、硅星GenAI）

Yann LeCunがリポスト：人間とLLMの判断力における「7つの亀裂」 : 論文は人間とLLMの7つの認識段階における判断の差異を比較し、LLMが知覚のアンカリング、動機付けの誘導、因果推論、およびメタ認知において根本的な欠陥があることを指摘した。LLMが生成する言語は流暢で説得力があるが、その本質は「心」ではなく確率予測である。コミュニティの議論では、この「人工知能的な賢さ」は検証が欠如している場合に極めて誤解を招きやすく、人間は「信用バイアス」によってAIの出力を過度に信じてしまう傾向があり、これがAI時代における構造的な課題を構成しているとされている（出典：ylecun）

Redditで話題：ChatGPTを認知リハビリテーションツールとして活用 : PTSDの既往歴を持つユーザーが、ChatGPTを利用して構造化された認知的サポートを受けた経験を共有した。長期にわたる対話を通じて、ユーザーは感情調節、論理的整理、および自己主張において、臨床医も認める顕著な進歩を遂げた。コミュニティでは大きな反響があり、AIがいかに「一貫性の鏡」として心理的リハビリを補助できるかという点に議論が集中した一方で、過度な依存やAIが生み出す可能性のある誤解を招く「エコー」効果への警戒も示された（出典：Reddit）

💡 その他

アルツハイマー病の動物実験で完全な回復を実現 : ケース・ウェスタン・リザーブ大学の研究チームが『Cell Reports Medicine』に画期的な成果を発表した。化合物P7C3-A20を用いて脳内のNAD+バランスを修復することで、末期アルツハイマー病のマウスにおいて神経機能の完全な回復を実現した。単なるNAD+の補充とは異なり、この療法は精密な調節に重点を置いており、病理的な損傷を修復するだけでなく、記憶能力も回復させた。人間への応用にはまだ時間を要するが、アルツハイマー病の「完全な治癒」に向けた希望の扉を開いた（出典：dotey）

Stardust Intelligenceのワイヤ駆動ロボットがブラインドボックス販売に従事 : クリスマスの当日、Stardust Intelligence（星塵智能）が開発したワイヤ駆動の人型ロボットS1が、北京、上海、広州などの主要商業施設で正式に「勤務」を開始した。音声での接客、ブラインドボックスの掴み取り、および商品の受け渡しを担当した。ワイヤ駆動技術により、ロボットは人間の筋肉のような柔軟性と精密な力制御を備え、人間とのインタラクションにおいてより安全で「追従性」の高い動作が可能となった。同社が提唱する「分身知能」のコンセプトは、ロボットが遠隔操作を通じて毒性のある実験室や遠隔サービスなどの実際の現場に先行して導入されることを目指している（出典：智能涌现）

AI音楽のヒット曲『七天愛人』が著作権とアテンション争奪戦を巻き起こす : プログラマーがDeepSeekとAI音楽ツールを利用して生成した楽曲『七天愛人』が、網易雲音楽（NetEase Cloud Music）で再生回数200万回を突破し、著作権が数万元で売却された。この出来事は、AI音楽がすでに実際の収益化能力を備えており、従来の著作権体系に衝撃を与えていることを証明した。ByteDanceの汽水音楽（Soda Music）はTikTokエコシステムを通じてヒットの道筋を定義しているが、テンセントや網易は審査と収益分配において厳格な姿勢を保っている。AIがもたらす「無限の供給」は、プラットフォームを著作権競争からアテンション分配効率の戦いへと強制的に移行させている（出典：市象）

🔥 フォーカス

🎯 トレンド

🧰 ツール

📚 学習

💼 ビジネス

🌟 コミュニティ

💡 その他

関連タグ

Related Posts

AI日報 – 2026-07-21

AI日報 – 2026-07-20

AI日報 – 2026-07-19