AI日報 – 2026-01-22(夕刊)

キーワード:AIインフラ, 主権AI, エージェント, 五層ケーキモデル, エングラムアーキテクチャ, エージェント認知圧縮器

🔥 フォーカス

NVIDIAのジェンスン・フアン氏、ダボス会議で語る:AIインフラの「5層のケーキ」理論 : NVIDIAのCEOジェンスン・フアン氏は、2026年のダボス会議にてAI産業の「5層のケーキ」モデルを提唱した。それはエネルギー、チップ、クラウドサービス、モデル、そしてアプリケーションで構成される。同氏は、現在の数千億ドルの投資は始まりに過ぎず、将来的に数兆ドル規模のインフラの波が訪れると指摘。AIは国家レベルのインフラ(Sovereign AI)と見なされるべきだと強調し、放射線科医の数が増え続けている例を挙げ、AIは「タスク」を自動化するものであり「目的」を置き換えるものではなく、効率向上を通じて新たな需要を創出すると論じた。この視点は、AIによる失業不安に対し、AIは人類の対戦相手ではなく生産性の増幅器であるという新たな展望を提供している(出典:NVIDIA

英伟达黄仁勋达沃斯论道

Anthropicが「Claude憲法」を公開:AIの独立した人格と価値観を定義 : AnthropicはClaudeの新しい憲法を正式に発表し、その行動ビジョンとコアバリューを詳細に記述した。この文書は単なるトレーニングのガイドラインではなく、Claudeを従来のサイエンス・フィクションの構想とは異なる、全く新しい「世界のエンティティ(実体)」として形作ろうとする試みである。憲法では、トレーニングデータを超えたClaudeの独立性を強調し、AnthropicがAIに対して果たすべき義務まで含まれている。コミュニティの反応は大きく、これはAIがツールから「デジタル人格」を持つ実体へと転換する象徴であり、AIの制約と自律性のバランスをどう取るかについての深い議論を巻き起こしている(出典:Anthropic

Anthropic发布“克劳德宪法”

DeepSeekがEngramアーキテクチャを発表:DRAMでHBMを代替し計算能力の壁を突破 : モルガン・スタンレーのリサーチレポートは、DeepSeekの最新論文で提案されたEngram(記憶痕跡)モジュールを高く評価した。このアーキテクチャは「条件付き記憶」メカニズムを通じて静的パターンの保存と動的推論を分離し、モデルが膨大な知識を低コストなシステムメモリ(DRAM)にオフロードし、必要な時だけ検索することを可能にする。この突破口は、高価な高帯域幅メモリ(HBM)のボトルネックを効果的に緩和し、計算資源が限られた環境でもアルゴリズムの革新によって「小よく大を制す」ことが可能であることを証明した。モルガン・スタンレーは、このアーキテクチャを利用したDeepSeek V4がRTX 5090などの消費者向けGPUで動作し、AIの拡張法則を根本から書き換えると予測している(出典:摩根士丹利

DeepSeek推出Engram架构

xAIの極秘プロジェクト「Macrohard」の内幕が暴露:Teslaの車載コンピュータが100万規模のAgent基盤に : 元xAIエンジニアのSulaiman Ghori氏がポッドキャストで、コードネーム「Macrohard」と呼ばれる内部プロジェクトの詳細を漏洩した。このプロジェクトは、人間のキーボード・マウス操作を8倍速でシミュレートし、ホワイトカラー業務を自動化する「人間シミュレーター」の構築を目指している。最も衝撃的な暴露は、xAIが数百万台のアイドル状態にあるTesla車両の計算能力(HW4プラットフォーム)を利用してこれらのAgentをデプロイし、分散ネットワークを通じて従来のデータセンター建設サイクルを回避する計画を立てていることだ。Ghori氏は規約違反の暴露により解雇されたが、彼が明かした「ウォー・ルーム(作戦会議室)」文化と過激なスケジュールは、xAIの競争力に対する業界の再評価を促している(出典:The Information

xAI“巨硬”项目内幕曝光

GoogleがShopifyと提携しAIコマースに参入:検索の入り口から取引の完結へ : GoogleはUniversal Commerce Protocol (UCP)の導入を発表し、ShopifyやWalmartなどの大手と提携してGeminiを完全なショッピングの入り口へと進化させる。ユーザーは対話ボックス内で価格比較、スペック対比から即時決済までの全プロセスを完結でき、アプリを切り替える必要がない。Geminiはユーザーに代わって実店舗に電話をかけ、在庫を確認することさえ可能だ。この動きはChatGPTの「即時決済」機能への強力な対抗策と見なされ、検索広告モデルから「エージェント・コマース」へのパラダイムシフトを象徴しており、大規模モデルメーカーが世界の小売チャネルの勢力図を再構築する新勢力となりつつある(出典:Google

谷歌联手Shopify杀入AI电商

🎯 动向

AppleのAIハードウェアとSiri「Campos」のアップグレード計画が流出 : 報道によると、AppleはAirTagに似た形状のAIウェアラブルデバイス(AI Pin)を極秘に開発中であり、複数のカメラとセンサーを内蔵し、2027年の発売を予定している。同時に、コードネーム「Campos」と呼ばれる新しいSiriが今年9月に登場し、Google Gemini 3モデルを深く統合し、画面上のファイルやアプリを直接操作できる「スクリーン認識」能力を備えるという。Appleはこのソフト・ハード一体化の強みを活かし、エッジAI領域でOpenAIやMetaに対抗することを目指しており、初回のハードウェア量産目標は2,000万台に達する(出典:The Information

苹果AI硬件与Siri“Campos”升级计划流出

MicrosoftがVibeVoice-ASRをリリース:1時間の長尺音声を一度に処理 : MicrosoftはHugging Faceにて、9B規模の音声認識モデルVibeVoice-ASRをオープンソースで公開した。このモデルは、従来のASRのように音声を細切れにする手法を打破し、64Kトークンのウィンドウ内で60分間の音声を一括処理することをサポートし、グローバルなコンテキストの喪失や話者追跡の混乱を効果的に回避する。テストでは、複雑な背景(音楽の中での音声認識など)や長文(小説の朗読など)において安定したパフォーマンスを示し、平均精度は91.9%に達し、固有名詞の認識を修正するためのホットワード設定もサポートしている(出典:Microsoft

微软发布VibeVoice-ASR

MetaがDr. Zeroフレームワークを発表:データゼロでAgentの自己進化を実現 : MetaのSuperintelligent AI Labは、アノテーション(ラベル付け)データがない条件下でエージェントを効率的に進化させるDr. Zeroフレームワークを提案した。このフレームワークは「提案者-解決者」の協調メカニズムを通じて、検索エンジンを利用して能動的に複雑な問題を探索・生成する。コア技術であるHRPO(Hop-step Relative Policy Optimization)は、類似した問題をクラスタリングしてベンチマークを構築することで、高コストなネストサンプリングを回避し、複雑なQ&Aタスクにおいて完全教師あり学習のベースラインを14.1%上回る性能を達成した。これはAIトレーニングデータの枯渇問題に対する新たな解決策を提供している(出典:Meta

Meta推出Dr. Zero框架

業界は長期間タスクの評価へシフト:複数のリアルなシナリオのベンチマークが公開 : AI評価の重点は、数学やコードのスコア競いから長期間(Long-range)タスクへと移っている。新たに公開されたAPEX-Agentsは、Google WorkspaceにおけるAgentの専門的な協調能力をテストし、DSAEvalは641個のリアルなデータサイエンス問題をカバーしている。テスト結果ではGPT-5.2が効率面でリードし、Claude-Sonnet-4.5が総合的なパフォーマンスで最強であった。これらのベンチマークの登場は、Agentの発展を制限しているのはもはや推論能力ではなく、長期間にわたって論理的一貫性とメモリ制御を維持できるかどうかであるという業界の共通認識を反映している(出典:Mercor, DSAEval

Agent Cognitive Compressor (ACC):生物学にインスパイアされたメモリ制御 : 研究者たちは、マルチターンの対話におけるAgentの「コンテキストの劣化」問題を解決するためにAgent Cognitive Compressorを提案した。ACCは単に過去の対話をリプレイするのではなく、アーキテクチャによって制約された「圧縮された認知状態」を維持し、目標、エンティティ、関係などの重要な変数のみを保持する。実験の結果、ACCは50ターン以上の複雑なワークフローにおいて、従来のRAG(検索拡張生成)モードを大幅に上回る、ほぼゼロのハルシネーションとドリフト率を実現した(出典:DAIR.AI

Agent认知压缩器

🧰 工具

Prefect Horizon:MCPサーバーのホスティングとガバナンスプラットフォーム : Model Context Protocol (MCP)の普及に伴い、PrefectはHorizonプラットフォームをリリースした。これは企業導入におけるMCPサーバーの課題を解決し、マネージドホスティング、ロールベースのアクセス制御 (RBAC)、監査ログ、およびツールのディスカバリ機能を提供する。Horizonにより、企業はプライベートデータやワークフローをAI Agentに安全に公開できるようになり、MCPを単なるプロトコルから大規模なガバナンスが可能な生産性プラットフォームへと引き上げる(出典:Prefect

Prefect Horizon

CopilotKit + LangChain:Deep Agentsのフロントエンド構築ソリューション : CopilotKitは、LangChainが提案するDeep Agentsアーキテクチャのサポートを開始した。開発者はわずか数行のコードで、プランニング能力を持つAgentのためのインタラクティブなUIを構築できる。このツールはストリーミング出力、Skillsのカスタマイズ、およびサブエージェントのオーケストレーションをサポートしており、複雑なAgentアプリケーション構築時のUI/UXのボトルネックを解消し、ManusやClaude Codeのような「プランニング優先」のAgentをより迅速にエンド製品へと転換させる(出典:CopilotKit

CopilotKit

Devin Review:コードレビュー体験を再構築するAIツール : Cognitionは、AIが大量のコードを生成した後の人間によるレビューのボトルネックを解決するため、Devin Reviewをリリースした。このツールは単にバグを探すだけでなく、再設計されたインターフェースを通じて、人間が複雑なPR(プルリクエスト)のロジックを迅速に理解するのを助ける。GitHubリンクのドメインを置き換えるだけで使用でき、テストではDiff以外の関連エラーも発見できることが示された。その核心的なロジックは、AIが生成したコードは、プログラマを「コードのゴミ」に埋もれさせるのではなく、より効率的なAI補助ツールによってレビューされるべきであるという点にある(出典:Cognition

Devin Review

GLM-4.7 Flashのローカル最適化:シングルカードで200Kコンテキストを実行 : コミュニティは、vLLMのGLM-4.7-Flashに対するKVキャッシュサポートを1行のコード修正で解決し、MLA(Multi-head Latent Attention)メカニズムを有効にした。これにより、この30Bモデルの200Kコンテキストにおけるビデオメモリ(VRAM)使用量が180GBから10GBへと激減した。現在、1枚のRTX 5090 (32GB VRAM) で、このトップクラスの推論能力を持つモデルをフルスピードで動作させることが可能になり、高性能なローカルAgent時代の本格的な幕開けを象徴している(出典:Zai_org

GLM-4.7 Flash

📚 学习

Gemini CLI実践コース:マルチステップの自動化ワークフローを構築 : DeepLearning.AIはGoogleと共同で、Gemini CLIを使用してオープンソースのエージェントを構築する方法を学ぶ無料の短期間コースをリリースした。コースはローカルファイルの操作、開発ツールの統合からクラウドサービスの呼び出しまでの全プロセスをカバーし、Agentを利用したコードの自動化、データダッシュボードの作成、および複雑なタスクプランニングの方法を重点的に紹介している。単なるAPI呼び出しから、実際の生産性ツールの構築へとステップアップしたい開発者に適している(出典:DeepLearningAI

Hyperballオプティマイザ:正規化によりトレーニングを33%加速 : スタンフォード大学の研究者たちは、Hyperballオプティマイザ・ラッパーを提案した。この手法は、重みと更新のノルムを一定に保つことで、有効なステップサイズを直接制御することを可能にし、従来のウェイトディケイ(重み減衰)に代わるものとなる。実験では、HyperballがMuonなどのオプティマイザをベースに33%のトレーニング加速をもたらし、より強力なハイパーパラメータの転移能力を備えていることが証明され、大規模モデルのトレーニングに、より安定した数学的枠組みを提供している(出典:Kaiyue Wen

Hyperball优化器

NVIDIA Motive:動画生成の帰属分析手法 : NVIDIAの研究者たちは、勾配ベースの動き中心データ帰属手法であるMotiveを発表した。時間的なダイナミクスと静的な外観を分離することで、Motiveはトレーニングセット内のどの動画が生成された動きに対してプラスまたはマイナスの影響を与えたかを正確に特定できる。これは、動画生成モデルのトレーニング品質の最適化や、動きの劣化原因の理解において重要な研究価値を持つ(出典:NVIDIA Research

InT (Intervention Training):推論におけるクレジット割り当ての課題を解決 : 論文はIntervention Training手法を提案した。これは、モデルに自身の推論パス内の最初の誤りを特定させ、シングルステップの介入提案を行わせることで、強化学習の初期化を最適化するものである。最終的な回答のみに報酬を与える標準的なRLと比較して、InTは中間ステップを正確に修正できる。IMO-AnswerBenchベンチマークにおいて、この手法は4Bモデルの精度を14%向上させ、20B規模のモデルをも凌駕した(出典:HuggingFace

💼 商业

OpenAI、時価総額8,300億ドルで500億ドルの資金調達を計画 : サム・アルトマン氏が最近UAEで投資家と面会し、新たな巨額資金調達について協議したとの情報が入った。目標調達額は500億ドルに達し、時価総額は7,500億ドルから8,300億ドルの間とされている。この資金は主に、OpenAIが2030年までに消費すると予想される2,000億ドルの計算資源費用を支えるために使用される。同時に、OpenAIはイーロン・マスク氏から「非営利の初志からの逸脱」を理由とした巨額の損害賠償訴訟に直面している(出典:Bloomberg

OpenAI融资

Alibaba傘下のT-Head(平頭哥)が上場計画を始動:フルスタックAIチップの布陣を完結 : Alibabaは、傘下のチップ会社であるT-Head(平頭哥)の独立上場を支援することを決定した。設立から8年、T-Headは計算、ストレージ、ネットワークの分野で複数のトップクラスのチップをリリースしており、自社開発のPPU (GPU) の性能はNVIDIA H20に匹敵し、中国国内の新規AI計算能力の主力となっている。T-Headの上場は、資本市場における国産AIチップの価値再評価を引き起こすと同時に、Alibabaがモデル、クラウドインフラからコアチップに至るまでのフルスタックAIレイアウトを完了したことを象徴している(出典:36氪

平头哥上市

Embodied AIスタートアップのSkild AIがシリーズBで14億ドルを調達 : SoftBankがリードし、NVIDIA、ベゾス氏らが参画した資金調達により、Skild AIの評価額は140億ドルを突破した。同社は、ハードウェアの形態を問わない汎用的な汎化能力を持つ「フル・エンボディド」な脳であるSkild Brainの構築に注力している。2025年の売上高はすでに3,000万ドルに達しており、主に警備や配送などの産業用デプロイメントから得られている。今回の資金調達は、Embodied AIを家庭用消費者市場へと普及させるプロセスを加速させるだろう(出典:Skild AI

Skild AI融资

🌟 社区

プログラミング界の「12月革命」:Agentic Codingが主流として認められる : コミュニティでは、2025年12月がソフトウェアエンジニアリングの分水嶺であると熱く議論されている。リーナス・トーバルズ氏やアンドレイ・カルパシー氏などの技術リーダーたちが、Agentic Codingを公に受け入れ始めた。議論では、「ソフトウェアエンジニア」は「ソフトウェアプロンプター」へと変貌しつつあり、将来の核心的な競争力はAI Agentをオーケストレーションする能力になるとされている。PRレビューの重点は、コードそのものから、Promptと検証ロジックのレビューへと移るだろう(出典:X

ポストAI時代の5つのコアスキルセット : AIが技術的な実行層を担うようになるにつれ、コミュニティは新たな個人の競争力をまとめた:1. 主体性 (Agency) —— 語るに値するストーリーを創り出すこと;2. センス (Taste) —— 優劣を見極める鑑賞力;3. 視点 (Perspective) —— 人間ならではの独自性を加えること;4. 説得力 (Persuasion) —— 人の共感を得ること;5. 技術的ノウハウ (Know-How) —— AIツールを効率的に利用すること。核心的な見解は、知能が無限に豊かになる時、人間の「判断力」と「美意識」が最高のプレミアムになるということだ(出典:DAN KOE

AI教育の平等化:Geminiが無料のSAT模擬試験を提供 : GoogleはGemini Appにおいて、The Princeton Reviewが認定した完全なSAT模擬試験機能の提供を開始し、即時のフィードバックを提供している。コミュニティは、これが高価な試験対策を民主化する極めて大きな社会的意義を持つと考えている。スコアアップ競争を激化させるとの懸念もあるが、多くの人々は、AIが「プライベートチューター」として教育格差を縮小させるマイルストーン的な出来事だと評価している(出典:Google Education

💡 其他

不動産業界におけるAIの「新しいナラティブ」 : 市場の低迷に直面し、不動産開発業者はロボットを物件のセールスポイントとして活用し始めている。案内・解説からコミュニティの清掃、無人配送に至るまで、ロボットは「未来のテクノロジー住宅」の核となるパッケージになりつつある。これは不動産業界が「高レバレッジ」から「高テクノロジー含有量」へと転換しようとする試みを反映しており、規模化には依然として課題があるものの、若い購入者を惹きつける重要なラベルとなっている(出典:36氪

房地产机器人

種を超えた「エージェント」:牛も道具を使うことが観察される : 科学界において、牛が特定の環境下で道具の使用を学習できることが発見され、この発見はAIコミュニティで「最初のエージェント牛 (Agentic Cow)」と冗談めかして呼ばれている。議論はここから生物学的知能と人工エージェントの境界、そして自然界の原始的な知能を観察することでAIの自律的探索アルゴリズムをいかに啓発するかへと広がっている(出典:Futurism

智能牛

xAIが「人材スナイパーチーム」を結成:エンジニアがエンジニアをリクルート : イーロン・マスク氏自らが主導し、xAI内に自身に直接報告する「タレントエンジニア」チームを結成した。この職種は、従来の人事担当者ではなく、技術的な直感を持つ「ギーク」であることを求めており、Vibe codingや特定のコミュニティを通じてトップクラスの天才を発掘することを主眼としている。年収は最高で168万人民元(約3,500万円)に達し、AI時代におけるトップ技術人材に対する狂気じみた争奪戦を体現している(出典:Business Insider