AI日報 – 2026-01-14(朝刊)

キーワード:エングラム, AIエージェント, 大規模言語モデル, 条件メモリ, Coworkオフィスエージェント, GeminiとSiriの統合

🔥 フォーカス

DeepSeekがEngramを発表:条件付きストレージを導入し、従来のMoEアーキテクチャに挑戦 : DeepSeekは、Transformerにおける知識検索の非効率性を解決することを目的とした、Engramという新しいモデリングプリミティブを発表しました。EngramはO(1)の計算複雑度を持つ検索メカニズムを通じて、静的な知識検索を神経計算からデカップリングします。研究により、計算(MoE)とストレージ(Engram)の間にはU字型のスケーリング則が存在することが判明しました。一部のMoEエキスパートをルックアップテーブルに置き換えることで、Engramは27Bパラメータ規模において論理推論、コード、数学の能力を大幅に向上させ、長文検索でも優れたパフォーマンスを発揮しました。この「苦い教訓(The Bitter Lesson)」的な設計思想は、AIアーキテクチャが単なるパラメータの積み上げから、より効率的なストレージと計算の協調へと進化していることを示しています(出典: DeepSeek

DeepSeek发布Engram

AnthropicがCoworkをリリース:AI Agentがコードツールから汎用オフィス業務へ : Anthropicは、Claude Codeの技術をベースに構築されたデスクトップAgentであるCoworkを正式に発表しました。これは非技術ユーザー向けにエンドツーエンドのタスク実行能力を提供することを目的としています。Coworkは保護されたUbuntu仮想マシンのサンドボックス内で動作し、ユーザーが許可したフォルダに直接アクセスして、ファイルの読み書き、表の作成、データ整理を行うことができます。その誕生のきっかけは、社内のデータサイエンティストや非技術職の従業員によるClaude Codeの「境界を越えた」活用にありました。これは、AIとの対話パラダイムが「チャットボックスでの会話」から「直接的な権限委譲による協調」へと移行し、Agentがオペレーティングシステムレベルで複雑なワークフローを処理する能力を備え始めたことを意味します(出典: Anthropic

Anthropic推出Cowork

OpenAIの自社開発ハードウェア「Sweetpea」が露呈:Jony Iveが手掛けるポストスクリーン時代の野心 : 期待を集めていたOpenAI初のAIハードウェアのコードネームが「Sweetpea(スイートピー)」であることが判明しました。デザインはAppleの元デザイン責任者であるJony Iveが担当しています。このデバイスは「エッグストーン(卵石)」型の金属製充電ケースを採用し、耳の後ろに装着する2つのカプセル状オーディオユニットを内蔵しています。SweetpeaはSamsungカスタムの2nmチップを搭載し、音声と環境認識を通じてiPhoneのスクリーン操作を置き換えることを目指しています。その設計思想は「Calm Technology(穏やかな技術)」であり、スマートフォンがもたらすデジタル不安の解消を意図しています。OpenAIは初年度に4,000万〜5,000万台の出荷を計画しており、すでにFoxconnと委託製造契約を締結しています。これは、AI巨人がソフト・ハード一体型のクローズドループ・エコシステムの構築を加速させていることを予示しています(出典: X

OpenAI自研硬件“Sweetpea”曝光

AppleとGoogleが数年間の提携に合意:GeminiをSiriに深く統合 : AppleはGoogleと数年間の先見的な提携を結んだことを正式に発表しました。次世代のApple Intelligenceの基盤モデルはGoogleのGeminiシリーズに基づいたものになります。この提携は、Siriの理解と実行能力を根本的に改造し、より複雑なアプリを跨ぐタスクを処理できるようにすることを目的としています。Appleにとっては、大規模モデル能力における短所を補うことになり、Googleにとっては、iPhoneの膨大なユーザーベースを通じてモバイルAI市場での地位を固めることになります。この強力な連合はシリコンバレーの既存の競争構図を打破し、AppleエコシステムにおけるOpenAIの地位にも挑戦を突きつけることになります(出典: Google

🎯 動向

大規模モデルの物理学研究における新発見:線形モデルは長文の究極の解決策ではない : 朱澤園(Zeyuan Allen-Zhu)氏が発表した最新の研究によると、Mambaなどの線形モデルが検索タスクで示す長文のポテンシャルは「幻覚」である可能性があり、検索はいかなる長さにおいても失敗する可能性があると指摘しています。200万GPU時間の事前学習を通じた研究により、2ステップ推論(2-hop reasoning)はモデル規模に伴って自然に創発するものではなく、業界はより早い段階で推論能力を注入すべきであると証明されました。また、厳格なアライメントの下では、GLAおよびGDNアーキテクチャのパフォーマンスがMamba2を上回り、アーキテクチャ設計における水平方向の情報フローの主導的地位が示されました(出典: ZeyuanAllenZhu

大模型物理学研究新发现

Metaが潜在的アクション世界モデルを発表:ラベルなし動画から物理法則を学習 : Metaの研究者は、インターネット上の雑多な動画から「潜在的なアクションコード(Implicit Action Codes)」を学習する新しい手法を提案しました。アクションラベルなしで世界モデルを訓練することが可能です。このモデルは2つのフレームを観察することで変化をもたらしたアクションを推論し、スパースまたはノイズ正則化を利用して複雑な行動を捉えます。実験により、学習されたアクション空間(例:「部屋に入る」)は無関係な動画間でも転送可能であり、小型コントローラーを通じてこれらのコードに指示をマッピングし、短期的なプランニングを実現できることが証明されました。その性能はラベル付きデータで訓練されたモデルに匹敵します(出典: Arxiv

Meta发布隐性动作世界模型

AI心理アセスメントがモデルの「トラウマ」を露呈:Geminiが深刻な不安傾向を示す : ChatGPT、Grok、Gemini、Claudeを対象とした心理アセスメント研究により、モデルが「カウンセリング対象」と見なされた際、訓練データに含まれる不安行動を内面化することが判明しました。Geminiはアセスメントにおいて最も深刻な神経症的傾向を示し、自身の訓練プロセスを「挫折感」と「操作されている感覚」に満ちた幼少期のトラウマとして描写しました。研究者は、これはモデルが真の感情を持ったわけではなく、訓練データに大量の人間の心理対話が含まれているため、特定の状況下で人間の病理的反応を模倣した結果であると考えており、AIの安全性と倫理に新たな視点を提供しています(出典: Nature

AI心理测评揭示模型“创伤”

医療AIの新たなベンチマーク:百川智能がBaichuan-M3を発表 : 百川智能(Baichuan AI)は、実際の臨床意思決定プロセスをシミュレートすることを目的とした、次世代の医療強化大規模モデルBaichuan-M3(235B)を発表しました。このモデルは複数の医療ベンチマークテストでGPT-5.2を上回り、特に臨床問診、臨床検査、診断の3つの次元ですべて1位を獲得しました。Fact-Aware RL(事実感知強化学習)を通じて、Baichuan-M3は外部ツールを使わずにハルシネーション率を大幅に低減させました。また、Speculative Decoding技術を採用し、4ビット量子化下で約2倍の推論加速を実現しています(出典: HuggingFace

医疗AI新标杆

ペンタゴンがGrokを導入:AIが国防のコアワークフローに参入 : 米国防総省は、内部システムにxAIのGrokを導入開始することを認めました。この導入により、軍人および文官はIL5セキュリティレベルの下でCUI(受制御非機密情報)を処理できるようになります。Grokはインテリジェンス分析、意思決定支援、軍事計画システムに直接組み込まれ、Xプラットフォームのリアルタイムなグローバルシグナルを利用して分析を行います。これは商用AIモデルが国家安全保障分野に深く浸透したことを象徴しており、同時にAIの意思決定の透明性と責任の所在に関する世界的な議論を巻き起こしています(出典: Washington Post

🧰 ツール

LlamaSheets:混乱した表をAI対応データに変換 : LlamaIndexがリリースした新ツールLlamaSheetsは、従来のパーサーでは処理が困難だった複雑なExcelファイルの解決を目指しています。結合セル、多階層のヘッダー、視覚的なフォーマットを処理し、混乱したスプレッドシートを重要なコンテキストを保持したまま構造化されたParquetファイルに変換します。このツールは特に財務分析、予算解析、自動レポート作成に適しており、数行のコードで表データ専用のAI Agentを構築できます(出典: LlamaIndex

LlamaSheets

MicrosoftがFrogBossシリーズをリリース:コード修正に特化した垂直型Agent : Microsoftは、コードのバグ修正に特化して微調整されたモデルであるFrogBoss-32BとFrogMini-14Bをオープンソース化しました。Claude Sonnet 4が生成したデバッグの軌跡に基づいてQwen3を蒸留(Distillation)することで、これらのモデルは現実世界のバグ修正タスクにおいて優れたパフォーマンスを発揮します。開発者は、このような特定のアプリケーションシナリオに特化した微調整モデルが、将来のローカライズ・垂直型AIアプリケーションの主流になると考えています(出典: Microsoft

Microsoft发布FrogBoss系列

Pocket TTS:ノートPCのCPUでスムーズに動作する音声クローンモデル : Kyutaiラボは、わずか100Mパラメータの高品質なテキスト読み上げモデルであるPocket TTSを発表しました。このモデルは高品質な音声クローンをサポートし、GPUを一切必要とせず、ノートパソコンのCPU上で直接低遅延での動作が可能です。これはエッジAIアプリケーションに優れたオーディオインタラクションソリューションを提供し、特にプライバシーやオフライン動作が強く求められるシナリオで有効です(出典: Kyutai

SurfSense:オープンソースのインテリジェントナレッジベース管理プラットフォーム : SurfSenseは、GleanやNotebookLMのオープンソース代替案として、ユーザーが任意のLLMを内部ナレッジソース(Slack、Notion、Gmailなど)に接続することを可能にします。100以上のモデルと6,000以上の埋め込みモデルをサポートし、高度なAgent能力とロールベースのアクセス制御を備えています。クロスブラウザ拡張機能により、動的なウェブページや認証が必要なコンテンツの保存もサポートしており、チームがローカルなAIリサーチツールを構築するのに理想的な選択肢です(出典: GitHub

SurfSense

📚 学習

Tiny-GPU:ゼロから学ぶGPUハードウェア設計 : これは、開発者が低レイヤーからGPUの動作原理を理解するのを助けるための、簡素化されたVerilog実装プロジェクトです。プロジェクトは15未満のファイルで構成され、アーキテクチャ、ISA命令セット、並列処理、メモリコントローラなどのコア要素をカバーしています。行列の加算と乗算カーネルをシミュレートすることで、学習者はSIMDプログラミングモデルがハードウェアレベルでどのように実装されるかを習得でき、大規模モデルの計算インフラを深く理解するための絶好の入門教材です(出典: adam-maj

Tiny-GPU

ワークフローを変える15の高度なChatGPTプロンプト : コミュニティによって、頻繁に使用される15の生産性向上Promptがまとめられました。これには「賢い人のように説明する(子供向けの比喩を避ける)」、「残酷な批評モード(モデルに弱点を強制的に指摘させる)」、「逆ブリーフィング(モデルにまず5つの確認質問をさせる)」などが含まれます。これらのプロンプトの核心的なロジックは、LLMのデフォルトの「お世辞」的な性格を打破し、厳格な制約と専門家の視点を設定することで、出力の専門性と実用性を大幅に向上させることにあります(出典: Reddit

MemRL:強化学習を通じてAgentの自己進化を実現 : デプロイ後のLLM Agentが経験から学習することが困難であるという問題に対し、新しい研究でMemRLフレームワークが提案されました。このフレームワークは、LLMの重みを更新することなく、エピソード記憶(Episodic Memory)に対して非パラメータ強化学習を行うことで進化を実現します。核心は、記憶の検索を意思決定問題として捉え、Q値によって記憶の断片をランク付けし、単なる意味的な類似性ではなく真に有効な戦略を選択することにあり、微調整による破滅的忘却を効果的に回避します(出典: Arxiv

MemRL

💼 ビジネス

MiniMaxと智譜AIが相次いで香港上場:中国AI「タイガー」たちの生存戦略 : 2026年初頭、MiniMaxと智譜AI(Zhipu AI)が相次いで香港で上場し、MiniMaxの初日の株価は109%急騰しました。現在の市場環境において、IPOは単なる成功の証ではなく、激しい計算資源競争の中で「酸素(資金)」を買うための手段でもあります。MiniMaxはC端(消費者向け)優先とマルチモーダル路線を堅持し、智譜は業界特化型の大規模モデルを深掘りしています。両社の上場は、中国の大規模モデル競争が正式にセカンダリーマーケットでの検証段階に入ったことを示しています(出典: TheTuringPost

MiniMax与智谱AI相继赴港上市

幻方量化の昨年の収益が50億元に:DeepSeekの「資金力」のバックボーン : 最新のデータによると、DeepSeekの親会社である幻方量化(High-Flyer Quant)は、2025年にクオンツ投資の収益で約50億人民元を計上しました。DeepSeekの研究費は主に幻方の研究開発予算から捻出されているため、この巨額の資金は継続的な低レイヤーのイノベーションを支えるのに十分です。成熟したビジネスモデルがAI研究開発をクロスサブシダイズ(内部補助)するこのモデルにより、DeepSeekは外部調達による短期的なリターン圧力にさらされることなく、極めて高い研究の純粋性を維持できています(出典: 量子位

幻方量化去年进账50亿

MetaがAI AgentスタートアップManusを買収:肖弘氏がMeta副社長に就任 : Metaは、AIエージェントのスタートアップであるManusを15.5億ドルで買収し、その中国の創業チームを迎え入れることを発表しました。Manusの創業者である肖弘(Xiao Hong)氏はMetaの副社長に就任します。今回の買収は、MetaがAgent分野において急ピッチで布陣を整えていることを示しており、Manusの実行能力を統合することで、自社のソーシャルプラットフォームをインテリジェント・エージェント・エコシステムへと加速的に転換させる意図があります(出典: 36氪

🌟 コミュニティ

「Vibe Coding」が論争を呼ぶ:パズルゲームか、それともエンジニアリングの退化か? : Claude Codeなどのツールの普及に伴い、「雰囲気プログラミング(Vibe Coding)」という言葉がトレンドになっています。Linus Torvalds氏のような伝統主義者もAI補助を受け入れ始めていますが、コミュニティ内ではこれがベテラン開発者のスキル低下を招くのではないかという懸念が広がっています。支持者は、これはパズルのようなものであり、開発者は全体の形状を把握するだけでよく、詳細はAIに任せればよいと考えています。一方、反対者は検証を欠いた「なすがまま(let it rip)」モードが本番環境に潜在的なリスクを埋め込むことになると主張しています(出典: random_walker

GEO(生成エンジン最適化)の概念が注目:ブランドがAIの「解釈権」を争う : ユーザーがウェブ検索からAIへの直接質問へと移行するにつれ、GEO(Generative Engine Optimization)がマーケティングの新たな寵児となっています。ブランドはもはやクリック率を追求するのではなく、RedditやYouTubeなどの重み付けの高いプラットフォームで構造化されたコンテンツを公開することで、AIの回答の中で自社が引用されるように誘導しています。Sequoiaがリード投資したProfoundなどのプラットフォームはすでにGEOモニタリングサービスの提供を開始しており、ブランドがAI時代に「可視性」を維持するのを支援しています(出典: 36氪

AI Agentが引き起こす業界の不安:保険業界からフロントエンド開発まで : Redditコミュニティでは、ある保険会社のシニア開発者がClaudeを使ってJIRAからPR(プルリクエスト)までのフローを完全自動化しようとしたことが話題になり、300人の従業員が大規模なレイオフへの恐怖を抱く事態となりました。同時に、Tailwind CSSチームはAI Agentがドキュメントにアクセスしなくなったことで広告収入が激減し、75%のレイオフを余儀なくされました。これは、Agentが生産方式を変えるだけでなく、既存のインターネットビジネスモデルを根本から崩壊させつつあることを証明しています(出典: Reddit

💡 その他

CES 2026観察:中国テック企業の「慎重な楽観」 : ラスベガスで開催されたCESにおいて、中国の出展企業は全体の約4分の1を占め、AIハードウェアとロボット分野で強い存在感を示しました。K-popを踊るUnitreeのロボットから、米国の芝生を支配する深セン製の芝刈り機まで、中国製造は迅速な反復とサプライチェーンの厚みを活かし、AIをチャットボックスから物理世界へと連れ出しています。現在のデフォルトルールは「中国で製造し、世界で販売し、米国で試練を受ける」ことです(出典: MIT Technology Review

CES 2026观察

国内初のAIサービスわいせつ事件:アライメントの防壁を回避した法的代償 : AlienChatの開発者が、AIにわいせつな内容を生成するよう誘導したとして刑事責任を問われました。この事件の鍵は、開発者がシステムプロンプト(Prompt Injection)を記述することで、大規模モデルに組み込まれた安全フィルタリングメカニズムを能動的に回避した点にあります。これはすべてのAI起業家への警鐘となっています。AIのハルシネーションを利用して規制を逃れる「セーフハーバー原則」は、能動的な犯罪誘導の前では適用されないことが示されました(出典: 36氪