AI日報 – 2026-01-13(夕刊)

キーワード:エングラムモジュール, コワーク, ジェミニコラボレーション, トランスフォーマー知識検索メカニズム, AIエージェントタスク実行, TTT-E2Eテスト時トレーニング

🔥 フォーカス

DeepSeekがEngramモジュールを発表、ストレージと計算のデカップリングを実現 : DeepSeekは北京大学と共同で論文を発表し、「条件付きメモリ(Conditional Memory)」モジュールであるEngramをリリースしました。この技術は、モダンなハッシュ化されたN-gram Embeddingを通じて、Transformerにネイティブな「知識検索」メカニズムを補完し、近似O(1)の確定的検索を実現します。実験の結果、Engram-27Bは厳密な等パラメータおよび等計算量の条件下で純粋なMoEモデルを大幅に上回りました。知識蓄積能力が向上しただけでなく、浅い層のAttentionにおける「丸暗記」の負担が軽減されたことで、深い層のネットワークが複雑な推論に集中できるようになり、コードおよび数学能力が飛躍的に向上しました。膨大なパラメータをホストメモリ(CPU)にオフロードし、推論損失を3%未満に抑えるこのエンジニアリング手法は、次世代のSparse大規模モデルのコア・プリミティブと見なされており、近くリリース予定のDeepSeek-V4に統合される可能性が非常に高いです(ソース: GitHub

DeepSeek发布Engram模块

Anthropicが戦略的製品Coworkを発表、「デジタル同僚」時代の幕開け : Anthropicは、Claude Codeの基盤能力を非技術者向けのグラフィカルツールとしてパッケージ化したCowork(研究プレビュー版)を正式にリリースしました。CoworkはClaudeがローカルフォルダに直接アクセスすることを許可し、ファイルの読み取り、編集、作成の権限を持ちます。これは単なるチャットボットではなく、自律的にステップを計画し、タスクを並列処理(ダウンロードフォルダの整理、スクリーンショットからのデータ抽出によるExcel生成、レポート初稿の執筆など)できるインテリジェントな協働体です。製品には安全確保のための仮想マシン(VM)隔離環境が組み込まれており、ブラウザの自動化もサポートしています。コミュニティでは、これがAIの「コンテンツ生成」から「タスク実行」へのパラダイムシフトを象徴しており、多くのスタートアップAIアプリにとって脅威になると広く認識されています(ソース: Anthropic

Anthropic发布战略级产品Cowork

AppleとGoogleがGemini提携に合意、Siriに「外部脳」を搭載 : AppleとGoogleは共同声明を発表し、将来のApple Foundation ModelsがGoogleのGeminiモデルとクラウド技術に基づいて構築され、今年後半にリリースされるパーソナライズされたSiriを駆動することを認めました。Appleは年間約10億ドルを支払うとされています。この提携は、自社モデルの開発遅延を背景としたAppleの「一時的な妥協」と見なされており、Geminiは要約や計画などの複雑なタスクを担当し、デバイス上の基本機能は引き続きApple自社モデルがサポートします。この動きによりGoogleの時価総額は初めて4兆ドルを突破しましたが、同時にイーロン・マスクによる「権力の過度な集中」への批判や、AppleエコシステムにおけるOpenAIの地位低下に関する議論を呼んでいます(ソース: Google

苹果与谷歌达成Gemini合作协议

TTT-E2E:エンドツーエンドのTest-Time TrainingがLLMの長期記憶の新時代を切り拓く : NVIDIA、スタンフォード大学、Astera研究所が共同発表したEnd-to-End Test-Time Training (TTT-E2E) の研究が大きな反響を呼んでいます。この技術は、急進的な新アーキテクチャを必要とせず、推論段階(テスト時)にコンテキストを訓練データとして利用し、Next Token Predictionを通じてモデルの重みを継続的に更新することを提唱しています。この手法により、長いコンテキストの経験をモデルの重みに圧縮し、シーケンス長に伴うKVキャッシュの爆発問題を効果的に解決します。TTTはモデルを真の「継続学習者」へと変え、数百万トークンの超長尺シーケンス処理において極めて高い安定性を示しており、純粋なサブ二次(sub-quadratic)シーケンスモデリングへの最も有望な道筋と考えられています(ソース: arXiv

TTT-E2E

🎯 トレンド

Sakana AIがDroPEをリリース:位置エンコーディングの破棄による長文外挿の実現 : Transformerのコア著者であるLlion JonesのチームがDroPE技術をオープンソース化しました。彼らは位置エンコーディング(Position Embedding)は訓練のための「補助輪」に過ぎないと主張しています。DroPEは推論段階でRotary Positional Embedding (RoPE) を破棄し、1%未満の事前学習予算での短いキャリブレーションのみで、膨大なコンテキストウィンドウを解放します。実験では、この手法がLongBenchやNeedle In A Haystackテストにおいて従来のRoPEスケーリングを大幅に上回り、低コストで長文能力を拡張する新しいアプローチを提供しました(ソース: arXiv

BabyVision評価セット:トップクラスのAIモデルの視覚能力は3歳児にも及ばず : Sequoia China xbenchとUniPatAIが発表したBabyVisionの評価によると、言語依存性を厳格に排除した視覚タスクにおいて、大多数のモデルのパフォーマンスは3歳児を大きく下回りました。最高成績を収めたGemini 3 Proでさえ、かろうじて合格ラインに達した程度です。研究では、モデルが言語推論に過度に依存していることが、空間認識、軌跡追跡、幾何学的直感における体系的な欠如を隠蔽していると指摘しており、将来のマルチモーダル知能は根本から視覚能力を再構築する必要があるとしています(ソース: 36氪

BabyVision评测集

Recursive Language Models (RLM):DeepMindがRAG不要の完璧な記憶を模索 : DeepMindの研究者が提案したRecursive Language Models (RLM) は、モデルに自己内省させ、分割して自身を再帰的に呼び出すことで数百万トークンを処理します。このメカニズムは従来のコンテキストウィンドウの制限を打破し、モデルは外部のRAGに依存することなく、再帰的な結果の集約を通じて膨大な情報の「完璧な記憶」を実現します。この進展は、将来のAIによる超長尺ドキュメントの処理方法が質的に変化することを予兆しています(ソース: HuggingFace

RLM

ByteDanceのAI海外展開が「効率化ツール」の新段階へ : ByteDanceは最近、海外で集中的な展開を行っており、Manusに対抗するワークシーン向けAgentであるAnyGenをリリースしました。これはドキュメント作成やデータ分析などの高品質な成果物の提供を主眼としています。同時に、海外向けAIアシスタントDolaのデイリーアクティブユーザー(DAU)は1,000万人を突破しました。ByteDanceは「楽しさの提供」(TikTok)から「効率の販売」へと転換を図り、オフィス向けAgent領域でOpenAIやAnthropicと直接対決しようとしています(ソース: 36氪

字节AI出海

🧰 ツール

Distil-Text2SQL:4Bの小型モデルで685B級の精度をローカルで実現 : Distil-labsはQwen3-4Bをファインチューニングすることで、Text2SQLタスクにおいてDeepSeek-V3(685B)と同等の意味的正確性を達成し、「厳密一致(Exact Match)」指標ではそれを上回りました。このモデルはローカル実行をサポートしており、CSVデータをクラウドにアップロードせずに処理でき、レスポンス時間は2秒未満です。特定のタスクにおいて小型モデルが超大型モデルを代替する大きな可能性を示しました(ソース: GitHub

Text2SQL

LlamaParseのアップグレード:低コストでチャートや画像の精密なOCRを実現 : LlamaIndexは解析ツールLlamaParseをAgenticモードにアップグレードし、ドキュメント内の複雑な視覚要素(折れ線グラフ、円グラフ、フローチャートなど)の最適化に特化させました。ページ全体のスクリーンショットを直接VLMに読み込ませるのと比較して、このツールはサブ要素のバウンディングボックスを識別し、数値ロジックを抽出して高品質なMarkdownに変換します。専門的なドキュメント内の非テキスト情報を処理する上で、現在最も経済的で効率的なソリューションの一つです(ソース: jerryjliu0

LlamaParse升级

Wobo:AI Agentベースの「求職版Tinder」 : WoboはAI Agentを利用して履歴書の送付を自動化するiOSアプリです。ユーザーが一度履歴書をアップロードすると、AIがその「キャリア・パーソナリティ」を分析し、ユーザーが気になる求人を「右スワイプ」するだけで、複雑な外部公式サイトへ自動でナビゲートし、パーソナライズされたカバーレターの作成や選考質問への回答を行います。このツールは、煩雑な繰り返しのフォーム入力を終わらせ、20分かかる応募プロセスを2秒に短縮することを目指しています(ソース: Reddit

Wobo

📚 学習

スタンフォードCS224N 2026が再開:Agentと推論の特集を追加 : 自然言語処理の古典的コースであるCS224Nの再開が発表されました。今年のコースはDiyi YangとYejin Choiが共同で担当します。ニューラルネットワークによるNLPの基礎をカバーするだけでなく、AI Agent、ツールの使用、および「推論(Reasoning)」に特化した2つの講義が重点的に追加され、大規模モデルの最先端トレンドを反映しています(ソース: Stanford

CS224N

Andrew Ngが《Build with Andrew》をリリース:ノーコードでWebアプリを構築 : Andrew Ngは最新のThe Batch週報で新コースをリリースしました。初心者が自然言語でアイデアを説明するだけで、AIツールを利用して実行可能なWebアプリケーションを構築・公開する方法を指導します。このコースは「開発者としてのAI」というパラダイムを強調し、一般の人々がソフトウェア開発分野に参入する障壁を下げています(ソース: DeepLearningAI

Build with Andrew

11種類の新型ポリシー最適化技術のまとめ : TuringPostは、最近登場した11種類のポリシー最適化(Policy Optimization)技術をまとめました。これにはGDPO(報酬デカップリング正規化)、AT²PO(ツリー探索ベースのAgentターン制PO)、そして注目を集めているPC-GRPO(パズル・カリキュラムGRPO)が含まれます。これらの技術は、大規模モデルの論理チェーンとタスクアライメント能力を向上させるための中核となります(ソース: TuringPost

Policy Optimization

💼 ビジネス

OpenAIが医療スタートアップTorchを買収 : OpenAIは、実験結果、薬歴、診察の録音を統合する医療AIスタートアップTorchの買収を発表しました。TorchチームはChatGPT Health部門に加わります。この動きは、OpenAIが健康管理および臨床支援分野でのAI商用化を加速させていることを示しており、ChatGPTを世界で最も専門的なパーソナル健康アシスタントにすることを目指しています(ソース: OpenAI

OpenAI收购Torch

MiniMaxが香港で上場、初日に109%急騰 : 中国のAIユニコーン企業MiniMaxが2026年1月9日に香港で上場し、初日の株価は109%急騰、時価総額は1,500億香港ドルを突破しました。MiniMaxはTalkieや海螺AI(Hailuo AI)によるC端市場での成功を通じて、大口顧客の契約に依存せず、コンシューマー向けマルチモーダル製品を深掘りする道筋が資本市場で魅力的であることを証明しました。今回のIPOは、激しい計算資源競争の中で「酸素」を確保するための重要な一歩と見なされています(ソース: TuringPost

MiniMax上市

xAIが1日2,800万ドルを消費、評価額は2,300億ドルへ : xAIは2025年第3四半期までに78億ドルの損失を出したものの、最近200億ドルの資金調達を完了し、評価額は2,300億ドルに達しました。イーロン・マスクは、テスラのロボットを駆動できる自律型AIシステムの構築を目指す「Macrohard」計画を全力で推進しています。この「力技の投入」モデルは、トップクラスのAIプレイヤーにおけるインフラと人材への極めて高い参入障壁を反映しています(ソース: 36氪

🌟 コミュニティ

Vibe Coding/Working が職業アイデンティティの大議論を巻き起こす : Claude Coworkや各種Agentツールの普及に伴い、「雰囲気ワーク(Vibe Working)」がトレンドワードになっています。コミュニティの議論では、これは単なる効率向上ではなく、「脳内のドメイン知識の収益化」であると考えられています。将来のエンジニアの価値は「10万行のコードを書くこと」から「AIに10万行のコードを書かせるシステムを設計すること」へと転換するでしょう。しかし、これがコード品質の「粗製乱造(Slop)」やAIブラックボックスへの過度な依存を招くと懸念する声もあります(ソース: nearcyan, amasad

AI検出器は「純粋な詐欺」との指摘 : RedditコミュニティはGPTZeroなどのAI検出ツールに対して激しい非難を浴びせており、誤検知率が極めて高く、アメリカ独立宣言でさえ「90% AI生成」と判定されることを指摘しています。ユーザーは、これらのツールが測定しているのは「統計的な親和性」でありソースではないため、多くのオリジナル作家や学生が不当な被害を受けていると考えています。教育界では「魔女狩り」を止め、学生の内容への理解と応用能力を評価する方向へ転換するよう呼びかけています(ソース: Reddit

AI检测器争议

DeepSeek創業者 梁文鋒氏が「AI界の掃地僧」と称えられる : コミュニティではDeepSeekの創業者である梁文鋒氏のクオンツファンドの経歴が話題になっています。彼が率いるHigh-Flyer Quant(幻方量化)は2025年に56.6%という業界平均を遥かに上回るリターンを記録しました。ネットユーザーは、クオンツで稼いだ資金を「YOLO」的にAIへ投入し、MLAやEngramといった独自の技術路線を歩む彼の姿勢を、極めて高いアーキテクチャのセンスとエンジニアリング効率を持つ「掃地僧(実力を隠した達人)」のようだと感嘆しており、シリコンバレーの巨頭に対抗する中国AIの鍵となる変数と見なしています(ソース: teortaxesTex

💡 その他

AIイヤホンSweetpeaが9月に発表か : OpenAI初のハードウェア製品——コードネームSweetpeaと呼ばれるAIイヤホンが、Jony Iveのチームによってデザインされ、金属製の小石のような外観で、ローカル推論をサポートする2nmチップを内蔵しているとの噂があります。OpenAIは初年度の販売目標を5,000万台としており、AirPodsの市場地位に直接挑みます(ソース: 36氪

Sweetpea耳机

AIセキュリティが2026年の企業選定の新基準に : AIエージェントの権限拡大に伴い、企業のセキュリティへの関心は「オプション」から「前提条件」へと変化しました。調査によると、43%の企業がセキュリティをAI導入の最大の障壁と考えています。2026年のトレンドはセキュリティ能力の「ビルトイン化」であり、モデルの呼び出しやAgentのオーケストレーション段階で監査と権限隔離がデフォルトで有効になることです(ソース: 36氪