AI日報 – 2026-01-08(朝刊)

キーワード:AIスーパーコンピューティングアーキテクチャ, 大規模言語モデル, AIエージェント, Rubinスーパーコンピューティングアーキテクチャ, MiroThinker 1.5, 多様体制約ハイパーコネクション

🔥 フォーカス

NVIDIAがRubinスーパーコンピューティングアーキテクチャを発表:「シャベル売り」から「生産性ワークショップ売り」へ : ジェンスン・ファン氏はCES 2026にて、新しいAIスーパーコンピューティングアーキテクチャ「Vera Rubin」を披露しました。このアーキテクチャは単なるグラフィックカードのアップグレードではなく、Vera CPU、Rubin GPU、NVLink 6など6つの専用チップを統合した垂直統合システムです。Rubinはシステムのスケール化の課題を解決することを目指しており、推論スループットを10倍向上させ、1兆パラメータモデルのトレーニングに必要なGPU数をBlackwellの4分の1に削減、Tokenコストを10分の1に下げると宣言しています。この動きは、NVIDIAがシステムレベルの最適化を通じて「堀」を築き、計算リソースの積み上げを「手作業による組み立て」から「標準化されたライン」へと変えようとしていることを示しており、安価な推論時代の到来を予感させます(ソース: 36氪TheRundownAI

英伟达发布Rubin超算架构

MiroThinker 1.5が衝撃の発表:30BモデルでGPT-5-Highに匹敵 : 陳天橋(TCCI)氏が資金提供し、清華大学の戴季峰准教授が率いるMiroMindチームがMiroThinker 1.5をリリースしました。このモデルはわずか30Bのパラメータでありながら、HLEやBrowseCompなどの高難易度ベンチマークでGPT-5-HighやDeepSeek-V3.2と肩を並べました。コア技術は「Interactive Scaling」で、モデルがエージェントと環境とのより深く頻繁な対話を処理できるようにトレーニングすることでパフォーマンスを向上させています。この成果は、適切なアーキテクチャの選択(単なるプリトレーニングではなくAgentモデリングに焦点を当てるなど)を行えば、小規模なエリートチームでもAGIの最前線で競争環境を再構築できることを証明しました(ソース: GitHubZhihuFrontier

MiroThinker 1.5震撼发布

DeepSeekがManifold-Constrained Hyper-Connections(mHC)を発表:Transformerアーキテクチャの重大な突破口 : DeepSeekチームは論文『Manifold-Constrained Hyper-Connections』を発表し、トレーニングの崩壊を招かずに残差流を広げることができる新しいスキームを提案しました。この技術は、超深層モデルのトレーニングにおける不安定性、拡張性、およびメモリオーバーヘッドの問題を解決します。CEOの梁文鋒氏が自ら署名しており、これは2015年のTransformer誕生以来、アーキテクチャに対する最も根本的な改良の一つと見なされています。実験では、27Bパラメータ、60層の深さを持つモデルで優れたパフォーマンスを示しており、DeepSeek V4がより深く広いアーキテクチャ設計を採用する可能性を示唆しています(ソース: nrehiew_Reddit

DeepSeek发布流形约束超连接

MetaによるManus買収取引が中国規制当局の審査対象に : 関係者によると、中国商務部はMetaによるAI AgentスタートアップManusの20億ドルでの買収取引について、技術輸出管理規定に違反していないか評価を行っています。審査の核心は、同チームが中国滞在中に開発したデジタル資産および技術をシンガポールへ移転することの合法性にあります。この動きは、グローバルなAI競争を背景に、規制当局がトップクラスのAI人材やコア技術の流出に対して極めて敏感になっていることを反映しており、オープンソースへの貢献とクロスボーダーな技術移転の境界に関する深い議論を巻き起こす可能性があります(ソース: doteyteortaxesTex

Meta收购Manus交易遭中国监管审查

🎯 動向

DeepSeek-R1論文が大幅アップデート:22ページから86ページへ拡充 : DeepSeek-R1の技術ドキュメントが大幅に補足され、R1-Zeroの自己進化プロセス、評価の詳細、蒸留戦略、およびより深いアブレーション実験が詳細に開示されました。この動きはコミュニティからDeepSeek V4またはR2リリースの前兆と見なされており、強化学習と推論モデル分野における同社の深い蓄積を示しています。新しい内容は、研究者が推論モデルの内部ロジックを理解するための非常に価値のあるリファレンスを提供しています(ソース: dejavucoderMachineLearning

DeepSeek-R1论文大幅更新

OpenAIが秘密裏にペン型コンシューマーデバイスを開発中:iPhoneの地位に挑戦 : OpenAIがコードネーム「Third Core Device」と呼ばれるペン型のAIハードウェアを開発しているとの噂があります。サイズはiPod Shuffleに近く、マイクとカメラを搭載し、環境認識能力を備えています。コア機能は手書きのメモをリアルタイムでテキストに変換し、ChatGPTにアップロードすることです。この動きは、OpenAIが既存のスマートフォンシステムをバイパスし、ネイティブなAIハードウェアを通じてユーザーのインタラクションの入り口を直接占有しようとする野心を示しています(ソース: Reddit

RunwayがGWM Worldsを発表:リアルタイム環境シミュレーション世界モデル : Runwayは最新の世界モデル「GWM Worlds」を披露しました。ユーザーが1枚の静止したシーン画像を提供するだけで、モデルはリアルタイムの幾何学、光影、物理シミュレーションを含む、没入型で無限に探索可能な3D空間を生成できます。この技術は映画制作やゲーム開発に新しいインタラクティブな環境生成手段を提供することを目指しており、AIが動画生成からインタラクティブな世界の生成へと飛躍したことを象徴しています(ソース: c_valenzuelab

DFlash:speculative decoding技術によりQwen3を6.2倍加速 : Zhijian Liu氏のチームは、ブロック拡散(block diffusion)を利用して投機的サンプリングを行うDFlashを発表しました。Qwen3-8Bにおいて6.2倍のロスレス加速を実現し、EAGLE-3よりも2.5倍高速です。この技術の核心的なロジックは「拡散モデルがドラフトを担当し、自己回帰モデルが検証を担当する」というもので、LLMの推論速度の遅さという痛点を巧みに解決し、拡散モデルと自己回帰アーキテクチャが協調して動作する大きな可能性を示しました(ソース: jeremyphoward

Tesla FSDが初の100%自律走行による米国横断チャレンジを完了 : ドライバーのDavid Moss氏はTesla FSDを使用し、ロサンゼルスからマートルビーチまで計2,732マイルの行程を、スーパーチャージャーでの自動駐車を含め、全行程人工的な介入なしで完了しました。これは、エンドツーエンドのニューラルネットワークに基づく自動運転技術が極めて高い堅牢性を備えており、完全無人運転の臨界点に近づいていることを示しています(ソース: Reddit

🧰 ツール

Cursorが「動的コンテキスト発見」を公開:ファイルシステムはAgentの究極のメモリ : Cursorは技術ブログを公開し、ファイルシステムを通じてコンテキストを管理する戦略を説明しました。長い出力をファイルに変換し、必要に応じてスキル(Agent Skills)をロードし、MCPツールの記述を最適化することで、Cursorは品質を維持しながらToken消費を46.9%削減しました。核心的な見解は、「事前に大量の情報を詰め込んでモデルを混乱させるよりも、必要な時にモデルがファイルシステムを通じて能動的に検索できるようにする方が良い」というものです。これはManusの「ファイルシステム即コンテキスト」という理念と一致しています(ソース: doteyswyx

Cursor揭秘“动态上下文发现”

Claude DesktopにローカルのClaude Codeインターフェースが統合 : Anthropicはデスクトップアプリを更新し、グラフィカルインターフェースを備えたClaude Codeを内蔵しました。ユーザーはサイドバーで「Code」モードに切り替え、ローカルフォルダを選択するだけで、ターミナル以外の環境でClaudeを使用してコード作成やファイル管理を行うことができます。これによりAIプログラミングツールの利用ハードルが大幅に下がり、コマンドライン操作に不慣れな開発者でもClaudeのAgent能力を効率的に活用できるようになります(ソース: op7418

Claude Desktop集成本地Claude Code界面

SkyworkがビデオAgentをリリース:全工程AIビデオ編集能力 : Skywork Videos Agentは、絵コンテ生成から素材編集までの完全なワークフローをサポートしています。ユーザーはテキスト、画像、または最初と最後のフレームからビデオ素材を生成し、右側のエディターで音楽や音声を直接合成できます。リリースされたエフェクトテンプレートはワンクリックで再利用可能であり、AI Agentが単一のコンテンツ生成から複雑なクリエイティブワークフローの管理へと進化していることを示しています(ソース: op7418

NousCoder-14b:オープンソースの競技レベルプログラミングモデル : Nous Researchは、Qwen3-14BをベースにファインチューニングされたNousCoder-14bをリリースしました。このモデルはAtroposフレームワークの下、48枚のB200を使用して4日間トレーニングされ、検証可能な実行報酬(verifiable execution rewards)を通じてPass@1の精度を67.87%に向上させました。チームは同時に、完全なRL環境、ベンチマーク、およびトレーニングスタックをオープンソース化し、複雑なロジックプログラミング分野におけるオープンソースコミュニティの能力の境界を押し広げました(ソース: tokenbenderhuggingface

NousCoder-14b

Memvid:AI Agent向けのシングルファイル・サーバーレスストレージ層 : MemvidはRustで書かれたポータブルなAIメモリシステムです。ビデオコーディングのロジックを借用し、データ、埋め込み、検索構造を単一の.mv2ファイルにパッケージ化することで、5ミリ秒以下のローカル検索速度を提供します。この設計により、AI Agentは複雑なRAGパイプラインやサーバー側のベクトルデータベースを必要とせず、ハードディスクを持ち運ぶように長期記憶を持ち運ぶことができ、オフライン優先のAgent構築に理想的な選択肢となります(ソース: GitHub

Memvid

📚 学習

RustのベテランSteve Klabnik氏がClaudeと連携し、11日間で新言語「Rue」を構築 : 『The Rust Programming Language』の著者であるSteve Klabnik氏は、Claudeの補助を利用して11日間で約10万行のRustコードを書き、実験的なシステムレベル言語「Rue」を作成しました。このプロジェクトは、AIがいかに言語設計の実験コストを大幅に削減し、開発者を煩雑なコーディングから解放して、抽象的な設計や制約の定義に集中させることができるかを示しています。この事例は、「AI時代にまだ新しいプログラミング言語が必要か」というコミュニティでの大きな議論を巻き起こしました(ソース: 36氪

Steve Klabnik联手Claude打造新语言Rue

CogFlowフレームワーク:人間の認知をシミュレートして視覚的数学の難問を解決 : 論文はCogFlowフレームワークを提案し、「知覚-内面化-推論」の3段階を通じて人間が数学問題を解くロジックをシミュレートします。導入された「知識内面化報酬モデル」により、モデルが近道を探すのではなく、視覚的な手がかりを真に統合できるようにします。論文と共にリリースされたMathCogデータセットには、12万件の高品質な知覚-推論アライメントアノテーションが含まれており、マルチモーダル数学推論研究の重要なリソースとなります(ソース: HuggingFace

SOPシステム:視覚-言語-アクション(VLA)モデルのオンライン事後学習スキーム : SOPシステムは、物理世界におけるロボットの分散型・マルチタスクオンライン学習を実現しました。クローズドループアーキテクチャを通じて、ロボット群は経験フローをリアルタイムでクラウド学習器に送り、非同期でポリシーの更新を受け取ります。実験では、数時間の実際のインタラクションを通じて、服を畳む、荷物を棚に上げるなどの複雑なタスクにおけるモデルのパフォーマンスが顕著に向上し、ロボットの数に応じてパフォーマンスが線形に拡張することが示されました(ソース: HuggingFace

💼 ビジネス

智譜AI(Zhipu AI)とMiniMaxが香港IPOを計画:中国の大規模モデルユニコーンが上場ラッシュへ : Zhipu AIとMiniMaxは2026年1月に香港での上場を計画しており、調達額は約5.5億ドル、評価額は約65億ドルと予想されています。Zhipuの2024年の売上高は約4,470万ドル、MiniMaxは約3,050万ドルでした。貿易の緊張状況に直面しているものの、両社は堅実な技術モデルとユーザー基盤(MiniMaxのユーザー数は2.2億人に達する)により、評価額は依然として魅力的であると見なされており、中国のAI産業が資本回収期に入ったことを象徴しています(ソース: bookwormengr36氪

xAIが200億ドルの資金調達を完了:評価額は2,300億ドルに急騰 : イーロン・マスク氏率いるxAIは、計算リソースの購入とXプラットフォーム上でのAI能力拡張のために、再び200億ドルの資金を調達しました。xAIの独自の強みは、Xプラットフォームのリアルタイムデータと2.5億人の日間アクティブユーザーを保有していることです。マスク氏の戦略は「AIでアテンションを構築する」ことであり、Grokのユーモアと反伝統的なスタイルを通じて、OpenAIやAnthropicの包囲網の中で差別化路線を歩んでいます(ソース: TheRundownAIYuchenj_UW

李開復(Kai-Fu Lee)氏が2025年を総括:「世界の工場」から「Agent工場」へ進化 : 01.AIのCEOである李開復氏は、2025年は推論AI Agentの元年であり、DeepSeekの瞬間がToB市場を再構築したと指摘しました。同氏は、2026年には「一人一AIチーム」の時代に突入し、マルチエージェントシステムが流れ作業が工業を再構築したように組織を再構築すると予測しています。中国は強力なオープンソースモデルと製造の基盤を活かし、組織能力をモジュール化して24時間365日デプロイする世界のAgent工場になる可能性があります(ソース: ZhihuFrontier

李开复总结2025

🌟 コミュニティ

Noam Brown氏の実験的内省:AIはまだドメインエキスパートを完全に代替できない : トップAI研究者のNoam Brown氏は、CodexとClaude Codeを使用してポーカーソルバーの作成を試みました。AIは開発を加速させることができますが、アルゴリズムのロジック、フロントエンドGUIの実装、および革新的なアルゴリズムの研究開発において頻繁にミスを犯し、ユーザーを「誤導」することさえありました。同氏は、AIは現状では「不安定なコンパイラ」のようなものであり、深いドメイン知識を必要とする研究タスクにおいては、人間の専門家による検証と修正が依然として不可欠であると考えています(ソース: polynoamialSebastienBubeck

Noam Brown实验反思

ハードウェア価格警告:GPU、DRAM、NANDが急騰の兆し : コミュニティの議論では、データセンター需要の急増とOpenAIなどの巨人による生産能力の争奪の影響を受け、2026年第1四半期のメモリ契約価格は55-60%上昇し、SSD価格はすでに倍増していると指摘されています。NVIDIA RTX 5090の価格は5,000ドルまで上昇する可能性があります。これにより、開発者はより効率的な量子化モデル(FLUX.2 quantizedなど)やllama.cppなどの軽量な推論フレームワークへと舵を切っています(ソース: Reddit

硬件价格预警

Prompt Engineeringの終焉?「Scratchpad」法則が流行 : コミュニティでは、複雑なPersonaや制約を数週間かけて書くよりも、回答前に<scratchpad>を使用してブレインストーミングや自己批判を行うようAIに単純に要求する方が効果的であることが発見されました。この「強制思考」モードは、論理的な問題においてほとんどの複雑なプロンプトを上回ります。Prompt Engineeringの本質は、結局のところモデルをいかに「スローダウン」させて思考させるかにあるという見解が示されています(ソース: Reddit

AIアプリの「突然死の波」:2025年は平均して毎日1つのAIツールが消滅 : 統計によると、2025年に世界で約400のAIツールがサービスを終了し、中国国内でも冒泡鸭(Maopaoya)やWow AIなどの有名なコンパニオン系アプリが一斉に姿を消しました。失敗の主な原因は、収益化能力のない見せかけのトラフィック、単一機能の「裸の」イノベーション、そしてコンプライアンスのデッドラインへの抵触にあります。これはAI起業が「技術誇示の時代」からビジネスの常識へと回帰しており、真の痛みを解決する製品だけが生き残れることを示しています(ソース: 36氪

AI应用“猝死潮”

💡 その他

Agibot Genie Sim 3.0:具身知能(Embodied AI)オープンソースシミュレーションプラットフォームがリリース : 霊足ロボット(AGIBOT)はCES 2026にて、NVIDIA Isaac Simを統合し、1万時間を超える実際のロボット操作合成データセットを提供するGenie Sim 3.0を発表しました。このプラットフォームは分単位での大規模なシミュレーションシナリオ生成をサポートしており、高品質な3D再構成と視覚生成技術を通じて、具身知能の物理ハードウェアへの依存を減らし、モデルのイテレーションを加速させることを目指しています(ソース: ziran_pu

AIによるウイルス作成リスクが安全上の懸念を引き起こす : コミュニティでは、AIがゼロからウイルスを設計する能力について熱い議論が交わされており、これが「完璧な生物兵器」まであと一歩のところにあると考えられています。議論では、技術が新型病原体の製造に悪用されるのを防ぐため、生物分野の大規模モデルに対する規制とガードレールの構築を強化するよう呼びかけており、非デジタル分野におけるAIガバナンスの緊急性が浮き彫りになっています(ソース: Reddit

AI创造病毒风险引发安全忧虑