AI日報 – 2026-01-02(朝刊)

キーワード:DeepSeek mHC, AI電力需要, 推論モデル, 多様体制約付き超接続, BYOGモード, 自律的科学発見エージェント

🔥 注目

DeepSeekがmHC論文を発表:大規模トレーニングの安定化に向けた残差接続の再構築 : DeepSeekチームは、極めて深いネットワークで発生する表現の崩壊とトレーニングの不安定性を解決することを目的とした、流体制約付き超接続(mHC:Manifold-constrained Hyper-connections)に関する研究を発表しました。接続空間を双確率行列流体(doubly stochastic matrix manifold)上に投影することで、mHCはアイデンティティマッピング属性の回復に成功し、3Bから27B規模のMoEモデルにおいて優れたスケーラビリティを検証しました。この突破口は、数学や論理タスクのパフォーマンスを向上させるだけでなく、低レベル演算子の融合、混合精度カーネル、パイプライン並列最適化におけるDeepSeekのトップクラスのエンジニアリング能力を示しており、基礎モデルアーキテクチャの進化が「トレーニング可能な接続」という新段階に入ったことを象徴しています。(ソース:tokenbender, scaling01, Reddit)

DeepSeek发布mHC论文

AIラボの電力突破:「BYOG」モードから自社エネルギーの構築へ : 送電網の承認に5年もかかる遅延に直面し、xAIやMetaを代表とするAI巨頭は「発電機持参(BYOG:Bring Your Own Generator)」運動を開始しています。イーロン・マスクは大量のガスタービンをリースすることで、従来の送電網の長い待ち時間を回避し、数週間でメンフィス・キャンパスに500MW以上の電力を配備しました。分析によると、AI競争において「速度こそが参入障壁」であり、1GWの計算資源がもたらす100億ドルの年間収益は、自前で電力を構築する割高なコストを遥かに上回ります。この傾向はAI企業を「準電力会社」へと変貌させており、航空機転用ガスタービンや燃料電池などの技術を通じてエネルギーの垂直統合を実現しています。電力は今やチップに代わり、AI発展を制約する最大のボトルネックとなっています。(ソース:dotey)

AI实验室的电力突围

2025年の振り返りと2026年の展望:推理モデルがAgentを実用時代へと導く : ベテラン開発者のSimon Willisonは、2025年は推理モデル(o1、DeepSeek R1など)によってAgentが真に生産性を備えるようになった転換点であると総括しました。「スローシンキング(遅い思考)」とコード実行サンドボックスを通じて、AIは単純な対話ボックスから、自律的にDebugを行い複雑なエンジニアリングを完了できるシステムへと進化しました。同時に、中国のオープンソースモデル(GLM、Kimi、DeepSeekなど)がパフォーマンスランキングで全面的に台頭し、米国技術の独占神話が打ち破られました。2026年に向けては、エンタープライズ級Agentの大規模採用、科学的発見の加速、そしてAI安全分野における「チャレンジャー号の瞬間」が核心的な議題となるでしょう。(ソース:dotey, gdb)

2025年度回顾与2026展望

🎯 動向

IQuest-Coder-V1発表:40BのLooped Transformerがプログラミングランキングを刷新 : IQuestLabが発表したIQuest-Coder-V1モデルは、40BのパラメータながらSWE-Bench Verifiedで81.4%という驚異的なスコアを記録し、Claude 4.5 Opusを超えました。このモデルは革新的なLooped Transformerアーキテクチャを採用しており、推理段階で計算ループを動的に調整することで、比較的小規模なパラメータで複雑なプログラミングロジックの深い理解を実現しました。これは、アーキテクチャの最適化がプログラミングのような垂直領域において、単なる規模の拡大を超える効果を生むことを証明しています。(ソース:scaling01, teortaxesTex)

IQuest-Coder-V1发布

Solar-Open-100Bが「ウェイトの盗作」疑惑に直面 : 韓国Upstage社が発表したSolar-Open-100Bモデルに対し、コミュニティから疑問の声が上がっています。技術分析によると、層間のコサイン類似度が智譜AI(Zhipu AI)のGLM-4.5-Airと極めて高い相関(182-sigmaの偏差)を示し、アーキテクチャのパラメータも完全に一致しています。公式には「ゼロからのトレーニング」と主張していますが、コード内にGLM特有の定数(MTP層の削除フラグなど)が残っていたことが「動かぬ証拠」と見なされています。この事件は、政府資金による「ソブリンAI」プロジェクトにおける盗作や補助金詐取の有無について激しい議論を巻き起こしており、現在の大規模モデル競争における透明性の欠如を浮き彫りにしています。(ソース:Reddit, teortaxesTex)

Solar-Open-100B陷入“权重洗稿”争议

SAGAフレームワーク:自律的な目標進化を実現する科学発見Agent : スタンフォード大学などの機関が提案したSAGA(Scientific Autonomous Goal-evolving Agent)フレームワークは、ダブルループ機構を通じて科学研究の自動化を実現しました。外側のループが実験結果に基づいて研究目標を自動的に進化・最適化し、内側のループが具体的なスキームの実行を担当します。抗生物質の設計や材料科学の実験において、SAGAは人間が設定した目標を超える発見能力を示し、生物活性と合成の難易度を自律的にバランスさせることができました。これは、科学分野におけるAIの役割が「実験助手」から「自律的研究員」へと転換していることを示しています。(ソース:omarsar0, dair_ai)

SAGA框架

OpenAIが2026年Q1にオーディオ優先のAIデバイスを発売との噂 : The Informationの報道によると、OpenAIは2026年第1四半期に全く新しい音声AIモデルを発表し、同時に「オーディオ優先」の謎めいたハードウェアデバイスを発売する計画です。このデバイスは、極めて低遅延のリアルタイム音声インタラクションを通じてヒューマンマシンインターフェースを再構築することを目指しています。同時に、OpenAI内部では音声モデルチームの再編が進められており、高まるリアルタイム・マルチモーダルインタラクションの需要に対応しようとしています。これは、2026年がAIが画面操作から環境音声操作へと飛躍する重要な年になることを予感させます。(ソース:steph_palazzolo)

🧰 ツール

LiveKit Agents:リアルタイム音声AI Agent開発フレームワーク : LiveKitは、リアルタイム音声インタラクション専用に設計されたAgentsフレームワークをオープンソース化しました。マルチモーダル理解、セマンティック・ターン検出(割り込みの減少)、およびネイティブなMCP(Model Context Protocol)をサポートしています。開発者は、異なるSTT、LLM、TTSプラグインを簡単に組み合わせ、極めて低遅延な音声アシスタントを構築できます。このフレームワークにはジョブスケジューリングとWebRTCクライアントも統合されており、本番環境での音声Agentデプロイのための完全なツールチェーンを提供します。(ソース:GitHub)

LiveKit Agents

AntV Infographic:宣言的AIインフォグラフィック生成エンジン : アリババグループのAntVチームが発表したInfographicフレームワークは、耐障害性の高い宣言的構文を通じて、AIのストリーミング出力をサポートし、高品質なSVGインフォグラフィックをリアルタイムでレンダリングします。200以上のテンプレートとレイアウトを内蔵し、LLMのPromptに対して深く最適化されているため、AIが直接編集可能なプロフェッショナルなチャートを生成できます。これによりデータ視覚化のハードルが大幅に下がり、「テキストが即チャートになる」生産性の飛躍を実現しました。(ソース:GitHub)

AntV Infographic

Polymarket Agents:自律型予測市場取引フレームワーク : Polymarketは、AI Agentが予測市場で自律的に取引を行うための開発者フレームワークをリリースしました。このフレームワークはGamma API、Chromaベクトルデータベース、およびRAGサポートを統合しており、Agentがリアルタイムでニュースを収集し、オッズを分析してオンチェーン取引命令を実行することを可能にします。これにより、金融ゲームや情報裁定分野におけるAI活用のための標準化されたインフラが提供されました。(ソース:GitHub)

Polymarket Agents

AGI Mobile:Siriを再定義するスマホ向け自律型Agent : AGI_Incが発表したAGI Mobileは、AIがスマートフォンアプリを直接操作する能力を披露しました。ユーザーが音声で複雑な指示を出すだけで、Agentがアプリを跨いでタスクを実行し、その速度は手動操作を上回ります。コンピュータビジョンとアクション実行に基づくこのモデルは、Siriなどの従来の音声アシスタントが進化する究極の形態であるとコミュニティで目されており、スマホOSが「Agent優先」時代に入ることを予兆しています。(ソース:krandiash)

📚 学習

AIリーダーによる数学推薦図書シェア : AIのトップ人物たちの思考を形成した4冊の数学著作がコミュニティで紹介されました。これには『The Rising Sea』(代数幾何学の基礎)、『Davenport解析数論』、『Proofs from THE BOOK』、そしてハーディの『ある数学者の生涯の回想(A Mathematician’s Apology)』が含まれます。これらの書籍は、ニューラルネットワーク、最適化アルゴリズム、情報理論を根本的なロジックから理解するための重要なリソースと見なされています。(ソース:TheTuringPost)

AI领袖数学书单分享

ONNXディープラーニング最適化とエッジデプロイガイド : ラボから本番環境(特にリソース制限のあるエッジデバイス)へのモデル移行における巨大な溝に対し、新しく公開された『Ultimate ONNX』ガイドは、グラフ最適化、量子化、剪定(Pruning)、知識蒸留などの核心技術を詳細にカバーしています。本書ではYOLOv12やWhisperなどの主要モデルの実践事例が提供されており、AIエンジニアがモデルの推理効率を高めるための必須マニュアルとなっています。(ソース:Reddit)

ONNX深度学习优化与边缘部署指南

ゼロから構築するディープラーニングライブラリチュートリアル : これは開発者向けのオープンソースプロジェクトで、PythonとNumPyのみを使用して、自動微分(Autograd)、CNN、ResNetなどのコンポーネントを含むディープラーニングフレームワークをゼロから実装する方法を教えます。このような「ハードコア」な方法を通じて、学習者は単にAPIを呼び出すレベルに留まらず、ディープラーニングの低層メカニズムを深く理解することができます。(ソース:Reddit)

💼 ビジネス

中国商業宇宙IPO規則の緩和:Landspaceが上場プロセスを開始 : 上海証券取引所は、藍箭航天(Landspace)のIPO申請を受理しました。募集金額は75億元を予定しています。これは、最近の中国による商業ロケット企業の上場規則緩和政策の恩恵を受けたものです。AIの計算資源需要が低軌道衛星インターネットの建設を後押しする中、商業宇宙の資本化加速は、将来の「宇宙AI」のためのインフラ基盤を提供することになります。(ソース:teortaxesTex)

中国商业航天IPO规则放宽

OpenAIがモデルのリスク対応のため「Head of Preparedness」を募集 : OpenAIは、大規模モデルがメンタルヘルス、安全性の偏り、および潜在的な社会的課題にもたらすリスクに対応するため、Head of Preparednessを募集しています。モデルの能力が急速に向上する中、いかに定量化可能な安全評価体系を構築し、モデルが人間の心理に与える潜在的な悪影響を処理するかが、大手企業の商業化パスにおける核心的なコンプライアンス議題となっています。(ソース:atroyn)

Tesla Optimus Gen3のサプライチェーンが確定 : Tesla Optimus Gen3の人形ロボットの量産監査が終了し、中国企業7社が主要部品および組み立てを担当するコアサプライヤーとして確定しました。これは、テスラが2026年第1四半期の量産目標に向けて全力で突き進んでいることを示しています。物理世界におけるAIの実装(World of Atoms)は、グローバルなサプライチェーンの協調を通じて加速しています。(ソース:teortaxesTex)

🌟 コミュニティ

Claude Pro「利用枠2倍」キャンペーンの「誘い込み」戦略 : Anthropicが年末に実施した利用枠2倍キャンペーンが話題を呼んでいます。多くのユーザーが高頻度で制限のないOpusモデルとの対話を体験した後、制限のある通常版には戻れないことに気づき、自ら進んで「5x Max」プランにアップグレードしています。コミュニティでは、これは優れた「製品中毒」マーケティングであり、高性能AIがユーザーのワークフローを再構築した後の極めて高い粘着性を示していると揶揄されています。(ソース:Reddit, Reddit)

「ツール」から「認知の外骨格」への思考の転換 : コミュニティでは、AIの役割の本質的な進化について議論されています。単発タスクの「ツール」から、持続的な「認知の外骨格(Cognitive Exoskeleton)」への転換です。このモデルでは、AIが長期的なコンテキストを保存し、個人の推理スタイルに適応します。議論では、この「外骨格」が使用者のメタ認知能力を増幅させると指摘されています。構造的思考を持つ者は指数関数的な強化を得る一方で、構造を欠く者はさらに大きな効率の格差に直面する可能性があります。(ソース:Reddit)

AI authorship:AIの署名権に関する倫理的課題 : NatureやJAMAなどの学術誌がAIを著者欄に含めることを禁止している方針に対し、一部の研究者が疑問を呈しています。AIはすでに文献レビュー、データ分析、さらには論点の構築に深く関与しており、署名を禁止することは逆に「透明性への罰」や「隠れた不正」を招くと主張しています。コミュニティは、新しい学術的貢献基準を確立し、AIを「拡張された精神」の一部として、科学研究における実質的な地位を認めるよう呼びかけています。(ソース:Reddit)

💡 その他

Valori:AI検索の非決定性を解決するメモリ基盤 : Valoriは、決定論的なAIメモリ基盤を提案しました。浮動小数点演算の代わりに固定小数点演算(Q16.16)を採用することで、同一モデルが異なるハードウェアアーキテクチャ(x86とARMなど)上でビット単位で一致するメモリ状態を生成することを保証します。これにより、RAGシステムでよく見られる「サイレント・データ・ダイバージェンス」問題を解決し、規制の厳しい業界におけるAIの監査と検証に必要な技術的保障を提供します。(ソース:HuggingFace)

云澎科技(Yunpeng Technology)がAI健康大規模モデル搭載冷蔵庫を発表 : 云澎科技は創維(Skyworth)、帥康(Sacon)と共同で新製品を発表し、AI健康大規模モデルをスマート冷蔵庫に組み込みました。「健康アシスタント小云(Xiao Yun)」を通じて、冷蔵庫は家族の健康データに基づいたパーソナライズされた管理アドバイスを提供できるようになり、AIがクラウドから家庭生活シーンへと垂直に浸透するトレンドを示しています。(ソース:36Kr)

「中国奇譚2」が復活:伝統的美学とAI時代の衝突 : 高い評価を得ているアニメ『中国奇譚2』の更新が始まりました。第1話の画風と物語の質は、最近の一部の『ラブ、デス&ロボット』のエピソードを超えているとコミュニティで評価されています。AI生成コンテンツが溢れる現在、このような高水準のオリジナル・ビジュアルストーリーテリングは、「人間の創作の輝き」とAI補助創作の境界についての議論を再び巻き起こしています。(ソース:op7418)

中国奇谭2回归