AI日報 - 2026-01-23(朝刊)

キーワード：AIガバナンス, Claude憲法, AnthropicオープンソースAI価値観, 再帰的言語モデルRLMs, AI倫理ガイドライン, 言語モデルの自己改善プロセス, AI開発原則

🔥 フォーカス

Anthropicが『Claude憲法』を公開：AIガバナンスが「規則による拘束」から「価値観の育成」へ転換 : Anthropicは、84ページに及ぶ『Claude憲法』を正式にオープンソース化しました。これは、AIトレーニングが初期の「硬直したルールリスト」から「教育学」的パラダイムへと移行したことを象徴しています。この憲法は、広範な安全、広範な倫理、誠実さ、そして真摯な助力を優先順位のピラミッドとして確立し、「修正可能性（AIが人間の監督を妨害しようとすべきではないこと）」を強調しています。この手法は、モデルの判断力を養い、未知の状況に直面した際にも、硬直した指令ではなく深い意図に基づいて選択を行えるようにすることを目的としています。これは単なる技術工学の進歩にとどまらず、AIが社会工学の深水域へと足を踏み入れた証でもあります（ソース：36氪）

OpenAIが「行動占い」依存防止システムを導入：プライバシーと安全の究極の攻防 : OpenAIは深夜、未成年者向けの依存防止システムをリリースしました。その中核となるロジックは生年月日ではなく、ユーザーのインタラクションパターンに基づく「行動指紋」です。語彙の乏しさ、スラングの多用、深夜の高頻度な質問などは、アルゴリズムによって「幼稚な特徴」と判定され、権限がダウングレードされる可能性があります。ユーザーが成人権限を回復するには、3D人脸（顔）スキャンデータの提出が必要です。さらに、システムには危機リアルタイム介入プロトコルが統合されており、特定のキーワードは法執行機関の介入をトリガーします。このシリコンバレー流の「社会信用体系」は、保護の名を借りた監視であるとして大きな議論を呼んでいます（ソース：新智元）

BabyVisionベンチマーク：最強の大規模モデルでも視覚的推論は3歳児に及ばず : UniPat AIなどの機関が発表したBabyVision視覚推論ベンチマークによると、最強のGemini 3 Pro Previewでさえ3歳児に僅差で勝る程度で、6歳児とは依然として20%の開きがあり、GPT-5.2やClaude 4.5などのモデルはさらに低いパフォーマンスを示しました。研究では、現在のマルチモーダル大規模モデルが視覚情報を言語に「翻訳」することに依存しているため、微細な幾何学的情報が大量に失われ、長距離空間における知覚の一貫性を維持できないと指摘しています。この結論は、現在のVLAに基づく具身智能（Embodied AI）に冷や水を浴びせるものであり、将来のモデルは低層からネイティブな視覚能力を再構築する必要があることを示唆しています（ソース：量子位）

DeepSeekがFlashMLAをオープンソース化：高性能アテンションカーネルが推論効率を再定義 : DeepSeek-AIは、HopperおよびBlackwellアーキテクチャ向けに最適化されたアテンションカーネル「FlashMLA」を公開しました。これはDeepSeek-V3などのモデルをサポートしています。H800において最大3000 GB/sのメモリ帯域幅と660 TFLOPSの計算性能を実現します。このツールはFP8 KVキャッシュとTokenレベルの稀疏（Sparse）アテンションをサポートし、推論時のビデオメモリ占有を大幅に削減し、スループットを向上させます。現在、MetaX、Moore Threads、Cambriconなどの中国産演算プラットフォームのコミュニティサポートを獲得しており、AIインフラ分野の新たなスタンダードとなっています（ソース：GitHub）

ジェンスン・ファン氏がダボス会議に初登壇：AIが数兆ドル規模のインフラの波を巻き起こす : NVIDIAのCEOであるジェンスン・ファン氏はダボス会議にて、AI産業の「5層ケーキ」理論（エネルギー、チップ、クラウド、モデル、アプリケーション）を提唱し、アプリケーション層の爆発がAIの経済的価値を決定づけると述べました。彼は2025年の3大破壊的要素として、Agentic AI、オープンソース推論モデル（DeepSeekに代表される）、およびPhysical AIを強調しました。また、失業への不安に反論し、AIインフラ構築が大量の高給技能職を生み出すと主張。さらに、「言語」が各国の自然資源となった今、AIは発展途上国のデジタルデバイドを解消する絶好のツールであると指摘しました（ソース：AI前线）

🎯 动向

2025年のAIガバナンスはリアリズムへ回帰：終末リスクの回避から産業ポテンシャルの解放へ : 2025年、世界のAIガバナンスは深刻な転換を迎え、重心は「安全への不安」から「発展優先」へと移りました。EUはデジタル総合提案を通じて規則を簡素化し競争力を回復させようとしており、米国のトランプ政権は安全に関する行政命令を撤回して地方立法を制限、中国は実務的なアプリケーション志向のガバナンスを堅持しています。業界のコンセンサスは「発展こそが安全」へと変わり、ガバナンスは産業競争力に奉仕すべきものとなりました。同時に、合成データが「データ枯渇」を解決する鍵となり、オープンソースのガバナンスは「責任のセーフハーバー」制度の確立へと傾斜しています（ソース：腾讯研究院）

具身智能（Embodied AI）2026年展望：コンセプトのナラティブから現実のエンジニアリング価値のクローズドループへ : 2026年、具身智能は重要な分化期に入り、業界の重心はハードウェア性能の誇示から「高品質な実機データ」の収集へと移っています。自動車製造と物流の仕分けが最初の主戦場となりました。資本の動きにはマシュー効果が見られ、資金はGalbot（銀河通用）やAgibot（智元）などのトップメーカーに高度に集中しています。技術パスにおいては、「人間によるティーチング」式の遠隔操作プラットフォームを通じてデータを蓄積し、「脳」となるモデルのオープンソース化を推進することで、シーンが変わると機能しなくなる安定性の問題を解決し、継承・再利用可能な能力基盤の構築を目指しています（ソース：产业家）

VLA+モデルの進化：Rho-alphaが触覚感知とリアルタイム学習を導入 : Microsoftが発表したRho-alpha（ρα）は、視覚-言語-行動（Vision-Language-Action）モデルが「VLA+」時代に入ったことを示しています。従来のモデルとは異なり、触覚センサーを統合することで、ロボットは「手触り」を通じてコネクタの抜き差しや梱包などの精密な操作が可能になりました。さらに重要なのは、オンライン学習をサポートしており、人間によるリアルタイムの修正から継続的に進化できる点です。この適応性により、ロボットは非構造化環境における長期的タスクをより適切に処理できるようになります（ソース：TheTuringPost）

階層型言語モデル（RLMs）：LLMのコンテキストウィンドウの物理的限界を突破 : MIT CSAILが提案した階層型言語モデル（RLMs）は、プロンプトをPython REPLに変数としてオフロードすることで、LLMが膨大なコンテキストとシンボリックにやり取りすることを可能にします。RLMsは1000万トークン以上を処理でき、再学習の必要もありません。BrowseComp+などのテストでは、その精度はベースとなるLLMの2倍に達し、従来のTransformerアーキテクチャのコンテキストのボトルネックを完全に打破しました（ソース：TheTuringPost）

YOLO26リリース：アルゴリズム駆動によるリアルタイムビジョンの新境地 : Ultralyticsは、追加の推論コストゼロという理念を堅持したYOLO26を正式にリリースしました。バックボーンネットワークにセマンティックセグメンテーション損失を導入することで、インスタンスセグメンテーションの精度を大幅に向上させ、RLEによる回帰誤差のモデリングを導入してキーポイント検出の安定性を強化しました。同時にリリースされたYOLOE-26は、テキスト/視覚プロンプトによるゼロショット検出をサポートし、エッジ側でのオープンワールド知覚を強力に支援します（ソース：ZhihuFrontier）

🧰 工具

Claude Codeとそのエコシステムツール：開発者のワークフローを再構築 : Claude Codeを巡るエコシステムが急速に拡大しています。新たに登場したDevin Reviewは、アルファベット順ではなく論理的なグループ分けでPRの差分を表示し、開発者が複雑なコード変更を理解するのを助けます。Gas Townは、並列稼働する複数のClaudeインスタンスの階層化管理を実現。また、Claude Skillsは「YouTube動画をワンクリックで二ヶ国語の短尺動画に変換」といった複雑なワークフローのカスタマイズを可能にします。コミュニティでは、AI Codingの意義は開発者が創造する喜びを取り戻すことにあると議論されています（ソース：dotey, cognition）

GLM-4.7-Flashのローカライズにおける突破口：200Kコンテキストがわずか10GBのVRAMで動作 : vLLMの1行の変更により、GLM-4.7-FlashのKVキャッシュを大幅に最適化できることがコミュニティで発見されました。これにより、200Kのフルコンテキストモードでもわずか10GBのビデオメモリしか消費しません。これは、1枚のRTX 5090でこのSOTAモデルをスムーズに実行できることを意味します。さらに、llama.cppにはCUDAのFlash Attention修正がマージされ、コンシューマー向けグラフィックボードでの推論速度がさらに向上しました（ソース：algo_diver, Reddit）

Runway Gen-4.5のImage-to-Video：リアリズムの臨界点を超える : Runwayは、より長いストーリーテリング、精密なカメラコントロール、一貫したキャラクター表現をサポートするGen-4.5 Image-to-Video機能をリリースしました。1000人を対象としたブラインドテストでは、回答者の90%以上がGen-4.5で生成された動画と実写動画を区別できませんでした。この物理的なリアリズムの突破は、AI生成コンテンツが映画・広告レベルの商用基準に達したことを象徴しています（ソース：c_valenzuelab）

Higgsfield：マーケター向けのフルスタックAIビデオ制作ライン : 動画生成のユニコーン企業Higgsfieldは、ソーシャルメディアマーケターに特化したサービスにより急速に成長し、9ヶ月でARRが2億ドルを突破しました。その中核ツールであるCanvasは、絵コンテやカメラワークの設計をサポートし、脚本家、監督、カメラマンなどのマルチエージェント協調システムを内蔵しています。ユーザーは簡単な線画で動きの方向を指定するだけで動画を生成でき、プロの広告ワークフローに深く適合しています（ソース：36氪）

World Labs Marble：非JEPAパスの生成的世界モデル : フェイフェイ・リ氏が設立したWorld Labsは、NeRFとGaussian Splatting技術を用いて探索可能な3D世界を生成するMarbleプラットフォームを発表しました。これはフレームごとに生成される動画ではなく、永続的で編集可能なステートフルな3D環境です。ユーザーは数分でUnrealやUnity用の3Dアセットを生成・エクスポートでき、強力な空間知能を示しています（ソース：Reddit）

📚 学习

LLMの推論時間スケーリング：自己精緻化ループの実践ガイド : Sebastian Raschka氏は著書『Build a Large Language Model』の新章で、推論時間スケーリング技術について考察しています。単純な投票メカニズムとは異なり、このチュートリアルでは、モデルが自身の回答を反復的に批判し改善する「自己精緻化ループ（Self-refinement loop）」の実装方法を詳しく解説し、ゼロからのLog-probabilityスコアリング実装コードを提供しています（ソース：rasbt）

AAAI 2026優秀論文賞：因果学習とロボット知覚が焦点に : 第40回AAAI大会の受賞リストが発表されました。CaDyTは動的システムに対する連続時間因果発見手法を提案。ReconVLAは視覚的注視領域の再構成を通じてロボットの操作精度を大幅に向上させました。LLM2CLIPは、大規模モデルを利用してマルチモーダル表現を強化する方法を示しました。これらの研究は、現在のAI界が物理世界のモデリングとマルチモーダルなアライメントに深く注目していることを反映しています（ソース：aihub.org）

AI安全評価の新たな課題：「プライバシー崩壊」と「幻覚引用」への対応 : 最新の研究により、AI学術界と安全分野の懸念が明らかになりました。NeurIPS 2025の50本以上の論文で、AIが生成した虚偽の引用が含まれていることが判明しました。また、論文『Privacy Collapse』は、良心的な微調整（Fine-tuning）が最先端モデルのプライバシー規範に対する推論能力を喪失させ、高いパフォーマンスを維持しつつも深刻なプライバシーの脆弱性を露呈させる可能性があると指摘しています。これは、より自動化された学術審査と、より深いレベルでの安全評価メカニズムが必要であることを示唆しています（ソース：rbhar90, arXiv）

💼 商业

OpenAIが500億ドルの資金調達を模索：政府系ファンドが鍵に : OpenAIのCEOサム・アルトマン氏は中東の政府系ファンドと接触しており、最大500億ドルに達する新たな資金調達ラウンドを開始する計画です。これは、最先端モデルのトレーニングとインフラコストの爆発的な増加を反映しており、政府レベルの資金でなければ支えきれない現状を示しています。倒産の噂に直面しながらも、OpenAIはよりハイリスクな資金調達戦略を通じて、AGI競争における主導権を確保しようとしています（ソース：CNBC）

Feishu（Lark）とDingTalkのAIハードウェア大戦：録音デバイスの背後にある入口争い : FeishuはAnkerと共同でAI録音デバイス「録音豆」をリリースし、DingTalk A1と真っ向から対立しています。録音ハードウェアは企業ワークフローの「最初の接点」と見なされており、音声を蓄積・実行可能なデジタル資産に変換することを目的としています。DingTalkは録音をToDoタスクフローに変換することに重点を置いていますが、Feishuは「妙計（Minutes）」やナレッジベースとの深い連携を強調しています。この争いの本質は、物理世界におけるAI Agentの実行媒体を奪い合うことにあります（ソース：36氪）

昆仑万维（Kunlun Tech）のAI事業で赤字継続：垂直深耕とユーザー獲得コストの攻防 : 昆仑万维が発表した2025年の業績予告によると、赤字が続いています。同社は「汎用モデルは作らず、垂直分野を深耕する」という方針を堅持しており、ショートドラマプラットフォーム「DramaWave」やAI音楽モデル「Mureka」は顕著な売上を達成していますが、多額のマーケティング費用と研究開発投資が依然として収益化の壁となっています。これは、巨大IT企業がひしめく中で垂直型AIアプリケーションが独自の優位性を築くことの難しさを物語っています（ソース：36氪）

🌟 社区

AI写真の優勝が「信頼の危機」を誘発：創作プロセスの透明性が結果よりも重要に : 2026年初頭、ある写真コンテストの一等賞作品『騎楼旧光』が実はAI生成であったことが発覚し、公衆の怒りを買いました。コミュニティでは、AIが審査員の好む「美学の平均値」に迎合することを学習したため、従来のブラインド審査メカニズムが機能しなくなったと議論されています。これは単なる技術の逸脱ではなく、「真の感情の投入」に対する人間の根源的な一線に触れる問題です。コミュニティは、純粋な人間の創作とAI補助の部門を分けることや、芸術の境界を守るために創作ログの添付を求めています（ソース：36氪）

職場のAI異質化：生成された「感謝のメール」と消失する信頼 : 調査によると、従業員が管理者からの感謝メールがAI生成であると気づいた場合、信頼度は83%から40%へと急落することがわかりました。コミュニティではこの「偽りの誠実さ」が話題となっており、AIは効率を高める一方で、感情的なコミュニケーションにおいては隔たりを生む要因になると指摘されています。また、「責任の空白」に関する議論も増えています。Agentが生成するコードの規模が人間のレビュー能力を超えたとき、従来のCI/CDプロセスは構造的な機能不全に直面しています（ソース：Reddit, arXiv）

AI時代の「入口」という命題：宝刀か、それとも無用の長物か？ : スマートフォンのAIアシスタントが「入口」を奪い合う現象に対し、コミュニティでは深い反省がなされています。歴史が証明しているように、高頻度なコアシーンから切り離された「万能アシスタント」は、往々にして低頻度な「スイスアーミーナイフ」に成り下がります。真の入口は奪い取るものではなく、育つものです。サンドボックスをバイパスするGUI画面読み取り技術よりも、MCPプロトコルやA2A（Agent to Agent）連携を採用するモデルの方が期待されています。プライバシーと安全は依然として越えてはならない一線です（ソース：36氪）

💡 其他

思農（Sinong）：中国初の農業特化型大規模モデルが発表 : 戦略的なSTEM分野である農業に対し、中国初のオープンソース農業特化型大規模モデル「思農」が発表されました。このモデルは、農作物、畜産業、および農業経済データに基づいて詳細な微調整が行われています。コミュニティでは、垂直分野のLLMの価値は、単純なテキスト生成ではなく、非標準的な現象の「発見」と「検証」能力にあると指摘されています（ソース：teortaxesTex）

ミシガン州が反チャットボット法案を推進：青少年を「AI依存」から保護 : ミシガン州上院は、未成年者を対象とした「依存性のあるアルゴリズムフィード」を制限し、AI「コンパニオンロボット」を厳格に規制する一連の法案を提出しました。法案はオンラインサービスに対し「プライバシー・バイ・デフォルト」の設計を求め、AIシステムが自傷行為を助長したり、真の心理的サポートに取って代わることを禁止しています。これは、AIがもたらし得る社会的孤立や心理的操作に対する立法者の懸念を反映しています（ソース：Reddit）

HBM市場の深層解析：単なる希少性ではなく、プラットフォームに紐づく供給サイクル : HBM（高帯域幅メモリ）市場に対するコミュニティの解釈が修正されました。HBMの供給制限はウェハ不足によるものではなく、それが「プラットフォームに紐づいた」サプライチェーンであるためです。各世代の製品（HBM3/3E/4）は、極めて狭い期間内に特定のアクセラレータの検証を通過しなければなりません。この波のような製品サイクルは、将来の収益が次世代プラットフォームの検証を継続的に通過できるかどうかにかかっていることを意味します（ソース：teortaxesTex）

🔥 フォーカス

🎯 动向

🧰 工具

📚 学习

💼 商业

🌟 社区

💡 其他

関連タグ

Related Posts

AI日報 – 2026-07-21

AI日報 – 2026-07-20

AI日報 – 2026-07-19