キーワード:Gemini 3 Flash, GPT-5.2, AIモデル, 人型ロボット, MiMo-V2-Flash, テンセント大規模モデル, SAMオーディオ, マルチモーダル推論, オーディオ編集AI, 具現化ロボット生産能力, オープンソース大規模モデル, AI健康大規模モデル
🔥 注目
GoogleがGemini 3 Flashを発表 : GoogleはGemini 3 Flashを発表しました。これは、極めて低コストで最先端のインテリジェンスを提供し、価格はPro版の25%に過ぎませんが、MMMU-Pro、SWE-bench Verifiedなどの主要ベンチマークテストでGemini 3 Proを上回り、速度は3倍速いです。このモデルは反復的な開発向けに設計されており、Gemini 3 Proに近いプログラミング性能と低遅延性を備え、マルチモーダル推論をサポートし、ビデオ分析、データ抽出、視覚的質問応答に利用できます。Gemini 3 Flashは全面的に公開されており、一般ユーザーはGeminiアプリとGoogle検索のAIモードで利用でき、開発者はAPIを通じて統合できるため、AIが日常のアプリケーションやビジネスシステムにさらに広く組み込まれることが期待されます。(ソース:36氪, 36氪)

OpenAIがGPT-5.2シリーズモデルを発表 : OpenAIは、Google Gemini 3との競争に対応するため、Pro、Thinking、Instantを含むGPT-5.2シリーズモデルを発表しました。GPT-5.2は、ARC-AGI-1やARC-AGI-2などの抽象的な視覚パズルベンチマークテストで新記録を樹立し、特に計算効率が大幅に向上し、コストはGPT-5.1の1/390にまで削減されました。モデルは調整可能な推論レベル(x-highを含む)を提供し、入力制限を拡張するためのコンテキスト要約をサポートします。このリリースは、コード生成、スプレッドシート、プレゼンテーション作成などの専門タスクの効率向上を目的としており、複雑な推論タスクに直面した場合の経済的実行可能性が大幅に向上したことを強調しています。(ソース:DeepLearning.AI Blog)

AIモデルが未解決の数学問題を自律的に解決 : GPT-5は、IMProofBenchベンチマークテストに提出された未解決の数学問題を初めて自律的に解決し、人間のプロンプトや介入なしに完全かつ正しい証明を提供しました。このブレークスルーは、列挙幾何学への小規模ながらも斬新な貢献であり、AIモデルの複雑な数学的推論と問題解決能力における大きな進歩を示すものです。この出来事は、数学研究におけるAIの可能性についてコミュニティで幅広い議論を巻き起こし、AIが将来、より多くの科学分野でより積極的な発見の役割を果たす可能性を示唆しています。(ソース:SebastienBubeck, kevinweil, gdb, OfirPress, SebastienBubeck)

MetaがSAM Audioを発表 : MetaはSAM Audioを発表しました。これは、ユーザーが複雑なオーディオミックスから音声を分離・編集できる初の統一AIモデルです。このモデルは、Photoshopの切り抜きのように「音声を切り抜く」ことができ、テキスト、視覚、時間範囲のプロンプトを通じて、曲中のギターの分離、交通騒音のフィルタリング、ポッドキャストからの犬の鳴き声の除去などの機能を実現します。この革新は、オーディオ編集プロセスを根本的に変革し、テキストや画像を処理するのと同じくらいシンプルにし、プロのミキシング知識の敷居を下げ、オーディオコンテンツ作成の普及と効率向上を促進することが期待されます。(ソース:ylecun, ylecun, dotey)
🎯 動向
云澎科技がAI+健康新製品を発表 : 云澎科技は帥康、創維と提携し、「デジタル化された未来のキッチンラボ」とAI健康大モデルを搭載したスマート冷蔵庫を含むAI+健康新製品を発表しました。AI健康大モデルはキッチン設計と運用を最適化し、スマート冷蔵庫は「健康アシスタント小雲」を通じてパーソナライズされた健康管理を提供します。これは、AIが日常の健康管理とスマートホーム分野に深く応用されることを示しており、スマートデバイスを通じてカスタマイズされた健康サービスを提供し、生活の質を向上させることが期待されます。(ソース:36氪)

ヒューマノイドロボット業界が生産能力のボトルネックに直面 : 2025年、具身ロボット業界は爆発的な人気から沈静化へと移行し、受注額は35億元を超えたものの、出荷台数は1000台未満にとどまり、生産能力のボトルネックが浮き彫りになりました。智元、優必選などの大手企業は受注が急増していますが、量産能力は依然として数百台レベルから千台レベルへの移行段階にあります。CtoC市場での普及は困難で、実用的なシナリオは単一であり、価格は高止まりしており、販売台数は1000台未満にとどまっています。業界は、マラソン大会でロボットが示した安定性の欠如のように、技術誇示は十分だが実用性に欠けるという困惑に直面しています。多くの課題があるにもかかわらず、政策支援と資本の期待があり、業界は「技術的に可能」から「信頼できる商品」への転換期にあります。(ソース:36氪, 36氪)

美図公司のAI変革と課題 : 美図公司はAIの波の中でツールを主軸に戻し、美図秀秀、美顔カメラなどのCtoC製品と、美図設計室、開拍などのBtoB生産性ツールを通じて変革を実現しました。RoboNeoはAI Agentプラットフォームとして、サードパーティモデルと自社開発のMiracle Visionを統合し、「AI生成+手動修正」を通じてAI導入の課題解決を目指しています。しかし、RoboNeoのユーザー定着率は芳しくなく、特にGoogle Nano Bananaなどの競合製品の登場により、海外BtoB市場の成長の不確実性が高まっています。それにもかかわらず、美図は2億MAUのトラフィック基盤とチームの革新的な活力により、垂直SaaS分野で依然として生き残る余地があり、将来的には技術と製品の融合を深掘りし、大規模モデル競争に対応していくでしょう。(ソース:36氪)

XiaomiがMiMo-V2-Flash大規模モデルを発表 : XiaomiはMiMo-V2-Flash大規模モデルを正式にオープンソース化し、309Bのパラメータ規模でオープンソースのトップティアに仲間入りしました。これにより、2.6倍の推論高速化を実現しつつ、最先端のモデル効果とデプロイコストを両立させています。このモデルはSWE-Bench Verifiedコード評価で73.4%の高得点を獲得し、DeepSeek-V3.2とKimi-K2 Thinkingを上回り、Agent能力においても卓越した性能を発揮しています。5:1混合アテンションメカニズム、学習可能なアテンションプーリングバイアス、MTP多層Token予測、MOPD多教師オンライン戦略蒸留などの技術を採用し、効率と長文理解を大幅に向上させています。MiMo-V2-Flashは実際のプログラミングシナリオで非常に高い完成度を示し、高いEQを持つ人間らしいインタラクション能力も備えており、Xiaomiの「物理世界AGI」への転換という野心を示しています。(ソース:36氪)

Tencentが大規模モデル研究開発アーキテクチャを調整 : Tencentは大規模モデルの研究開発アーキテクチャを調整し、元OpenAI研究員の姚順雨を「CEO/総裁オフィス」のチーフAIサイエンティストに任命しました。彼は総裁の劉熾平に直接報告し、AI Infra部および大規模言語モデル部の責任者も兼任します。この動きは、Tencentの計算能力、データ、エンジニアリング能力における総合的な競争力を強化し、これまで大規模モデルの研究開発で相対的に遅れていた状況を変えることを目的としています。姚順雨の加入と新部門の設立は、TencentがAIを会社の核となる戦略的地位に引き上げ、基礎モデルを核とする研究開発システムを構築し、ByteDanceやAlibabaなどの競合他社がAIアプリケーションやモデル能力で突きつける課題に対応していくことを示しています。(ソース:36氪, 36氪, [36氪](https://www.36kr.com