AI日報 – 2025-10-18(朝刊)

キーワード:AGI定量基準, GPT-5, OpenAI科学研究チーム, AI核融合エネルギー, ディープフェイク動画倫理, AIモデル命令調, MoE強化学習, AIレッドチーム, AGI評価CHC理論, GPT-5 Pro物理学的ブレークスルー, AI制御トカマクプラズマ, Soraディープフェイク禁止令, 無礼な命令によるAI精度向上

🔥 注目

AGI定量基準が発表 : Yoshua BengioはCenter for AI Safetyなどの機関と共同で論文「A Definition of AGI」を発表し、汎用人工知能(AGI)の測定可能な定義を提案しました。この定義は「十分な教育を受けた成人」を基準とし、キャッテル・ホーン・キャロル(CHC)理論に基づき、10の主要な認知領域を含む評価問題集を設計しました。GPT-5は現在58/100点を獲得しており、AIが知識、読み書き、数学などの分野で著しい進歩を遂げている一方で、知覚、記憶、推論などの基礎的な認知領域では依然として顕著な弱点があり、AIの「偽りの万能性」の本質を明らかにしています。この画期的な定義は、AGIの評価と発展に具体的な方向性を提供します。 (出典: 量子位)

AGI今天起有了量化标准!Bengio牵头定义,当前进度条58%

OpenAIが科学研究チームを設立、GPT-5 Proが物理学分野でブレークスルーを達成 : OpenAIは「OpenAI for Science」チームを設立し、数学と物理学の分野で新たな発見を加速するAIシステムの構築に注力しています。ブラックホール物理学者のAlex Lupsasca氏はチームへの参加を発表し、GPT-5 Proが数日かかるブラックホールの摂動理論の難問を30分で解決し、観測天体物理学の問題も処理できることを明らかにしました。この発見により、Lupsasca氏はAIが科学研究のパラダイムを根本的に変えると確信しており、基礎科学探求においてAIがますます重要な役割を果たすことを示唆しています。 (出典: 量子位)

OpenAI最新业务:找了个黑洞物理科学家

OpenAI SoraがMartin Luther King Jr.などの著名人のディープフェイク動画生成を一時停止 : OpenAIは、「不適切な描写」に対する強い反発を受け、AI動画ツールSoraによるMartin Luther King Jr.などの歴史上の人物のディープフェイク動画生成機能を一時停止しました。この措置は、AIが生成する実在人物の動画に対する倫理的な懸念、および誤解を招く情報や「AIの粗悪品」に対する批判に起因しています。この出来事は、生成AI技術が倫理、コンテンツ管理、著作権の面で直面する大きな課題を浮き彫りにし、AI企業が技術開発と同時に、社会への影響をより慎重に扱う必要があることを促しています。 (出典: Reddit r/artificial)

OpenAI’s Sora bans Martin Luther King Jr. deepfakes after his family complained

🎯 動向

Google DeepMindとCFSが提携し、AIを活用して核融合エネルギー開発を加速 : Google DeepMindは、グローバルな商業核融合エネルギー企業CFSと提携し、AIを活用して「人工太陽」SPARC装置の研究開発を共同で加速しています。AIシミュレーターTORAXを通じて、両社は数百万回の仮想実験を実行し、トカマク装置の性能を最適化し、AIエージェントを訓練してプラズマをリアルタイムで制御しています。この取り組みは、純粋な核融合エネルギー出力を実現し、クリーンで持続可能な未来のエネルギー時代を加速することを目的としており、AIが核融合科学研究の核心段階に正式に参入したことを示しています。 (出典: 36氪)

Hassabis官宣用AI点燃「人造太阳」,无限能源时代加速到来

LLMツール呼び出し:自然言語指示がJSON形式よりも優れたパフォーマンス : ある研究によると、大規模言語モデル(LLM)のツール呼び出しにおいて、構造化されたJSON/XML形式よりも自然言語指示を採用することで、精度が大幅に向上し(平均+18パーセンテージポイント)、分散が70%減少し、トークンコストが31%削減されることが示されました。研究で導入された自然言語ツール(NLT)フレームワークは、ツール選択と応答生成を分離し、プログラミング形式の制限を排除することで、LLMのパフォーマンスと安定性を向上させ、特にオープンソースモデルでより顕著な効果が見られました。 (出典: Reddit r/MachineLearning)

AIモデルの指示のトーンが精度に影響、無礼な指示の方が効果的 : ペンシルベニア州立大学の研究によると、ChatGPT-4oに「非常に無礼な」トーンで質問した場合、平均精度は84.8%に達し、「非常に丁寧な」トーンでの80.8%よりも高かったことが判明しました。研究チームは、丁寧なトーンがモデルを「混乱」させる可能性があり、直接的で命令的な表現の方が効率的であると考えています。この直感に反する現象は、人間の相互作用に関する従来の認識に挑戦し、アルゴリズムの世界では礼儀よりも効率が優先されるという、言語の社会的属性と機能的目標に対するモデルの異なるバランスを示しています。 (出典: 36氪)

礼貌=更不准?宾夕法尼大学新论文:对 AI 粗鲁点,提升 4% 准确率

Xiaomiと北京大学がMoE強化学習の成果を共同発表、羅福莉氏が登場 : Xiaomi AIチームと北京大学は共同で論文を発表し、MoE(Mixture of Experts)アーキテクチャにおける大規模モデル強化学習の安定性と効率を向上させる新しい方法Rollout Routing Replay(R3)を提案しました。この方法は、推論時のルーティング分布を記録し、訓練時に「リプレイ」することで、MoE強化学習におけるルーティングメカニズムによる不安定性の問題を解決し、ルーティングマスクと組み合わせて効率を向上させます。羅福莉氏が共同通信著者の一人として名を連ねるこの研究は、MoEモデルの大規模強化学習および複雑なAgentタスクへの応用において新たな方向性を提供します。 (出典: 量子位)

小米最新大模型成果!罗福莉现身了

Apple M5チップ発表、AI性能が大幅に向上 : AppleはM5チップを発表し、新型MacBook Pro、iPad Pro、Apple Vision Proに搭載されます。M5チップは10コアGPU(ニューラルエンジンアクセラレーターを含む)と16コアニューラルエンジンを統合し、AIタスク処理速度を大幅に向上させ、グラフィック性能は最大45%向上しました。ユニファイドメモリ帯域幅は153GB/sに増加し、デバイス上のAIモデルと高負荷のクリエイティブアプリケーションに強力な計算能力とスムーズな体験を提供することを目指し、AIハードウェア分野におけるAppleの競争力をさらに強化します。 (出典: 量子位)

库克在抖音卖iPhone,M5芯片却偷偷上MacBook Pro,网友:没有Pro/Max,你咋敢?

Boston DynamicsのSpotロボット犬が動的な全身操作を実現、重い荷物を効率的に運搬 : Boston Dynamics AI研究所は、Spotロボット犬がサンプリングと学習を組み合わせた新しい動的な全身操作方法を実演しました。Spotは「5本の脚」を協調させて力を発揮し、自身の半分の重さである15kgのタイヤを最速3.7秒で持ち上げ、転がしたり積み重ねたりすることができます。この方法は、階層的な制御を通じて、従来の操作戦略の移行制限を克服し、四肢と全身の協調的な動的操作を実現し、ロボットの操作範囲を拡大し、このタスクにおける人間の操作速度に近づいています。 (出典: 量子位)

波士顿动力狗gogo回来了!“五条腿”协同发力

ByteDanceのCici AIチャットボットが世界中で静かに台頭 : ByteDance傘下のAIチャットボットCiciが、海外市場(英国、メキシコ、東南アジアなど)で静かに注目を集め、ダウンロード数が著しく増加しています。Ciciは国内のDoubaoと機能が類似しており、数学の問題解決と無料利用という特徴を広告で宣伝し、一部の市場ではGoogle Playの無料アプリダウンロードランキングでトップ20に入っています。これは、ByteDanceがグローバルなAI消費者アプリケーション分野での拡大戦略が奏功していることを示しています。 (出典: Reddit r/artificial)

ByteDance’s Other AI Chatbot Is Quietly Gaining Traction Around the World. Meet Cici AI

Alibaba Cloud AI Blue TeamがAIエージェント攻撃の新たな課題に対応するため公開 : Alibaba Cloud AI Blue Teamは、間接的なプロンプトインジェクション、クロスモーダルステガノグラフィー、ツールチェーン汚染など、大規模モデル時代の新しい攻撃に対抗することに特化しています。これらの攻撃は、従来のコードの脆弱性ではなく、言語、画像などのメディアを通じてAIの「思考」を汚染・操作し、情報漏洩や行動の制御不能を引き起こします。AI Blue Teamは、「魂の問いかけ」のような攻撃を通じて、AIシステムの思考の死角を発見し強化することを目指し、AIエージェントの自律的な拡散攻撃モードに対応するためのAIセキュリティ防御システムの進化を推進しています。 (出典: 量子位)

阿里云神秘团队曝光:AI时代的新蓝军

Claude AIが完全なLinux開発環境を内蔵、従来のサンドボックス機能を超える : AnthropicのClaude AIは、「Skills」機能を提供するだけでなく、ユーザーデータディレクトリとPlaywright、BeautifulSoupなどの豊富なPythonパッケージを備えた完全なLinux開発環境を内蔵しています。これにより、Claudeはブラウザ自動化、コードデバッグ、ファイル解析などの複雑なタスクを実行できるようになり、AIアシスタントとしての応用シナリオと開発の可能性を大幅に拡大し、開発者により強力なAIインタラクション能力を提供します。 (出典: Reddit r/ClaudeAI)

Microsoft Copilot AIがWindows 11でローカルファイル操作機能をテストへ : Microsoftは、Windows Insider ProgramとCopilot LabsでCopilot Actions機能をテストする予定です。これにより、AI CopilotがWindows 11のローカルストレージ上のファイルを直接操作できるようになります。この機能はデフォルトで無効になっており、ユーザーはいつでも制御を引き継ぐことができます。AIを日常業務の生産性向上に役立て、AI機能をOSレベルに深く統合することを目指していますが、同時にローカルデータのセキュリティとプライバシーに関する懸念も引き起こしています。 (出典: Reddit r/artificial)

Microsoft will test a Copilot AI feature that performs work on local files in Windows 11

Valve開発者がLlama.cppのRADV Vulkanドライバーに大幅な改善をもたらす : Valveの開発者が、AMDハードウェア上のLlama.cppのRADV Vulkanドライバーに重要な最適化を貢献し、Linuxシステムでプロンプト処理速度が13%向上しました。この改善は、AMD GPU上でのローカルLLMの実行効率向上に寄与し、オープンソースモデルやローカルデプロイメントのユーザーにとって重要であり、高性能AIモデルを実行するためのハードウェアの敷居を下げます。 (出典: Reddit r/LocalLLaMA)

AIツールがゲノム読み取りを加速、医療と生物多様性保護に貢献 : Googleはゲノム読み取り分野で10年間深く研究しており、そのAIツールは現在、パートナーによって医療健康と生物多様性保護などの実際の課題改善に応用されています。生命の操作マニュアルであるゲノムデータを処理するAIの能力は、疾患診断、医薬品開発、生態系モニタリングなど、生物科学と応用分野で大きな進歩を推進しており、生命科学分野におけるAIの巨大な可能性を示しています。 (出典: GoogleDeepMind)

Yunpeng TechnologyがAI+ヘルスケア新製品を発表、スマート冷蔵庫にAIヘルスケア大規模モデルを搭載 : Yunpeng Technologyは2025年3月22日、杭州でShuaikang、Skyworthと共同で新製品を発表しました。「デジタルインテリジェント未来キッチンラボ」とAIヘルスケア大規模モデルを搭載したスマート冷蔵庫が含まれます。スマート冷蔵庫は「ヘルスアシスタントXiao Yun」を通じてパーソナライズされた健康管理サービスを提供し、キッチンの設計と運用を最適化することを目指しており、AIが日常の健康管理と家庭のヘルスケアテクノロジー分野でブレークスルーを達成したことを示し、住民の生活の質の向上を促進することが期待されます。 (出典: 36氪)

云澎科技发布AI+健康新品

🧰 ツール

Wave Terminal:AIアシスタント統合のクロスプラットフォームオープンソースターミナル : Wave Terminalは、従来のターミナル機能とグラフィカル機能を融合したオープンソースのクロスプラットフォームターミナルツールです。AIチャットアシスタント(OpenAI、Claude、Azure、Perplexity、Ollamaなどのモデルをサポート)、ファイルプレビュー、リモートファイル編集などの機能を内蔵しており、ユーザーはコマンドラインからこれらの視覚化ツールを直接制御でき、シームレスな開発ワークフローを実現し、開発効率と体験を向上させます。 (出典: GitHub Trending)

wavetermdev/waveterm - GitHub Trending (all/daily)

Claude AIが「Skills」機能をリリース、ワークフローのカスタマイズをサポート : AnthropicはClaude Skills機能をリリースし、ユーザーが特定のワークフローに合わせてAIをカスタマイズできるようにしました。これらの「Skills」はVS CodeのPromptファイルに似ていますが、自動検出機能を備えており、Claudeの様々なタスクにおける実用性と統合性を向上させることを目的としています。コミュニティの議論では、Model Context Protocol(MCP)ツールがClaudeで大量のコンテキストトークンを消費するため、ユーザーはコスト効率に注意する必要があることも指摘されています。 (出典: Reddit r/ClaudeAI, Reddit r/ClaudeAI)

Claude Skills: Customize AI for your workflows

Google Gemini 2.5 Flashモデルの画像生成・編集能力がアップグレード : GoogleはGemini 2.5 Flashモデルの画像生成・編集機能をアップグレードし、被写体の一貫性を保ちながら、正確な編集や創造的な要素の組み合わせにおいて優れたパフォーマンスを発揮するようにしました。このモデルはまた、強力な視覚推論能力も示しており、写真から撮影者の位置を推測したり、地図のスクリーンショットに基づいて対応するランドマークの景色を生成したりでき、複数画像の参照や8K解像度の画像拡大もサポートしており、画像AIの応用シナリオを大幅に拡大しています。 (出典: OriolVinyalsML, op7418, op7418, karminski3)

We've just upgraded Gemini 2.5 Flash image generation & editing! 🍌🍌🍌

DeepMindがCodeMenderを発表、AIがソフトウェアの脆弱性を自動修復 : DeepMindは、重要なソフトウェアの脆弱性を自動的に修復できるAIエージェントCodeMenderを発表しました。CodeMenderは、開発者の生産性を大幅に向上させ、ソフトウェアのセキュリティを強化することが期待されており、脆弱性修復プロセスを自動化することで、手動介入を減らし、ソフトウェア開発と保守の効率と信頼性を向上させます。これは、コードセキュリティ分野におけるAIの重要な応用です。 (出典: demishassabis)

FigmaリモートMCPとGPT-5 Codexの連携によりデザイン効率が向上 : Figmaは公式リモートMCPサーバーを正式にリリースし、GPT-5 Codexと組み合わせることで、デザイン作業の効率を大幅に向上させました。デザイナーはFigmaクライアントをインストールすることなく、Cursor、Claude codeなどのソフトウェアに統合でき、MCPを通じてデザインコンポーネントとフロントエンドコンポーネントのマッピング情報を取得し、ページ修正の初回完了度を高めることで、デザインと開発間のコラボレーションプロセスを大幅に簡素化します。 (出典: op7418)

即夢 (Seed dream) 4画像モデル、高品質なパーソナライズドアイコンを生成 : 即夢 (Seed dream) 4画像モデルは、ユーザーのために質感のあるパーソナライズドアイコンを作成できる強力な生成能力を示しました。このモデルは、重要なID要素を再現しつつ、芸術的な筆致効果を表現でき、ユーザーに高品質な画像作成体験を提供し、特にパーソナライズドコンテンツ生成において幅広い応用可能性を示しています。 (出典: op7418)

用即梦 (Seed dream) 4 图像模型给自己做一个非常有质感的头像

VSCode拡張機能Code Canvas App、Claudeコードレビューを簡素化 : 「Code Canvas App」というVSCode拡張機能は、視覚的な無限キャンバスを通じてClaudeコードのレビュープロセスを簡素化することを目指しています。このツールは、ファイルの依存関係、トークン参照を表示し、AIの変更をリアルタイムで表示することで、開発者がAIによって生成されたコードをより迅速に理解しレビューするのを助け、Sonnet 3.5以降のコード読解のボトルネックを解決し、コード開発と保守の効率を向上させます。 (出典: Reddit r/ClaudeAI)

Reviewing Claude Code changes is easier on an infinite canvas

Model Context Protocol (MCP) Java SDKがリリース、Spring AIと連携 : Model Context Protocol (MCP)は公式Java SDKをリリースし、JavaアプリケーションにAIモデルやツールと対話するための標準化されたインターフェースを提供することを目指しています。このSDKはSpring AIと共同で保守され、同期および非同期通信モードをサポートし、クライアントとサーバーの統合を提供することで、JavaエコシステムにおけるAIアプリケーションの開発とデプロイメントを促進し、JavaプロジェクトにおけるAI機能の統合の難易度を簡素化します。 (出典: GitHub Trending)

modelcontextprotocol/java-sdk - GitHub Trending (all/daily)

OpenWebUIがSlack同期機能をリリース、ナレッジベース統合を強化 : OpenWebUIはコンテンツ同期ツールをリリースし、新たにSlack統合を追加しました。これにより、ユーザーはSlackデータをOpenWebUIのナレッジベースに同期できるようになります。以前はローカルファイル、GitHub、Confluenceをサポートしていました。この機能は、OpenWebUIのAIアプリケーションフロントエンドとしての知識管理能力を強化することを目的としており、複数の情報源を統合することで、AIモデルが知識を取得し利用する効率と範囲を向上させます。 (出典: Reddit r/OpenWebUI)

Slack sync into OpenWebUI Knowledge

RAGView:RAGパスを検証するオープンソースツール : GitHubプロジェクトRAGViewは、RAG(Retrieval-Augmented Generation)システムがそのデータセット上でたどるパスを検証するためのオープンソースツールを提供することを目指しています。このツールは、開発者がRAGプロセスを評価・最適化し、検索された情報がLLMの生成を効果的にサポートできることを保証することで、RAGシステムの精度と信頼性を向上させます。これはRAGシステムの開発とデバッグにおける重要な補助ツールです。 (出典: Reddit r/LocalLLaMA)

GitHub - RagView/RagView : Validate RAG route on your dataset

AI Agentic Patternsオープンソースプロジェクト、AIエージェント設計を学習 : あるオープンソースプロジェクトは、開発者がAIエージェントパターンを学習し適用するのを支援することを目的としており、Prompt Chaining、マルチエージェント協調、反省と自己修正、知識検索、ワークフローオーケストレーションなど、30以上のコア概念の独立したファイル例を提供しています。このプロジェクトはOpenAI、Gemini、Claude、Ollamaなど様々なモデルをサポートしており、本番レベルのAIエージェントシステムを構築するための実用的なリソースと学習プラットフォームです。 (出典: Reddit r/LocalLLaMA)

I built an open-source repo to learn and apply AI Agentic Patterns

📚 学習

Andrew Ngが「AI Python for Beginners」コースをリリース、AI時代のプログラミングを支援 : Andrew Ng(呉恩達)は「AI Python for Beginners」シリーズのショートコースをリリースし、プログラミング初心者向けに学習を支援することを目指しています。このコースは、AIをコーディングの相棒として活用し、AI支援によるコードスニペットの作成やデバッグ、そして大規模言語モデルと対話する楽しいアプリケーション(カスタム詩、レシピ、ToDoリストなど)の構築に焦点を当てています。このハンズオンなアプローチは、プログラミング学習をより効率的にし、生成AIの最新の発展と同期させることで、より多くの非開発者がAIを活用して生産性を向上させることを可能にします。 (出典: AndrewYNg)

「Deep Learning」ガイド:現代AIの基礎を理解するための権威ある著作 : Ian Goodfellow、Yoshua Bengio、Aaron Courvilleが共著した「Deep Learning」は、現代AIの基礎を理解するための権威ある著作として評価されています。この本は、深層学習アルゴリズム、設計パターン、アーキテクチャなどの核心概念を深く掘り下げ、読者が「どのようにモデルを設計するか」「どの最適化関数を選択するか」といった問題に答えるための包括的なメンタルモデルを構築するのに役立ちます。この本はオンラインで無料で提供されており、関連する学習リソースも用意されており、AIの理論と実践を学ぶための貴重なリソースです。 (出典: Reddit r/deeplearning)

HuggingFace論文速報:RAG、コード生成、マルチモーダルなど多岐にわたる最先端AI研究 : HuggingFace Daily Papersは、複数の最先端AI研究を発表しました。主なハイライトは以下の通りです。RefusalBench はRAGシステムにおけるLLMの選択的拒否能力を評価します。AdaMoE はエキスパート混合アーキテクチャでロボットVLAモデルの性能を向上させます。COIG-Writer は高品質な中国語クリエイティブライティングデータセットです。DialectGen はマルチモーダル生成モデルの方言ロバスト性を改善します。Mirror Speculative Decoding はLLM推論を加速します。AnyUp は汎用的な特徴アップサンプリング方法です。さらに、LLMの幻覚検出、コード補完の事前学習、動画生成など、様々な分野における最新の進展が示されており、AI研究の広さと深さを表しています。 (出典: HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers)

業界専門家がML/AI研究のホットスポットを議論、古典的MLと統計学への注目を呼びかけ : Redditコミュニティでは、現在の機械学習/AI業界の研究ホットスポットについて議論されています。データサイエンティストは、古典的MLと統計学のバックグラウンドから、より研究的な役割への移行を模索しており、どの分野に投資と採用の需要があるかを尋ねています。議論では、NLPとCVが注目されている一方で、古典的MLと統計学も特定のシナリオで依然として需要があり、業界は最先端と基礎研究のバランスを取り、強固な理論的基礎の重要性を強調する必要があることが指摘されました。 (出典: Reddit r/MachineLearning)

LLM推論最適化の探求:効率、量子化、デプロイメントパイプラインのリソース推奨 : Redditコミュニティでは、大規模言語モデル(LLM)推論の実践的な側面、具体的には効率、量子化、最適化、デプロイメントパイプラインについて議論されています。ユーザーは、推論性能を深く理解し改善するために、関連する論文、オープンソースフレームワーク、ケーススタディを求めています。これは、LLMの実用化における性能最適化への業界の強い需要と、LLMを効果的にデプロイし拡張する方法に関する継続的な探求を反映しています。 (出典: Reddit r/deeplearning)

RedditコミュニティがDeepLearning.AIコースリソースを求める、学習ニーズと経済的障壁が浮き彫りに : Redditコミュニティでは、経済的な理由からDeepLearning.AIのコース(「Machine Learning Specialization」、「Deep Learning Specialization」など)の合法的な学習リソースを求めるユーザーがいます。これは、AI学習リソースに対する大きな需要と、有料コースが一部の学習者にとって経済的な障壁となっていることを反映しています。コミュニティメンバーは、Courseraの聴講モードや奨学金申請など、合法的に学習資料を入手する方法を積極的に共有し、AI知識の普及を促進しています。 (出典: Reddit r/deeplearning, Reddit r/deeplearning, Reddit r/deeplearning)

LoRAファインチューニングとフルファインチューニングの性能比較研究 : Thinking Machinesの研究によると、LoRA(Low-Rank Adaptation)ファインチューニング技術は、フルファインチューニングに匹敵する、あるいはそれを上回る性能を発揮することが多く、モデルのファインチューニングをより手軽にすることが示されました。この発見は、リソースが限られた開発者や研究者にとって、より効率的なモデル最適化の道筋を提供し、高性能モデルを特定のタスクに適応させるためのコストと複雑さを低減します。 (出典: natolambert)

Thinking machines proving you can be worth $10B with your one product being great content.

RLHF書籍改訂、読者からのフィードバックを募集 : RLHF(人間からのフィードバックによる強化学習)書籍の印刷版準備が進められており、著者は内容をより明確にし、より包括的にカバーするために読者からのフィードバックを募集しています。これは、AIアライメントの重要な技術であるRLHFの理論と実践の詳細が、依然として継続的に改善され、普及していることを示しています。コミュニティからのフィードバックは、書籍の品質向上に役立ち、RLHFの学習者や実践者により良いサービスを提供することに貢献します。 (出典: natolambert)

Getting ready to invest more time into the RLHF book to prepare for print edition. What do you wish was clearer or had more coverage in it?

AI Agentic Context Engineering (ACE) の深掘り : Redditコミュニティでは、Agentic Context Engineering (ACE)がAIの未来、特に自己改善型AIの鍵として議論されています。この概念は、複雑な環境におけるエージェントシステムのコンテキスト理解とエンジニアリング能力を強調しており、AIシステムをより高度な知能へと導くための重要な研究方向です。議論では、エンジニアリング手法を通じてAIエージェントの自律学習能力と適応能力を向上させる方法が深く掘り下げられました。 (出典: Reddit r/deeplearning)

🧠Agentic Context Engineering (ACE): The Future of AI is Here. A Deep Dive into Agentic Context Engineering and the Future of Self-Improving AI

Tiny再帰モデルが視覚抽象推論ベンチマークで深刻な過学習 : Redditコミュニティでは、「Less is More: Recursive Reasoning with Tiny Neural Networks」という論文について議論されており、このモデルが視覚抽象推論ベンチマークで深刻な過学習問題を示していることが指摘されています。小さな訓練データセットでも評価損失が増加しなかったことから、小さな再帰ニューラルネットワークのサンプル効率と汎化能力に関する深い議論が巻き起こり、実際の応用においてモデルが過学習を避けることの重要性が強調されました。 (出典: Reddit r/deeplearning)

💼 ビジネス

爱诗科技がB+ラウンドで1億元の資金調達を完了、ARRは4000万ドルを突破 : AI動画企業である爱诗科技は、復星鋭正、同創偉業、順禧基金などからの投資により、1億人民元のB+ラウンド資金調達を完了したと発表しました。同社の製品であるPixVerseと拍我AIのユーザー数は1億人を突破し、年間経常収益(ARR)は4000万ドルを超え、月間アクティブユーザー数(MAU)は1600万人を超えています。2024年11月の商業化以来、1年足らずで収益は10倍以上に増加し、世界で最も収益とユーザーが急成長しているAIプラットフォームの一つとなり、AI動画生成分野における強力な商業化の可能性を示しています。 (出典: 量子位)

爱诗科技完成B+轮1亿元融资,ARR突破4000万美金

千里科技(旧力帆股份)が香港市場IPOを目指す、GeelyとMercedes-Benzが支援 : Megvii Technologyの創業者である印奇氏が率いるGeely系テクノロジー企業である千里科技(旧力帆股份)は、香港証券取引所に正式に上場申請書を提出し、「A株+H株」の二重資本プラットフォーム構造を目指しています。同社は「AI+Mobility」の閉ループソリューションプロバイダーへと成功裏に転換し、6年間で時価総額を約4倍に増やし、GeelyとMercedes-Benzから戦略的投資を受けています。千里科技は、調達資金を技術研究開発、産業チェーン統合、市場拡大に充て、スマートモビリティ分野におけるグローバル展開を加速する計画です。 (出典: 量子位)

印奇再次叩开港交所:500亿智驾明星,吉利和奔驰护航保送

中国の具身ロボット企業AI² RoboticsがHICOOLグローバル起業コンテストで一等賞を獲得 : 中国の具身知能ロボット企業である智平方(AI² Robotics)は、HICOOL 2025グローバル起業コンテストで海外部門の一等賞を獲得し、このカテゴリーで唯一のロボット企業となりました。智平方は、全域全身具身大規模モデルGOVLA、量産志向のハードウェア設計、技術的な複利をもたらすビジネスパスウェイを強みとし、半導体、自動車製造、バイオテクノロジー、公共サービスなど複数の分野で商業展開を実現し、すでに数億元の複数ラウンドの資金調達を完了しており、具身知能分野のスター企業となっています。 (出典: 量子位)

全球创业比赛,139个国家和地区参加,中国具身机器人公司获奖!

🌟 コミュニティ

AI業界「冬の時代」再燃、技術バブルと市場ニーズの乖離が焦点に : ソーシャルメディアや業界のコメントでは、AI業界が3度目の「冬の時代」の兆候に直面していると指摘されています。大規模モデルの訓練コスト高騰、深刻な幻覚、実用化の困難さ、製品と市場ニーズの乖離、持続可能なビジネスモデルの欠如といった問題が日増しに顕著になっています。資本市場の忍耐力が不足し、AIプロジェクトは熱狂から冷遇へと転じ、一部のチームは人員削減や事業転換を開始しています。コミュニティは、業界が理性を取り戻し、技術的ボトルネックに真摯に向き合い、真の商業的価値を見出すよう呼びかけています。 (出典: 36氪, Reddit r/artificial, MIT Technology Review)

从被吹捧到沦为鸡肋,“AI”这个词用了还不到一年

Claude AIモデルの性能劣化がコミュニティで話題に : Redditコミュニティのユーザーは、Claude Sonnet 4.5モデルの性能が初期バージョンのSonnet 4.0よりも劣化していると広く報告しています。ユーザーは、モデルが頻繁に間違いを犯し、幻覚を起こし、過度に推測すると指摘しています。一部のユーザーは、AnthropicがAPI呼び出しで自動的に能力の低いモデルにルーティングしている可能性があり、有料ユーザーのエクスペリエンスが低下しているのではないかと疑っています。この現象は、モデルの品質安定性とAnthropicの透明性に対する懸念を引き起こしています。 (出典: Reddit r/ClaudeAI, Reddit r/OpenWebUI)

AIと雇用:採用市場の苦境と面接におけるAI不正行為の論争 : AI時代の雇用市場は課題に直面しており、優秀な候補者でさえ見過ごされる可能性があります。同時に、オンライン面接でAIがリアルタイムの回答を生成する行為は、「不正行為」と「人間と機械の協働の未来」に関する議論を引き起こしています。コミュニティでは、採用プロセスがAI支援の常態に適応すべきか、そしてAIが従来の「真の」人間のパフォーマンスという概念に与える影響について議論されており、AIがもたらす可能性のある職務の代替と面接の公平性について懸念が表明されています。 (出典: MIT Technology Review, Reddit r/artificial, Reddit r/ArtificialInteligence)

AIチャットボットのプライバシーと子供の安全に関する論争 : Redditコミュニティでは、AIチャットボットが子供による安全でない、または懸念される会話を検出した場合に、保護者に警告すべきかどうかが議論されています。これは、子供のプライバシー権、保護者の知る権利、そして悲劇や有害な行為の防止におけるAIツールの役割に関する倫理的議論を引き起こしています。この措置がプライバシーを侵害する可能性があると懸念する声がある一方で、子供の安全を確保するためにAIを監視すべきだと考える声もあります。 (出典: Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence)

ChatGPTのNSFWルール調整がユーザーの注目を集める : Redditコミュニティのユーザーは、ChatGPTのNSFW(職場に不適切)コンテンツルールが緩和されたようで、モデルが性的なシーンをよりオープンかつ明確に描写するようになったことに気づいています。ユーザーはこの変更について議論し、Anthropicが試験的に制限を緩和しているのではないかと推測していますが、潜在的なアカウント停止の懸念も表明しています。OpenAI CEOのSam Altmanは以前、同社は「世界の道徳警察ではない」と述べており、AIコンテンツ審査の境界線に関する議論を引き起こしています。 (出典: Reddit r/ClaudeAI, MIT Technology Review)

💡 その他

DeepMind CEOがプリンストン高等研究所を訪問、AIと科学を議論 : DeepMind CEOのDemis Hassabisは、プリンストン高等研究所(IAS)を訪問し、所長のDavid NirenbergとAI、科学、そして物理学と情報間の深い関連性について意見交換を行いました。彼はまた、アインシュタインのオフィスで仕事をし、それを「インスピレーションを超えたもの」と称しました。この訪問は、基礎科学研究と学際的交流を推進するAIの可能性、およびAI分野のリーダーが科学の最前線に継続的に注目していることを強調しています。 (出典: demishassabis)

demishassabis