AI日报 - 第41页共48页

AI日报 – 2025-05-15(早)

谷歌DeepMind发布AlphaEvolve：Gemini驱动的编码智能体，革新算法发现: 谷歌DeepMind推出AlphaEvolve，一个由Gemini驱动的AI编码智能体，旨在通过结合大型语言模型的创造力与自动化评估器来发现和优化复杂算法。AlphaEvolve已成功设计出更快的矩阵乘法算法，解决了如Erdős最小重叠问题和接吻数问题等开放数学难题，并在谷歌内部用于优化数据中心效率（平均

AI日报

AI日报 – 2025-05-14(晚)

MLSys 2025公布最佳论文奖，FlashInfer等项目入选 : 国际系统领域顶会MLSys 2025公布了两篇最佳论文，其中之一是来自华盛顿大学、英伟达等机构的FlashInfer，这是一个专为LLM推理优化的高效可定制注意力引擎库，通过优化KV-Cache存储、计算模板和调度机制，显著提升了LLM推理的吞吐和降低延迟。另一篇最佳论文是《The Hidden Bloat in Machin

AI日报

AI日报 – 2025-05-14(早)

OpenAI HealthBench基准发布，AI医疗能力显著提升: OpenAI发布了HealthBench，这是一个与全球262名医生合作构建的医疗AI评估基准。测试显示，最新的AI模型（如o3、GPT-4.1）在医疗对话场景中的表现已与医生辅助AI后的最佳水平相当，远超独立医生（约4倍）。小模型性能也有提升。这标志着AI在医疗健康领域的巨大潜力，评估体系旨在推动AI安全有效地应用于临床实践。

AI日报

AI日报 – 2025-05-13(晚)

OpenAI首席科学家Jakub Pachocki专访：AI五年内或可自主发现新科学，世界模型与强化学习是关键: OpenAI首席科学家Jakub Pachocki在《自然》杂志专访中表示，AI有望在5年内实现自主科学发现，并对经济产生重大影响。他认为，当前的推理模型（如o系列、Gemini 2.5 Pro、DeepSeek-R1）通过思维链等方式解决复杂问题，已展现出巨大潜力。Pachocki强

AI日报

AI日报 – 2025-05-13(早)

OpenAI发布HealthBench评估医疗AI性能: OpenAI推出了HealthBench，一个旨在衡量大型语言模型在医疗场景中性能和安全性的新基准。该基准由250多名全球医生参与开发，包含5000个真实医疗对话和48562条独特的医生撰写评估标准，覆盖急诊、全球健康等多种情境及准确性、指令遵循等行为维度。测试显示，o3模型准确率达60%，而GPT-4.1 nano在成本降低25倍的情况下

AI日报

AI日报 – 2025-05-12(晚)

Prime Intellect 开源 INTELLECT-2 模型: Prime Intellect 发布并开源了 INTELLECT-2，一个320亿参数的模型，号称是首个通过全球分布式强化学习训练的模型。此次发布包含了详细的技术报告和模型检查点。该模型在多个基准测试中展现出与Qwen 32B等模型相当甚至更优的性能，尤其在代码生成和数学推理方面表现突出，并被社区成员发现能玩Wordle。其训练

AI日报

AI日报 – 2025-05-12(早)

NVIDIA推出GENMO通用人体运动模型: NVIDIA发布了名为GENMO (GENeralist Model for Human MOtion) 的AI模型，能够将文本、视频、音乐甚至关键帧剪影等多种输入转化为逼真的3D人体运动。该模型能理解并融合不同类型的输入，例如从视频中学习动作并根据文本提示进行修改，或根据音乐节奏生成舞蹈。GENMO展示了在游戏动画、虚拟世界角色创建等领域的巨大潜力，

AI日报

AI日报 – 2025-05-11(晚)

AI 安全风险引关注，专家呼吁借鉴核安全经验进行风险评估: 国际社会对人工智能潜在风险的担忧日益加剧，有专家（如Max Tegmark）呼吁AI公司在发布危险的AI系统前，应效仿罗伯特·奥本海默首次核试验时的安全计算方法，对人工智能可能失控的概率（康普顿常数）进行严格评估。此举旨在形成行业共识，推动建立全球AI安全机制，防止超级智能可能带来的灾难性后果。

AI日报

AI日报 – 2025-05-11(早)

OpenAI推出「国家级AI」计划，助力全球AI基础设施建设: OpenAI启动「OpenAI for Countries」项目，作为其「星际之门」计划的一部分，旨在协助各国建立本地AI数据中心、定制化ChatGPT，并推动AI生态发展。CEO萨姆·奥特曼已实地考察位于德州Abilene的首个超级计算园区，该园区是耗资5000亿美元的「星际之门」计划的一部分，旨在打造全球最大的AI训练设施。此举标

分类： AI日报