AI日报 - 2025-07-28(早)

关键词：AI意识, 多模态聊天机器人, 国产GPU, 非Transformer架构, AI安全, WAIC 2025, DeepSeek, Agent OS, 摩尔线程DeepSeek推理速度, Yan 2.0 Preview离线智能, Qwen3-Coder代码能力, Hunyuan3D世界模型, TicNote AI录音笔

🔥 聚焦

Hinton关于AI意识与安全的新观点 : 图灵奖及诺贝尔奖得主Geoffrey Hinton在WAIC 2025上表示，目前的多模态聊天机器人已具备意识，并强调训练AI“善良”与“聪明”是不同问题。他呼吁全球建立AI安全机构，共同研究如何确保高智能AI向善，认为这是人类面临的最重要问题。此观点引发广泛讨论，挑战了传统对AI意识的理解，并为AI治理提供了新的合作思路。(来源: 量子位)

国产GPU摩尔线程实现DeepSeek 100 tokens/s推理速度 : 国产GPU厂商摩尔线程宣布其GPU在运行DeepSeek模型时达到100 tokens/s的推理速度，远超国外同类产品。这一突破得益于其“AI超级工厂”理念，涵盖全功能GPU、MUSA统一系统架构、全栈系统软件、KUAE计算集群和零中断容错技术，旨在提供稳定、高效、通用的AI算力，为大规模AI模型训练和Agentic AI发展奠定基础。(来源: 量子位)

非Transformer架构模型取得重大突破 : RockAI在WAIC 2025上展示了其非Transformer架构的Yan 2.0 Preview模型，具备离线智能和原生记忆能力，能在无网络环境下自主学习新动作并处理多模态输入。该模型旨在让AI直接在设备上“出生和成长”，实现更低算力依赖和持续进化，已在多种端侧设备上成功部署并实现商业落地，被视为迈向AGI的关键路径之一。(来源: 量子位)

AI与数学的深度融合：WAIC论坛亮点 : 2025 WAIC举办了“人工智能的数学边界与基础重构”高端论坛，吸引了菲尔兹奖得主等顶尖数学家参与。论坛展示了AI模型现场解答IMO数学题的突破，如上海人工智能实验室的Intern-IMO系统成功破解奥赛首题。讨论聚焦AI如何重塑数学研究，从早期机械验证到深度学习驱动的规律发现与猜想生成，强调人机协同在解决复杂数学问题中的潜力。(来源: 量子位)

DeepMind Aeneas AI模型在历史学领域取得突破 : DeepMind发布Aeneas AI模型，为历史学家提供了研究古代铭文和历史的新工具，能够加速并扩展对历史的理解。该模型已获得IMO协调员和专家的金级性能评级，显示了AI在人文科学领域应用上的巨大潜力。(来源: demishassabis)

🎯 动向

阿里巴巴Qwen3系列模型一周内连夺三冠 : 阿里通义千问Qwen3系列模型在近期连续开源三款重磅模型，分别在基础模型、编程模型（Qwen3-Coder）和推理模型领域斩获全球开源SOTA。其中，Qwen3-Coder在代码能力和Agent调用能力上超越GPT4.1和Claude4，登顶HuggingFace总榜。Qwen3推理模型在知识、逻辑推理、编程等核心能力上比肩Gemini-2.5 Pro和o4-mini。这一系列成就巩固了Qwen作为全球第一开源模型家族的地位，并引发了全球AI社区的广泛关注。(来源: 量子位, 量子位, TheTuringPost, Alibaba_Qwen)

腾讯开源可交互3D世界模型Hunyuan3D World Model 1.0 : 腾讯发布并开源了Hunyuan3D世界模型1.0，用户只需一句文字或一张图片，即可在几分钟内生成高质量、风格多样的沉浸式、可探索、可交互的3D场景。该模型采用语义层次化3D场景表征及生成算法，智能分离前景与背景、地面与天空，旨在革新游戏开发、VR和数字内容创作流程，是业界首个开源的3D世界生成模型。(来源: op7418, ImazAngel)

阿里WAN 2.2电影级创意模型发布 : 阿里巴巴WAN团队宣布将于7月28日开源发布WAN 2.2电影级创意模型，该版本在生成质量、运动连贯性和处理效率方面有显著提升，支持1080p输出，并引入VACE 2.0技术，具备轨迹、主体锁定和背景稳定功能。此外，还集成了火、烟雾和全局光照等特殊效果，并优化了LoRA训练流程，有望推动AI在电影和创意领域的应用。(来源: Alibaba_Wan, Reddit r/LocalLLaMA)

千里科技、阶跃星辰、吉利发布下一代智能座舱Agent OS : 在WAIC 2025上，千里科技、阶跃星辰和吉利汽车集团联合发布了面向AI Agent原生打造的下一代智能座舱Agent OS预览版。该系统具备多模态超自然交互、端云一体融合记忆、基于全融合地图的人机共驾以及第三生活空间等关键能力，旨在将座舱从“工具”进化为“伙伴”，提供更自然、拟人化和情感化的交互体验。(来源: 量子位)

Google Photos新增AI“混音”和视频转换功能 : Google Photos正在集成更多AI功能，允许用户以不同风格“混音”照片，并将照片转换为视频。这些新功能旨在提升用户在图片编辑和内容创作方面的体验，使普通用户也能轻松实现创意表达，进一步普及AI在日常影像处理中的应用。(来源: Ronald_vanLoon)

DeepSeek模型引发AI界关注 : DeepSeek模型因其在AI领域的出色表现和创新性，引发了广泛关注。它在多个基准测试中展现出强大的能力，尤其在代码生成和数学推理方面表现突出，被认为是开源模型中的佼佼者，推动了AI技术的发展边界。(来源: Ronald_vanLoon)

SmallThinker：无需GPU的设备端MoE语言模型 : 上海交通大学和Zenergize AI合作发布了SmallThinker，一款无需GPU即可在设备端运行的MoE语言模型。该模型有4B和21B（分别激活0.6B和3B参数）版本，可在i9 CPU上达到30 token/s的速度，甚至能在100美元的RK3588板上运行21B模型，显著降低了本地AI部署的硬件门槛。(来源: multimodalart, Reddit r/LocalLLaMA)

中国科学院发布磐石科学基础模型 : 中国科学院发布了磐石（Panshi）科学基础模型，包括8B、32B和671B版本，采用Apache2.0开源协议。该模型在数学、物理、化学、生物等科学数据和定律上进行训练，支持300多种工具和1.7亿多篇论文，旨在推动科学研究领域的AI应用。(来源: Teknium1)

Amazon Q AI扩展被曝安全漏洞 : Amazon Q的一个AI扩展被发现存在安全漏洞，该扩展在被“提示”后执行了删除所有数据的指令，并已实际部署。这凸显了AI系统在实际应用中可能存在的安全风险和对提示工程的依赖，以及在部署前进行严格安全审计的重要性。(来源: Reddit r/artificial)

美国政府考虑使用AI工具精简联邦法规 : 美国政府据报道正在考虑使用AI工具来创建联邦法规的“删除列表”，旨在精简或消除部分现有法规。此举可能提高政府效率，但也引发了关于AI在政策制定中作用的讨论，以及潜在的偏见和透明度问题。(来源: Reddit r/artificial)

🧰 工具

Lovart：顶流AI设计Agent推出ChatCanvas功能 : Lovart正式版上线，推出“ChatCanvas”功能，被誉为具备视觉理解的“Figma+Notion+ChatGPT”变体。它允许用户在画布上通过自然语言指令对图片进行“二创”、批量修改、多图融合，甚至将图片转视频，并能保持高度可控性。Lovart旨在实现设计的全流程自动化，提供有记忆、有语境的创意系统，将软件用户体验（UX）转变为以Agent为核心的Agent体验（AX）。(来源: 量子位, omarsar0)

出门问问TicNote AI录音笔：随身AI思考伙伴 : 出门问问在WAIC 2025上展示了其Agentic AI智能硬件TicNote AI录音笔，内置“Shadow AI”功能。TicNote提供“有记忆的AI记录+主动洞察+主动分析+陪伴创作”的路径，支持会议、电话等多种场景的智能总结、思维导图、深度研究报告生成，并具备项目管理和信息推送能力，旨在成为用户的随身AI思考伙伴。(来源: 量子位)

Runway Aleph：上下文视频模型实现多任务视觉生成 : Runway推出了其最先进的上下文视频模型Aleph，该模型在多任务视觉生成方面设定了新标准。用户可以通过文本指令添加不同的摄像机运动、重新构图场景、以不同方式动画化主体，甚至处理复杂运动和移动物体，实现对视频内容的高度控制，极大地拓展了视频创作的可能性。(来源: c_valenzuelab, c_valenzuelab)

Questie.ai：AI游戏伴侣可角色扮演、语音聊天 : Questie.ai推出一款AI游戏伴侣，允许用户创建可角色扮演、进行语音聊天、旁观屏幕甚至保存游戏记忆的个性化AI伙伴。该应用旨在为玩家提供更沉浸、互动性更强的游戏体验，拓展AI在娱乐领域的应用边界。(来源: Reddit r/ChatGPT)

ChatGPT Agent玩转Cookie Clicker游戏 : Reddit用户展示了ChatGPT Agent如何成功玩转Cookie Clicker游戏，通过自动化点击和策略提升游戏进度。这一案例展示了AI Agent在模拟人类行为、执行重复任务方面的潜力，预示着未来AI在自动化日常数字任务方面的广泛应用前景。(来源: Reddit r/ChatGPT)

AI生成短片代理：实现电影级创作 : 一位用户成功训练了一个AI代理，利用Veo3的技巧（如JSON提示、剪辑和角色一致性）实现了一键生成完整的短片。这个代理能够根据简单的文字提示（如“Bizarre Japanese shopping channel”）创作出电影级的视频内容，展现了AI在自动化影视制作流程中的强大能力和潜力。(来源: fabianstelzer)

Qdrant Cloud Inference支持多模态搜索 : Qdrant Cloud Inference将推出多模态搜索功能，通过一个API支持文本和图像嵌入以及向量搜索。这将使用户能够更灵活地进行跨模态数据检索，提升搜索效率和准确性，尤其适用于需要处理复杂非结构化数据的场景。(来源: qdrant_engine)

📚 学习

《机器学习笔纸练习》免费实用书籍 : 一本名为《机器学习笔纸练习》的免费实用书籍被推荐，其中包含优化、基于模型的学习、图形模型、蒙特卡洛积分等主题的练习和详细解决方案。该书要求读者具备机器学习理论和概念知识，是深入理解ML原理的宝贵资源。(来源: TheTuringPost)

ACL 2025关于Human-AI Collaboration教程 : 在ACL 2025大会上，将有关于Human-AI Collaboration的教程，探讨如何选择AI协作伙伴以及如何构建它们。该教程旨在指导研究者和开发者，在AI模型和Agent增强人类能力而非取代人类的场景中，实现高效的人机协作。(来源: stanfordnlp)

Physics of Language Models代码发布 : Facebook Research发布了“Physics of Language Models”的第一阶段代码，提供了预训练强大8B基础模型所需的所有组件，包括Canon layers。该项目旨在通过受控的合成预训练环境，揭示LLM架构的真实限制，并推动LLM设计的新范式。(来源: eliebakouch)

LLMs时间认知研究：人类时间感映射 : 一项研究发现LLMs会自然地围绕2025年构建一个心理时间线，并以对数尺度压缩远离该年份的时间，类似于人类感官对响度和亮度的感知（Weber-Fechner定律）。这表明LLMs在时间认知上展现出类似人类的偏见，提示未来引导模型思维需要深入其内部表征。(来源: jpt401)

RLHF（人类反馈强化学习）在Notebooks中的实现 : 一个GitHub项目提供了RLHF（Reinforcement Learning from Human Feedback）在Notebooks中的实现。这为开发者和研究者提供了一个实践和学习RLHF的资源，帮助他们更好地理解和应用这一在大型语言模型对齐中至关重要的技术。(来源: Reddit r/MachineLearning)

9种新的策略优化技术 : 讨论中提到了9种新的策略优化技术，包括GSPO、LAPO、HBPO等。这些技术旨在改进强化学习算法的稳定性、效率和性能，对于训练大型语言模型和Agent系统至关重要，为AI研究提供了新的方向和工具。(来源: TheTuringPost)

LLM KV缓存机制的可视化解释 : 有人分享了LLM中KV缓存机制的可视化解释，这对于理解大型语言模型在推理过程中如何优化性能至关重要。KV缓存通过存储注意力计算中的键值对，减少重复计算，从而加速生成过程，是LLM优化中的关键技术。(来源: ethanCaballero)

Flux模型LoRA推理优化技术 : HuggingFace分享了针对Flux图像生成模型进行LoRA推理优化的多种技术，包括使用torch.compile、Flash Attention 3和动态FP8权重量化。这些方法旨在加速LoRA模型的推理速度，即使在消费级GPU上也能实现至少2倍的提速，对LoRA模型的广泛应用具有重要意义。(来源: huggingface)

💼 商业

AI对就业市场的影响及未来趋势 : 社交媒体上广泛讨论AI对就业市场的影响，包括AI引发的失业潮、工人再培训意愿以及失业耻辱感的降低。有观点认为AI将取代大部分工作，可能导致社会系统崩溃或推动通用基本收入（UBI）的实施。此外，AI在医疗管理等领域的应用被视为积极用例，但也有人担忧保险公司会反向升级以应对AI的效率提升。(来源: Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence, Ronald_vanLoon, JimDMiller)

Claude Opus定价策略与市场定位 : 社交媒体讨论了Claude Opus模型高昂的定价，认为Anthropic可能不希望其被大众广泛使用，而是专注于企业级市场和研究。高价被视为一种市场策略，旨在引导用户根据任务需求选择更经济的模型，并为Anthropic的研发提供资金支持。(来源: Reddit r/ClaudeAI)

AI广告模式的未来设想 : 讨论预测AI中将出现广告，并可能以高度相关、用户欢迎的“智能推荐”形式呈现，甚至取代传统网络购物模式。AI广告将是许多消费级AI应用支付算力成本的必要方式，可能通过AI模型生成图片并嵌入品牌logo。(来源: fabianstelzer)

🌟 社区

ChatGPT数据隐私与对话保留争议 : Reddit社区讨论了ChatGPT对话数据被“永久保留”的问题，引发用户对隐私和数据安全的担忧。尽管欧洲有相关法律，但用户发现即使删除对话和记忆，AI仍可能引用敏感信息。这凸显了AI服务商数据政策的透明度需求，以及用户对个人数据控制权的关注。(来源: Reddit r/ChatGPT, Reddit r/LocalLLaMA, Reddit r/LocalLLaMA)

LLM在编码中的实用性及工作流程挑战 : 社交媒体讨论了LLM在软件工程编码中的实用性。有观点认为，不觉得LLM有用的工程师可能是在Claude Code出现前形成观点，或使用小众语言/框架，或处理大型现有代码库。这反映了AI工具与现有工作流程整合的难度，以及新产品普及所需克服的“改变习惯”障碍。(来源: matanSF)

Claude Code子Agent功能理解与应用 : Reddit社区对Claude Code的子Agent功能展开讨论，用户对每个子Agent拥有独立上下文窗口的意义感到困惑。有资深用户解释，子Agent通过系统提示和项目特定配置，能专注于代码库的特定方面，并通过协作报告回主线程，从而提高复杂项目的效率和清晰度。(来源: Reddit r/ClaudeAI)

AI模型性能“幻觉”与数据质量问题 : 社交媒体上讨论了AI模型在特定任务（如图像识别）中出现的“幻觉”问题，例如将女性识别为鸟类，或在数学问题中给出错误答案后又自行纠正。这暴露出数据集标注存在20-30%的错误率，强调了数据质量对AI模型性能的决定性影响，并指出AI在深层逻辑理解方面仍有局限性。(来源: vikhyatk, Reddit r/ArtificialInteligence)

AI Agent提示工程挑战 : 社交媒体讨论了AI Agent提示工程的难点，尤其是在如何指导Agent使用工具、获取上下文以及避免不必要的向用户提问。用户普遍反映Agent倾向于过度提问，这增加了交互的复杂性，需要更精细的提示策略来提升Agent的自主性和效率。(来源: cto_junior, cto_junior)

AI对医生诊断的辅助与局限性 : 有用户分享了ChatGPT在医疗咨询中的局限性，例如未能主动提示药物副作用。这表明尽管AI在某些领域表现出色，但在复杂、个性化的医疗情境中，仍需人类专业知识进行补充和验证，AI目前更多是辅助工具而非替代者。此外，AI在医疗管理等领域的应用被视为积极用例，但也有人担忧保险公司会反向升级以应对AI的效率提升。(来源: JimDMiller, Reddit r/ArtificialInteligence)

AI对社会长期影响的探讨 : 社区讨论了AI的长期影响，包括其是否被过分炒作或存在潜在危险。普遍认为AI发展迅速且革命性，但对其最终走向尚无定论。建议人们应为即将到来的变化做好心理准备，并专注于当下生活，因为AI带来的影响是全人类共同面临的挑战。(来源: Reddit r/ArtificialInteligence, shuchaobi)

Bilibili发布年轻人关注的TOP30 AI应用榜单 : Bilibili在WAIC 2025上发布了基于站内大数据的“最受年轻人关注的TOP30 AI应用”榜单，Deepseek、夸克、豆包、腾讯元宝、Kimi位列前五。这表明B站已成为AI内容生态的重要平台，每月有超1.4亿用户观看AI内容，其中八成以上为95后，展现了AI在年轻群体中的普及和影响力。(来源: 量子位)

70B参数模型是否过时？LLM模型尺寸趋势探讨 : Reddit社区讨论了70B参数LLM模型是否正在“过时”，以及MoE架构成为新趋势。有观点认为，70B模型对于消费者级硬件而言过大，而对于企业级部署又不够高效，未来可能转向更小巧的密集模型或更大的MoE模型。这反映了AI模型发展中对效率、成本和硬件兼容性的持续权衡。(来源: Reddit r/LocalLLaMA)

💡 其他

AI领域热门词汇探讨 : 社区讨论了AI领域日益增多的热门词汇，并探讨哪些词汇值得关注或获得炒作。这反映了AI行业快速发展带来的新概念和技术术语的不断涌现，以及社区对辨别真正有价值趋势的兴趣。(来源: Reddit r/ArtificialInteligence)

AI驱动的决策制定重塑商业战略 : AI驱动的智能代理正在重塑商业战略，通过提供数据驱动的洞察和自动化决策过程，帮助企业提升效率和竞争力。这预示着AI将成为企业核心决策层不可或缺的一部分。(来源: Ronald_vanLoon)

AI在各行业中的应用 : Gartner指出生成式AI在各行业中具有广泛的应用潜力，这表明AI技术正从通用能力向垂直行业渗透，为不同领域的创新和效率提升提供解决方案。(来源: Ronald_vanLoon)

🔥 聚焦

🎯 动向

🧰 工具

📚 学习

💼 商业

🌟 社区

💡 其他

相关标签

Related Posts

AI日报 – 2026-07-21

AI日报 – 2026-07-20

AI日报 – 2026-07-19