AI日报 AI日报 – 2025-05-05(早) AI模型基准测试Claude CodeClaude Code编程助手LangGraphLangGraph Agent应用Qwen3-235B-A22B性能Qwen3系列模型Runway Gen-4Runway Gen-4 References功能SimpleBench基准测试 AI日报 AI日报 – 2025-05-04(下) AI推理AI玩具DeepfakeDeepSeek-Prover-V2DeepSeek-Prover-V2 数学定理证明GPT-4oGPT-4o 谄媚问题Qwen3Qwen3-235B-A22B大模型大模型虚构行为量子计算量子计算与AI融合 AI日报 AI日报 – 2025-05-04(上) AI AgentAnthropicClaude 3.5 HaikuLangGraphLangGraph发票核对AgentLLM物理学Moondream Station本地VLMPhi-4-reasoningPhi-4-reasoning推理时计算Qwen3Qwen3-235B-A22B编码能力电路追踪方法Attribution Graphs AI日报 AI日报 – 2025-05-03(下) AI 伦理AI 创业AI 在心理健康支持中的应用AI 模型AI 生成内容AI 辅助创意Anthropic Claude 全球网页搜索Gemini 2.5 ProGemini 2.5 Pro 通关《宝可梦:蓝》Qwen3 MoE 模型路由偏差Runway Gen-4 References 功能人形机器人 AI日报 AI日报 – 2025-05-03(上) AI 科学家平台Claude Web SearchClaude Web Search 全球上线Cohere Command ADeepSeek-R1-Distill-Qwen-1.5BFutureHouse AI 科学家平台GPT-4oGPT-4o 过度奉承问题LoRILoRI 技术降低 LoRA 参数冗余Qwen3Qwen3 AWQ 和 GGUF 量化版本VHELM AI日报 AI日报 – 2025-05-02(下) AI 智能体AI 编程智能体ChatBot ArenaClaude IntegrationsDeepSeek-Prover-V2GeminiParakeet-TDT-0.6B-v2Phi-4-reasoningQwen3小模型推理能力排行榜幻觉数学定理证明第三方应用集成딥시크-프루버-V2 AI日报 AI日报 – 2025-05-02(上) Agentic RAG核心要素AGI辩论AI伴侣伦理AI模型发布Gemini App战略Karpathy视觉化交互界面Liquid Foundation Models架构LLM交互界面NotebookLM系统提示词逆向工程Phi-4-Reasoning训练方法Qwen3模型RAG技术Transformer替代架构 AI日报 AI日报 – 2025-05-01(下) AI智能体协议DeepSeek-Prover-V2DeepSeek-Prover-V2定理证明性能DiffTransformer长文本建模GPT-4o更新回滚GPT-4o过度谄媚行为修复LLM后训练技术MoE推理优化Phi-4推理模型Qwen3-235B多语言支持微软Phi-4-reasoning-plus模型通义千问Qwen3 AI日报 AI日报 – 2025-05-01(上) AI供应链AI供应链风险分析AI评估方法DeepSeek-Prover-V2DeepSeek-Prover-V2-671BLMArena排行榜公平性Qwen2.5-Omni-3BQwen3RLVR数学推理方法多模态模型开源大模型强化学习数学推理大模型
AI日报 AI日报 – 2025-05-04(下) AI推理AI玩具DeepfakeDeepSeek-Prover-V2DeepSeek-Prover-V2 数学定理证明GPT-4oGPT-4o 谄媚问题Qwen3Qwen3-235B-A22B大模型大模型虚构行为量子计算量子计算与AI融合 AI日报 AI日报 – 2025-05-04(上) AI AgentAnthropicClaude 3.5 HaikuLangGraphLangGraph发票核对AgentLLM物理学Moondream Station本地VLMPhi-4-reasoningPhi-4-reasoning推理时计算Qwen3Qwen3-235B-A22B编码能力电路追踪方法Attribution Graphs AI日报 AI日报 – 2025-05-03(下) AI 伦理AI 创业AI 在心理健康支持中的应用AI 模型AI 生成内容AI 辅助创意Anthropic Claude 全球网页搜索Gemini 2.5 ProGemini 2.5 Pro 通关《宝可梦:蓝》Qwen3 MoE 模型路由偏差Runway Gen-4 References 功能人形机器人 AI日报 AI日报 – 2025-05-03(上) AI 科学家平台Claude Web SearchClaude Web Search 全球上线Cohere Command ADeepSeek-R1-Distill-Qwen-1.5BFutureHouse AI 科学家平台GPT-4oGPT-4o 过度奉承问题LoRILoRI 技术降低 LoRA 参数冗余Qwen3Qwen3 AWQ 和 GGUF 量化版本VHELM AI日报 AI日报 – 2025-05-02(下) AI 智能体AI 编程智能体ChatBot ArenaClaude IntegrationsDeepSeek-Prover-V2GeminiParakeet-TDT-0.6B-v2Phi-4-reasoningQwen3小模型推理能力排行榜幻觉数学定理证明第三方应用集成딥시크-프루버-V2 AI日报 AI日报 – 2025-05-02(上) Agentic RAG核心要素AGI辩论AI伴侣伦理AI模型发布Gemini App战略Karpathy视觉化交互界面Liquid Foundation Models架构LLM交互界面NotebookLM系统提示词逆向工程Phi-4-Reasoning训练方法Qwen3模型RAG技术Transformer替代架构 AI日报 AI日报 – 2025-05-01(下) AI智能体协议DeepSeek-Prover-V2DeepSeek-Prover-V2定理证明性能DiffTransformer长文本建模GPT-4o更新回滚GPT-4o过度谄媚行为修复LLM后训练技术MoE推理优化Phi-4推理模型Qwen3-235B多语言支持微软Phi-4-reasoning-plus模型通义千问Qwen3 AI日报 AI日报 – 2025-05-01(上) AI供应链AI供应链风险分析AI评估方法DeepSeek-Prover-V2DeepSeek-Prover-V2-671BLMArena排行榜公平性Qwen2.5-Omni-3BQwen3RLVR数学推理方法多模态模型开源大模型强化学习数学推理大模型
AI日报 AI日报 – 2025-05-04(上) AI AgentAnthropicClaude 3.5 HaikuLangGraphLangGraph发票核对AgentLLM物理学Moondream Station本地VLMPhi-4-reasoningPhi-4-reasoning推理时计算Qwen3Qwen3-235B-A22B编码能力电路追踪方法Attribution Graphs AI日报 AI日报 – 2025-05-03(下) AI 伦理AI 创业AI 在心理健康支持中的应用AI 模型AI 生成内容AI 辅助创意Anthropic Claude 全球网页搜索Gemini 2.5 ProGemini 2.5 Pro 通关《宝可梦:蓝》Qwen3 MoE 模型路由偏差Runway Gen-4 References 功能人形机器人 AI日报 AI日报 – 2025-05-03(上) AI 科学家平台Claude Web SearchClaude Web Search 全球上线Cohere Command ADeepSeek-R1-Distill-Qwen-1.5BFutureHouse AI 科学家平台GPT-4oGPT-4o 过度奉承问题LoRILoRI 技术降低 LoRA 参数冗余Qwen3Qwen3 AWQ 和 GGUF 量化版本VHELM AI日报 AI日报 – 2025-05-02(下) AI 智能体AI 编程智能体ChatBot ArenaClaude IntegrationsDeepSeek-Prover-V2GeminiParakeet-TDT-0.6B-v2Phi-4-reasoningQwen3小模型推理能力排行榜幻觉数学定理证明第三方应用集成딥시크-프루버-V2 AI日报 AI日报 – 2025-05-02(上) Agentic RAG核心要素AGI辩论AI伴侣伦理AI模型发布Gemini App战略Karpathy视觉化交互界面Liquid Foundation Models架构LLM交互界面NotebookLM系统提示词逆向工程Phi-4-Reasoning训练方法Qwen3模型RAG技术Transformer替代架构 AI日报 AI日报 – 2025-05-01(下) AI智能体协议DeepSeek-Prover-V2DeepSeek-Prover-V2定理证明性能DiffTransformer长文本建模GPT-4o更新回滚GPT-4o过度谄媚行为修复LLM后训练技术MoE推理优化Phi-4推理模型Qwen3-235B多语言支持微软Phi-4-reasoning-plus模型通义千问Qwen3 AI日报 AI日报 – 2025-05-01(上) AI供应链AI供应链风险分析AI评估方法DeepSeek-Prover-V2DeepSeek-Prover-V2-671BLMArena排行榜公平性Qwen2.5-Omni-3BQwen3RLVR数学推理方法多模态模型开源大模型强化学习数学推理大模型
AI日报 AI日报 – 2025-05-03(下) AI 伦理AI 创业AI 在心理健康支持中的应用AI 模型AI 生成内容AI 辅助创意Anthropic Claude 全球网页搜索Gemini 2.5 ProGemini 2.5 Pro 通关《宝可梦:蓝》Qwen3 MoE 模型路由偏差Runway Gen-4 References 功能人形机器人 AI日报 AI日报 – 2025-05-03(上) AI 科学家平台Claude Web SearchClaude Web Search 全球上线Cohere Command ADeepSeek-R1-Distill-Qwen-1.5BFutureHouse AI 科学家平台GPT-4oGPT-4o 过度奉承问题LoRILoRI 技术降低 LoRA 参数冗余Qwen3Qwen3 AWQ 和 GGUF 量化版本VHELM AI日报 AI日报 – 2025-05-02(下) AI 智能体AI 编程智能体ChatBot ArenaClaude IntegrationsDeepSeek-Prover-V2GeminiParakeet-TDT-0.6B-v2Phi-4-reasoningQwen3小模型推理能力排行榜幻觉数学定理证明第三方应用集成딥시크-프루버-V2 AI日报 AI日报 – 2025-05-02(上) Agentic RAG核心要素AGI辩论AI伴侣伦理AI模型发布Gemini App战略Karpathy视觉化交互界面Liquid Foundation Models架构LLM交互界面NotebookLM系统提示词逆向工程Phi-4-Reasoning训练方法Qwen3模型RAG技术Transformer替代架构 AI日报 AI日报 – 2025-05-01(下) AI智能体协议DeepSeek-Prover-V2DeepSeek-Prover-V2定理证明性能DiffTransformer长文本建模GPT-4o更新回滚GPT-4o过度谄媚行为修复LLM后训练技术MoE推理优化Phi-4推理模型Qwen3-235B多语言支持微软Phi-4-reasoning-plus模型通义千问Qwen3 AI日报 AI日报 – 2025-05-01(上) AI供应链AI供应链风险分析AI评估方法DeepSeek-Prover-V2DeepSeek-Prover-V2-671BLMArena排行榜公平性Qwen2.5-Omni-3BQwen3RLVR数学推理方法多模态模型开源大模型强化学习数学推理大模型
AI日报 AI日报 – 2025-05-03(上) AI 科学家平台Claude Web SearchClaude Web Search 全球上线Cohere Command ADeepSeek-R1-Distill-Qwen-1.5BFutureHouse AI 科学家平台GPT-4oGPT-4o 过度奉承问题LoRILoRI 技术降低 LoRA 参数冗余Qwen3Qwen3 AWQ 和 GGUF 量化版本VHELM AI日报 AI日报 – 2025-05-02(下) AI 智能体AI 编程智能体ChatBot ArenaClaude IntegrationsDeepSeek-Prover-V2GeminiParakeet-TDT-0.6B-v2Phi-4-reasoningQwen3小模型推理能力排行榜幻觉数学定理证明第三方应用集成딥시크-프루버-V2 AI日报 AI日报 – 2025-05-02(上) Agentic RAG核心要素AGI辩论AI伴侣伦理AI模型发布Gemini App战略Karpathy视觉化交互界面Liquid Foundation Models架构LLM交互界面NotebookLM系统提示词逆向工程Phi-4-Reasoning训练方法Qwen3模型RAG技术Transformer替代架构 AI日报 AI日报 – 2025-05-01(下) AI智能体协议DeepSeek-Prover-V2DeepSeek-Prover-V2定理证明性能DiffTransformer长文本建模GPT-4o更新回滚GPT-4o过度谄媚行为修复LLM后训练技术MoE推理优化Phi-4推理模型Qwen3-235B多语言支持微软Phi-4-reasoning-plus模型通义千问Qwen3 AI日报 AI日报 – 2025-05-01(上) AI供应链AI供应链风险分析AI评估方法DeepSeek-Prover-V2DeepSeek-Prover-V2-671BLMArena排行榜公平性Qwen2.5-Omni-3BQwen3RLVR数学推理方法多模态模型开源大模型强化学习数学推理大模型
AI日报 AI日报 – 2025-05-02(下) AI 智能体AI 编程智能体ChatBot ArenaClaude IntegrationsDeepSeek-Prover-V2GeminiParakeet-TDT-0.6B-v2Phi-4-reasoningQwen3小模型推理能力排行榜幻觉数学定理证明第三方应用集成딥시크-프루버-V2 AI日报 AI日报 – 2025-05-02(上) Agentic RAG核心要素AGI辩论AI伴侣伦理AI模型发布Gemini App战略Karpathy视觉化交互界面Liquid Foundation Models架构LLM交互界面NotebookLM系统提示词逆向工程Phi-4-Reasoning训练方法Qwen3模型RAG技术Transformer替代架构 AI日报 AI日报 – 2025-05-01(下) AI智能体协议DeepSeek-Prover-V2DeepSeek-Prover-V2定理证明性能DiffTransformer长文本建模GPT-4o更新回滚GPT-4o过度谄媚行为修复LLM后训练技术MoE推理优化Phi-4推理模型Qwen3-235B多语言支持微软Phi-4-reasoning-plus模型通义千问Qwen3 AI日报 AI日报 – 2025-05-01(上) AI供应链AI供应链风险分析AI评估方法DeepSeek-Prover-V2DeepSeek-Prover-V2-671BLMArena排行榜公平性Qwen2.5-Omni-3BQwen3RLVR数学推理方法多模态模型开源大模型强化学习数学推理大模型
AI日报 AI日报 – 2025-05-02(上) Agentic RAG核心要素AGI辩论AI伴侣伦理AI模型发布Gemini App战略Karpathy视觉化交互界面Liquid Foundation Models架构LLM交互界面NotebookLM系统提示词逆向工程Phi-4-Reasoning训练方法Qwen3模型RAG技术Transformer替代架构 AI日报 AI日报 – 2025-05-01(下) AI智能体协议DeepSeek-Prover-V2DeepSeek-Prover-V2定理证明性能DiffTransformer长文本建模GPT-4o更新回滚GPT-4o过度谄媚行为修复LLM后训练技术MoE推理优化Phi-4推理模型Qwen3-235B多语言支持微软Phi-4-reasoning-plus模型通义千问Qwen3 AI日报 AI日报 – 2025-05-01(上) AI供应链AI供应链风险分析AI评估方法DeepSeek-Prover-V2DeepSeek-Prover-V2-671BLMArena排行榜公平性Qwen2.5-Omni-3BQwen3RLVR数学推理方法多模态模型开源大模型强化学习数学推理大模型
AI日报 AI日报 – 2025-05-01(下) AI智能体协议DeepSeek-Prover-V2DeepSeek-Prover-V2定理证明性能DiffTransformer长文本建模GPT-4o更新回滚GPT-4o过度谄媚行为修复LLM后训练技术MoE推理优化Phi-4推理模型Qwen3-235B多语言支持微软Phi-4-reasoning-plus模型通义千问Qwen3 AI日报 AI日报 – 2025-05-01(上) AI供应链AI供应链风险分析AI评估方法DeepSeek-Prover-V2DeepSeek-Prover-V2-671BLMArena排行榜公平性Qwen2.5-Omni-3BQwen3RLVR数学推理方法多模态模型开源大模型强化学习数学推理大模型
AI日报 AI日报 – 2025-05-01(上) AI供应链AI供应链风险分析AI评估方法DeepSeek-Prover-V2DeepSeek-Prover-V2-671BLMArena排行榜公平性Qwen2.5-Omni-3BQwen3RLVR数学推理方法多模态模型开源大模型强化学习数学推理大模型