Tag: Sonnet 4

AI Daily – 2025-05-23(Evening)

agent AGENTIF benchmark test AI Model ASL-3 safety rating Claude 4 Behavior and Safety Evaluation Report Claude 4 Opus coding capability Multimodal multimodal time-series large model ChatTS safety evaluation Sonnet 4 SWE-bench Verified score

AI Daily – 2025-05-23(Morning)

AI Agent AI agent long-term task processing AI Model AI model memory mechanism AI safety Anthropic Anthropic API Claude 4 Claude 4 safety protection ASL-3 Claude Opus 4 coding capabilities coding model Opus 4 Sonnet 4