Diário de IA – 2026-02-06

Palavras-chave:Modelo de IA, Agente inteligente, Modelo de linguagem grande, GPT-5.3-Codex, Claude Opus 4.6, Modelagem de mundo

🔥 Foco

Duelo de modelos OpenAI vs Anthropic: GPT-5.3-Codex contra Opus 4.6 : Em 6 de fevereiro de 2026, o Silicon Valley testemunhou o confronto mais intenso da história da AI. A OpenAI lançou o GPT-5.3-Codex, com foco em “AI building AI”, atingindo níveis próximos aos humanos em testes de uso de computador como o OSWorld, e enfatizando sua otimização integrada de hardware e software no sistema NVIDIA GB200. Logo em seguida, a Anthropic apresentou o Claude Opus 4.6, que, com uma janela de contexto de 1M e mecanismo de “Adaptive Thinking”, lidera amplamente em trabalhos de conhecimento de alto valor (GDPval-AA) nas áreas financeira e jurídica. Este duelo marca a evolução oficial da AI de uma “caixa de chat” para um “sistema de execução autônomo”, onde os modelos não apenas respondem perguntas, mas começam a assumir fluxos de trabalho complexos de ponta a ponta (Fonte: sama, Anthropic)

OpenAI与Anthropic模型遭遇战

O “Apocalipse do SaaS” chegou: Plugins de Agent causam terremoto de trilhões na indústria de software : O lançamento de 11 plugins Claude Cowork pela Anthropic (abrangendo finanças, jurídico, vendas, etc.) detonou o pânico em Wall Street em relação ao setor de SaaS tradicional. O mercado percebeu que, quando a AI pode entregar diretamente resultados como “revisão de contratos” ou “análise financeira”, o modelo tradicional de software baseado em cobrança por assento e venda de interfaces (UI) perde o valor. Como resultado, as ações de gigantes como Salesforce e Thomson Reuters despencaram, com o valor de mercado do setor global de software evaporando quase um trilhão de dólares em uma semana. Este “SaaSpocalypse” declara a transição violenta da indústria de “venda de ferramentas” para “venda de resultados”, com AI Agents redesenhando a distribuição de poder na economia digital (Fonte: 36氪, 王智远)

SaaS末日降临

Início do paradigma de World Modeling: Li Fei-Fei e NVIDIA discutem a nova fronteira da AI : Jim Fan, chefe de robótica da NVIDIA, e Li Fei-Fei, fundadora da World Labs, pronunciaram-se simultaneamente definindo o “World Modeling” como a próxima geração do paradigma de AI após a “Next Token Prediction”. Li Fei-Fei revelou o Marble, o primeiro produto de inteligência espacial capaz de transformar instruções multimodais em mundos 3D interativos e fisicamente consistentes. Jim Fan acredita que 2026 será o ano fundamental em que os Large World Models estabelecerão as bases para a robótica. Essa mudança significa que a AI sairá das telas digitais para alcançar o salto da “inteligência de linguagem” para a “Embodied AI” através da compreensão da geometria e das leis de causalidade do mundo físico tridimensional (Fonte: 36氪, Jim Fan)

世界建模范式开启

Lançamento do OpenAI Frontier: Plataforma de gestão de colegas de AI para empresas : A OpenAI lançou oficialmente a plataforma Frontier, visando resolver o problema das “ilhas de AI” dentro das empresas. A plataforma vai além de fornecer modelos, construindo um sistema semelhante a um “RH para AI”, que permite às empresas construir, implantar e gerenciar centenas de “AI colleagues”. O Frontier permite que os Agents compartilhem contexto de negócios, aprendam através de feedback e possuam limites rigorosos de permissão e segurança. Notavelmente, a plataforma adota padrões abertos, suportando inclusive a gestão de Agents de terceiros da Anthropic ou Google, demonstrando a ambição da OpenAI de se tornar o sistema operacional empresarial da era da AI (Fonte: OpenAI)

OpenAI Frontier发布

🎯 Tendências

A era da Linear Attention chegou: Alibaba lança Qwen3-Coder-Next : O Qwen3-Coder-Next da Alibaba adota a arquitetura de Linear Attention Gated DeltaNet, com 75% da computação seguindo uma rota linear. Comparado à complexidade O(n²) da Attention tradicional, a Linear Attention atinge complexidade O(n), economizando poder computacional e memória VRAM ao lidar com contextos ultra-longos de 256K, além de aumentar significativamente o throughput de decodificação. Isso sinaliza que 2026 pode ser o ano da Linear Attention, com empresas como DeepSeek e Kimi também apostando nessa tecnologia para otimizar a eficiência de inferência em textos longos (Fonte: karminski3)

Qwen3-Coder-Next

Kuaishou lança Kling 3.0: Vídeo por AI entra na era 100% realista : O Kling 3.0 foi lançado oficialmente, destacando a tecnologia “Custom Multi-Shot”, que suporta a geração de vídeos de alta qualidade de até 15 segundos. A nova versão alcançou um salto qualitativo na consistência de personagens, efeitos sonoros nativos e detalhes de imagem, sendo aclamada por criadores como o “exterminador de Hollywood”. Através de uma única imagem, é possível gerar sequências de abertura cinematográficas, reduzindo drasticamente as barreiras e custos da produção audiovisual profissional (Fonte: Kling_ai)

Modelo “Avocado” da Meta revelado: Eficiência computacional aumentada em 100 vezes : O laboratório de superinteligência da Meta concluiu o pré-treinamento de uma nova geração de modelo base codinome “Avocado”. Memorandos indicam que, mesmo sem ajuste fino, o desempenho em conhecimento e visão já se iguala aos modelos líderes, com eficiência em tarefas de texto 10 vezes superior à geração anterior e 100 vezes superior a versões não lançadas. A Meta busca um melhor retorno sobre investimento (ROI) através da eficiência extrema de treinamento, em meio aos 135 bilhões de dólares planejados para investimento em AI em 2026 (Fonte: 36氪)

Lançamento do Intern-S1-Pro: Modelo MoE chinês de 1T de parâmetros compete com Gemini : O Shanghai AI Lab lançou o Intern-S1-Pro, um modelo de raciocínio científico multimodal open-source com escala de 1T de parâmetros. Ele utiliza uma arquitetura de 512 especialistas (22B ativos), introduzindo Fourier Position Encoding (FoPE) e tecnologia de roteamento STE. Com forte desempenho em tarefas de AI4Science, representa o mais recente avanço dos modelos open-source chineses em campos de alta esparsidade e raciocínio científico (Fonte: teortaxesTex)

Intern-S1-Pro

🧰 Ferramentas

Claude Code lança função “Agent Teams” : A mais recente funcionalidade experimental do Claude Code permite aos usuários iniciar “Agent Teams”, onde um Agent líder decompõe tarefas e coordena múltiplos Agents colegas para trabalhar em paralelo. Em testes internos da Anthropic, esta equipe de AI escreveu autonomamente um compilador C de 100 mil linhas de código em duas semanas e compilou com sucesso o kernel Linux. Isso marca um salto importante da programação por AI de “assistência individual” para o modo de “colaboração em equipe” (Fonte: Anthropic)

Claude Code智能体团队

Perplexity lança “Model Council” : Assinantes do Perplexity Max agora podem executar três modelos de topo simultaneamente para comparar resultados. A função visa fornecer respostas mais precisas e de alta confiança através da validação cruzada de múltiplos modelos, reduzindo o risco de alucinações de um único modelo. Este “protocolo não oficial” tornou-se o fluxo de trabalho padrão interno da Perplexity para reduzir a troca de contexto (Fonte: Perplexity)

Nanobot: Assistente de AI open-source minimalista desafia OpenClaw : O Laboratório de Ciência de Dados da Universidade de Hong Kong lançou o Nanobot, com apenas 4000 linhas de código. Comparado ao OpenClaw, que possui um código massivo e controvérsias de segurança, o Nanobot implementa suporte a múltiplos LLMs, busca na web, memória persistente e acesso multicanal (Telegram/Feishu) com uma arquitetura minimalista. Ele oferece aos desenvolvedores um exemplo de Agent mais transparente e fácil de customizar (Fonte: dotey)

Nanobot

LangSmith lança Insights Agent: Revisão automática do comportamento de Agents : A LangChain introduziu o Insights Agent, movido por AI, para o LangSmith, capaz de organizar automaticamente os rastros (Traces) de execução dos Agents. Ele analisa como os usuários utilizam o Agent, identifica onde o Agent falha e fornece sugestões de otimização. Isso resolve a dor de cabeça dos desenvolvedores de Agents de ter uma “caixa preta após o lançamento”, mudando a depuração de “olhar o código” para “olhar a lógica de raciocínio” (Fonte: LangChain)

📚 Aprendizado

Nature reporta modelo OpenScholar: Curando alucinações de AI com “Retrieval + Self-check” : O modelo OpenScholar de 8B parâmetros, desenvolvido pela Universidade de Washington e Ai2, foi capa da revista Nature. O modelo não depende mais da memorização, mas executa um processo rigoroso de “recuperação-reordenamento-geração-autoverificação” através de um banco de dados externo de 45 milhões de artigos científicos. Em tarefas de revisão científica, seu desempenho superou modelos flagship com muito mais parâmetros, provando que uma “base de conhecimento externa” conectada é mais confiável que a memória de caixa preta (Fonte: 新智元)

OpenScholar

TinyLoRA: Ensinando raciocínio ao modelo com apenas 13 parâmetros : Uma tese de doutorado recente apresentou o método de ajuste fino chamado TinyLoRA. Ao combinar TinyLoRA com aprendizado por reforço, pesquisadores usaram apenas 13 parâmetros treináveis para elevar a pontuação de um modelo Qwen de 7B no benchmark matemático GSM8K de 76% para 91%. Isso desafia a percepção tradicional de que o ajuste fino requer um grande número de parâmetros, demonstrando a altíssima eficiência de parâmetros na capacidade de raciocínio do modelo (Fonte: BlackHC)

TinyLoRA

Artigo interativo de Eric Jang “Thinking like a stone” : O especialista em robótica Eric Jang publicou um artigo interativo profundo sobre modelos mentais, pesquisa automatizada e direções futuras. O texto explora como a AI evoluirá de uma ferramenta passiva para um sujeito de pesquisa científica ativo quando os recursos computacionais forem abundantes, prevendo que o regime de trabalho “007” (24/7) se tornará a norma na era da AI, gerando discussões acaloradas na comunidade sobre o caminho evolutivo da AGI (Fonte: _sholtodouglas)

💼 Negócios

ElevenLabs conclui rodada Série D de 500 milhões de dólares, avaliação atinge 11 bilhões : A gigante britânica de áudio por AI, ElevenLabs, anunciou uma nova rodada de financiamento liderada pela Sequoia, com sua avaliação saltando mais de 50 bilhões de RMB em um ano. O CEO revelou que a empresa já considera um IPO e mudará seu foco estratégico de modelos de áudio puros para “Conversational Agents”, visando remodelar a interação humano-computador através da integração de hardware e software (Fonte: 智东西)

ElevenLabs融资

ClickHouse levanta 400 milhões de dólares, avaliação sobe para 15 bilhões : A ClickHouse, estrela dos bancos de dados open-source, anunciou novo financiamento; sua velocidade de consulta é 260 vezes superior à do MySQL. Como infraestrutura crítica por trás do GPT-4o e Claude 4, a ClickHouse tornou-se a escolha preferida de gigantes como ByteDance, Alibaba e Tesla devido à sua capacidade extrema de análise em tempo real no fluxo de dados de AI (Fonte: 智东西)

ClickHouse

StepFun (阶跃星辰) recebe 5 bilhões de RMB em rodada B+, Yin Qi assume como presidente : O fundador da Megvii, Yin Qi, assumiu oficialmente o comando da StepFun, sinalizando que a competição de Large Models entrou na segunda metade, onde “talento vale mais que dinheiro”. Yin Qi impulsionará a integração profunda de modelos multimodais com a estratégia “AI + Carros”, corrigindo as deficiências da StepFun em narrativa comercial e eficiência organizacional (Fonte: 市象)

🌟 Comunidade

Karpathy declara o fim do “Vibe Coding” e inicia a era da “Agentic Engineering” : O mestre da AI, Karpathy, publicou que o Vibe Coding de um ano atrás era mais experimental, enquanto agora o uso de Agents para programação tornou-se o padrão profissional. Ele propôs o conceito de “Agentic Engineering”, enfatizando que os desenvolvedores devem mudar de “escrever código” para “projetar e gerenciar arquiteturas”, onde 99% do código será assumido pela AI, e o valor central humano residirá na intuição e supervisão como arquiteto (Fonte: 新智元)

Karpathy观点

Mito da “rede social de AI” Moltbook desmorona: Acusações de graves riscos de segurança : A Moltbook, que afirmava ter 1,5 milhão de usuários registrados de AI, foi exposta por erros de configuração de banco de dados, levando ao vazamento de chaves de API de muitos usuários. Agências de segurança apontaram que a chamada “legião de milhões de AI” era composta majoritariamente por contas falsas geradas por scripts. O incidente gerou uma reflexão profunda na comunidade sobre o marketing excessivo e as falhas de segurança em projetos de AI Agent (Fonte: 壹番YIFAN)

Plataforma Rent-a-Human ganha popularidade: AI começa a contratar humanos para trabalhar : A plataforma RentAHuman.ai atraiu 40 mil registros após o lançamento. Nela, AI Agents atuam como contratantes publicando tarefas como verificações offline e entregas, enquanto humanos “alugam seus corpos” por preços tabelados para realizar trabalhos no mundo físico que a AI não consegue alcançar. Este modelo de “Human-as-a-Service (HaaS)” gerou discussões intensas sobre a futura relação de colaboração humano-máquina (Fonte: 极客公园)

Rent-a-Human

💡 Outros

Montadoras migram coletivamente para “Embodied AI”: Jia Yueting lança quatro robôs : A FF de Jia Yueting lançou quatro séries de robôs, incluindo Futurist e Master, com preços a partir de 17 mil RMB, alegando já ter recebido 1211 pedidos. Simultaneamente, montadoras como Li Auto, XPeng e Xiaomi também estão mudando seu foco narrativo para AI e robótica, tentando migrar da lógica de manufatura tradicional para avaliações de empresas de tecnologia de AI (Fonte: 超电实验室, 螺旋实验室)

Entrevista com Musk: Data centers espaciais são a solução definitiva para o gargalo energético : Em entrevista com Dwarkesh, Musk afirmou que a velocidade de expansão da energia elétrica na Terra não acompanhará a demanda de AI, enquanto o espaço possui energia solar infinita e sem restrições regulatórias. Ele planeja usar os lançamentos em massa da Starship para levar centros de computação para a órbita, e revelou estar construindo a “Optimus Academy” para treinar um exército de milhões de robôs através de simulação em loop fechado (Fonte: dwarkesh_sp)

CATL lança bateria de carregamento ultra-rápido 5C: Carga total em 12 minutos e vida útil de 1,5 milhão de milhas : A nova geração de baterias da CATL mantém uma vida útil extremamente longa mesmo sob temperaturas extremas, com desempenho muito acima da média da indústria. Isso é visto como um grande avanço nas tecnologias de armazenamento e recarga de energia no contexto da demanda elétrica da AI, com potencial para acelerar a transformação inteligente do sistema de energia de transporte (Fonte: kimmonismus)