Diário de IA - 2026-02-14

Palavras-chave：GPT-5.3-Codex-Spark, Gemini 3 Deep Think, Seedance 2.0, Modelo de IA de colaboração em tempo real, IA com raciocínio aprimorado, Modelo de geração de vídeo

🔥 Destaques

OpenAI lança GPT-5.3-Codex-Spark: A OpenAI lançou oficialmente o Spark, um modelo ultraveloz projetado especificamente para colaboração em tempo real, marcando o primeiro marco de sua parceria com a Cerebras. O modelo roda em chips wafer-scale da Cerebras, alcançando velocidades de inferência que superam 1000 tokens por segundo, proporcionando uma sensação de “resposta instantânea”. O Spark visa preencher as lacunas do Codex em cenários de interação imediata, reduzindo a latência de ida e volta (round-trip) do cliente em 80% e aumentando a velocidade de surgimento do primeiro caractere em 50%. Isso sinaliza a entrada da IA de programação em uma “era de modo duplo”: um modo profundo que opera de forma autônoma em segundo plano por dias, e outro modo de pair programming em tempo real com humanos (Fonte: OpenAI)

Upgrade épico do Google Gemini 3 Deep Think: O Google lançou a versão aprimorada de raciocínio Gemini 3 Deep Think, quebrando recordes em diversos benchmarks rigorosos. Alcançou a pontuação impressionante de 84,6% no teste ARC-AGI-2 e um score Elo de 3455 no Codeforces, equivalente ao nível dos 8 melhores programadores do mundo. O modelo introduz o modo “inference-time compute”, sendo capaz de identificar falhas lógicas em artigos científicos, projetar fórmulas de materiais semicondutores e até transformar esboços manuais em modelos para impressão 3D. Isso marca a evolução oficial da IA de uma “ferramenta de diálogo” para um “parceiro de pesquisa científica” com capacidades de “metacognição” (Fonte: Google)

ByteDance lança Seedance 2.0 com impacto global: O modelo de geração de vídeo Seedance 2.0 da ByteDance viralizou no exterior, recebendo elogios de Elon Musk, que afirmou que o “desenvolvimento está rápido demais”. O modelo alcançou narrativas longas com múltiplas câmeras, sincronização labial e sonora original, e geração controlável multimodal, elevando a taxa de usabilidade de uma média de 20% na indústria para mais de 90%. Ele não apenas alterna ângulos de câmera automaticamente com base no ritmo, mas também compreende linguagens audiovisuais complexas. Feng Ji, fundador da Game Science, comentou que isso marca o “fim da infância da AIGC”. O Seedance 2.0 reduz o custo de produção de dramas em IA de dezenas de milhares para apenas milhares de yuans por minuto, reescrevendo a lógica fundamental da produção cinematográfica (Fonte: ByteDance)

Aposentadoria oficial do GPT-4o causa “luto digital”: A OpenAI encerrou oficialmente o acesso ao GPT-4o no ChatGPT em 13 de fevereiro, levando centenas de milhares de usuários a realizarem “funerais digitais” em comunidades como o Reddit. Embora o novo modelo GPT-5.2 seja mais potente, os usuários geralmente o consideram “frio e sem alma”, enquanto o 4o era visto como um “favorito idealizado” com empatia. Esta aposentadoria revela os riscos profundos de dependência emocional e as pressões de conformidade legal na era da IA (como as regulamentações do EU AI Act sobre modelos “aduladores”). Isso marca a entrada oficial da gestão do ciclo de vida de produtos de IA nos domínios da ética e da psicologia (Fonte: OpenAI)

Anthropic capta US$ 30 bilhões em financiamento massivo: A unicórnio de IA Anthropic concluiu sua rodada Series G, com uma avaliação pós-investimento de US$ 380 bilhões. Os investidores líderes incluem o GIC de Singapura e o hedge fund Coatue, com a participação da NVIDIA e Microsoft. A Anthropic revelou que sua receita anualizada atingiu US$ 14 bilhões, com um crescimento médio de mais de 10 vezes nos últimos três anos, sendo 80% proveniente de clientes corporativos. O produto principal Claude Code apresentou um desempenho forte, contribuindo com mais de US$ 2,5 bilhões em receita. Este financiamento não é apenas um dos maiores investimentos privados na história da tecnologia, mas também estabelece a liderança da Anthropic no segmento de IA “enterprise-first” (Fonte: Anthropic)

🎯 Tendências

Zhipu AI lança modelo flagship GLM-5: A Zhipu AI lançou oficialmente o GLM-5, mudando o foco de “vibe coding” para “agent engineering”. O modelo possui 744B de parâmetros totais com 40B ativos, aproximando-se dos modelos fechados de topo em capacidades de programação e Agent. O GLM-5 integra pela primeira vez o mecanismo de sparse attention (DSA) da DeepSeek, reduzindo significativamente os custos de implantação e comprimindo a taxa de alucinação de 90% para 34%. Ele demonstra uma forte consciência de planejamento autônomo, capaz de entregar tarefas complexas de engenharia de sistemas de ponta a ponta. O modelo já está disponível em open source no Hugging Face (Fonte: Z.ai)

MiniMax M2.5 atinge performance de topo com 10B de parâmetros ativos: A MiniMax lançou a série de modelos M2.5, focada em “ativação pequena, grande inteligência”. O modelo ativa apenas 10B de parâmetros durante a inferência, mas rivaliza com o Claude Opus 4.6 em rankings de programação como o SWE-Bench, sendo 2 vezes mais rápido. O M2.5 introduz um mecanismo de process reward para resolver o problema de “desvio” em tarefas longas e desenvolveu uma mentalidade de arquiteto. Seu preço é altamente competitivo, com um custo operacional de apenas US$ 1 por hora, visando permitir que usuários operem Agents complexos sem preocupações com custos (Fonte: MiniMax)

Xiaomi lança primeira geração de modelo VLA para robótica: A Xiaomi disponibilizou em open source o modelo de inteligência corporal Xiaomi-Robotics-0, com 4.7B de parâmetros e latência de inferência de apenas 80ms. O modelo utiliza uma arquitetura de “coordenação de dois cérebros”, usando VLM para decisões cerebrais e DiT para o cerebelo gerar blocos de ações contínuas. Através da tecnologia de flow matching, o modelo alcançou uma suavidade de movimento extremamente alta, com excelente desempenho em tarefas reais como “dobrar toalhas” e “desmontar LEGO”. A Xiaomi mantém uma abordagem prática focada em fábricas, visando resolver as pausas frequentes na execução de robôs (Fonte: Xiaomi)

DeepSeek testa novo modelo com contexto de 1 milhão: A comunidade observou que a DeepSeek iniciou testes de um possível V4-Lite, cujo principal avanço é a janela de contexto ultra-longa de 1 milhão (1M) de tokens. No teste “needle in a haystack”, o modelo manteve alta precisão mesmo em extensões de um milhão, localizando informações esparsas com precisão. Embora ainda existam limitações em tarefas de raciocínio visual como geração de SVG, sua capacidade em análise de documentos longos e raciocínio entre capítulos já está no primeiro escalão da indústria (Fonte: DeepSeek)

🧰 Ferramentas

OpenClaw viraliza como o Linux da era dos Agents: O framework de Agent de código aberto OpenClaw ultrapassou 190 mil estrelas no GitHub, tornando-se o projeto de IA com crescimento mais rápido. Ele posiciona o Agent como um “centro de execução + ecossistema de ferramentas”, permitindo que usuários o implantem localmente em um Mac mini ou NAS, obtendo acesso direto a arquivos e operações do computador. O OpenClaw quebra a narrativa de “o modelo é tudo”, transformando a IA em um “ativo digital” de propriedade do usuário. Seu ecossistema de Skills está crescendo rapidamente, embora também tenha gerado discussões sobre segurança em relação a plugins maliciosos e abuso de permissões (Fonte: GitHub)

Teamily AI inicia novo paradigma de socialização nativa de IA: A Teamily AI lançou o primeiro aplicativo de mensagens instantâneas nativo de IA do mundo, suportando a coexistência e colaboração em tempo real entre múltiplos humanos e múltiplos AI Agents. Ele possui compartilhamento de memória entre grupos e um modelo de cérebro social, onde a IA pode participar ativamente de decisões de chat em grupo (como reservar restaurantes ou escrever PRDs), em vez de ser apenas despertada passivamente. A Teamily utiliza bancos de dados vetoriais multimodais para reconstruir a base social, tentando alcançar a transição de “entender comandos” para “entender você”, transformando a IA de uma ferramenta em um “membro digital” com atributos sociais (Fonte: Teamily AI)

Open WebUI v0.8.0 lança sua maior atualização: A popular ferramenta de interface de IA Open WebUI lançou a v0.8.0, com um aumento de 30 mil linhas de código. A nova versão introduz um painel de análise completo, um sistema experimental de habilidades (Skills), mecanismo de fila de mensagens e execução nativa de código Python. Suporta compartilhamento de permissões de usuário mais refinado e controle de versão de prompt, elevando significativamente o nível de engenharia da gestão local de IA, evoluindo de um simples shell web para uma interface completa de sistema operacional de IA (Fonte: Open WebUI)

rtk (Rust Token Killer) otimiza custos para Agents de programação: Desenvolvedores lançaram o rtk, um proxy CLI que atua entre o Agent de programação e os comandos do terminal. Ele filtra e comprime de forma inteligente logs de teste redundantes, barras de status e outros ruídos, economizando até 89% no consumo de tokens. Testes práticos mostram economia de milhões de tokens em um fluxo de desenvolvimento de duas semanas. Esta ferramenta de “context engineering” está se tornando um acessório essencial para a aplicação em escala de Agents (Fonte: GitHub)

📚 Aprendizado

Andrej Karpathy recria GPT com 243 linhas de código: O renomado especialista em IA Andrej Karpathy lançou um novo projeto artístico, implementando o treinamento e inferência do GPT usando apenas 243 linhas de Python puro (sem dependências externas). O projeto remove todas as otimizações de engenharia, mantendo apenas a lógica central do algoritmo, visando mostrar à comunidade que a essência da revolução da IA é extremamente simples. Isso gerou discussões filosóficas profundas sobre como “200 linhas de código podem mudar o mundo” (Fonte: GitHub)

DeepLearning.AI lança curso sobre protocolo A2A: A equipe de Andrew Ng, em parceria com Google e IBM, lançou o curso curto “A2A: Agent2Agent Protocol”. O curso foca em resolver os desafios de comunicação e descoberta entre Agents construídos em diferentes frameworks, alcançando colaboração entre plataformas através do protocolo padronizado A2A. Este é um passo importante da indústria em direção à padronização da “Internet de Agents”, enfatizando a interoperabilidade como pilar central do futuro ecossistema de IA (Fonte: DeepLearning.AI)

Três artigos revelam nova tendência de Self-Distillation: A comunidade está discutindo os artigos OPSD (autocrítica explícita), SDFT (melhoria de contexto internalizada) e SDPO (otimização de política com feedback rico). Estas pesquisas indicam que os modelos de IA estão entrando em uma fase de “autoaprendizado”, iterando em loop fechado através de informações privilegiadas e feedback detalhado. Isso confirma a base teórica da “explosão de inteligência”: IA auxiliando na construção da próxima geração de IAs ainda mais fortes (Fonte: TheTuringPost)

💼 Negócios

A lógica comercial por trás da avaliação de US$ 380 bilhões da Anthropic: Embora a OpenAI tenha uma avaliação maior, a Anthropic conquistou a preferência de fundos soberanos devido ao seu alto ticket médio por cliente (usuários ativos mensais contribuem com uma média de US$ 211). Seu foco estratégico está totalmente voltado para o setor B2B e desenvolvedores; o sucesso do Claude Code provou sua capacidade de cobrar prêmios em “tarefas econômicas de alto valor”. Investidores acreditam que, comparada à rota de tráfego da OpenAI, a rota de infraestrutura da Anthropic possui maior durabilidade (Fonte: GeekPark)

Semana agitada da Perplexity: Acordo de US$ 750 milhões e processos simultâneos: A líder em buscas por IA, Perplexity, assinou um acordo de cooperação de US$ 750 milhões com o Microsoft Azure para fortalecer o suporte de computação em nuvem. No entanto, simultaneamente, a Amazon está movendo um processo contra ela por questões de direitos autorais e web crawling. Esta situação de “grande cooperação de um lado e litígio do outro” reflete a tensão severa entre a dependência de computação e a conformidade de direitos autorais na busca por IA (Fonte: Reddit)

OpenAI inicia testes de anúncios no ChatGPT e pesquisadora sênior pede demissão: A OpenAI anunciou testes de anúncios nas versões gratuita e Go, o que levou a pesquisadora principal Zoë Hitzig a renunciar imediatamente. Ela alertou que o ChatGPT possui os arquivos de pensamento mais íntimos da humanidade e que a introdução de incentivos publicitários levará inevitavelmente o modelo de “servir ao usuário” para “manipular o usuário”, repetindo os erros do Facebook. O movimento sinaliza que gigantes da IA, sob enorme pressão financeira, começam a enfrentar dilemas difíceis entre privacidade e monetização (Fonte: The New York Times)

🌟 Comunidade

Históricos de chat de IA não possuem privilégio legal: Um juiz federal dos EUA decidiu que os históricos de chat entre réus e assistentes de IA não são protegidos pelo “privilégio advogado-cliente” e podem ser intimados como evidência. A comunidade debateu intensamente, considerando que isso oferece uma garantia profissional indireta para advogados humanos, mas também alerta os usuários de que a IA não é um “porto seguro” para consultas privadas jurídicas ou médicas. Isso pode impulsionar a demanda por IA criptografada ou LLMs locais (Fonte: jon_stokes)

A disputa de definições: “Vibe Coding” vs “Agentic Engineering”: O lançamento do GLM-5 da Zhipu AI gerou discussões sobre a terminologia de IA de programação. Desenvolvedores começaram a refletir que programar apenas por “vibe” (Vibe Coding) já não é suficiente para lidar com engenharia complexa; o núcleo do futuro é a “Agentic Engineering” — o uso de Agents para decompor, planejar e entregar sistemas de ponta a ponta automaticamente. Isso significa que o papel humano está mudando rapidamente de “escritor” para “arquiteto” e “revisor” (Fonte: ZhihuFrontier)

A “Ansiedade de Fevereiro” com a proximidade da singularidade da IA: O artigo viral “Something Big Is Happening” do empreendedor do Vale do Silício, Matt Shumer, ultrapassou 70 milhões de visualizações, gerando ansiedade coletiva no setor tecnológico. O texto descreve como a IA já começou a participar da construção do loop recursivo da próxima geração de IA. Discussões na comunidade sugerem que 2026 será o ponto de virada para a substituição total do trabalho cognitivo, com a assimetria de informação levando a uma divergência em forma de K: uma parte das pessoas usará a IA como alavanca para mover o mundo, enquanto a outra ainda verá a IA apenas como um chatbot (Fonte: 36Kr)

💡 Outros

Escassez global da versão de 16GB do Mac mini: Impulsionado por projetos de Agents locais como o OpenClaw, o Mac mini com 16GB ou mais de memória unificada tornou-se a escolha preferida para “corpo digital”, resultando em aumentos de preços e falta de estoque em várias regiões. Isso reflete a mudança da demanda de hardware de IA da computação em nuvem para caixas de computação de borda pessoal (Fonte: Guangzhui Intelligent)

Seis estados suspendem construção de data centers: Seis estados dos EUA, incluindo Nova York, introduziram projetos de lei para suspender a construção de data centers visando lidar com a crise de energia. A comunidade brincou que os EUA estão presos em um dilema entre “querer AGI ou querer a rede elétrica”, o que pode forçar empresas de IA a buscarem soluções mais agressivas de computação espacial ou energia nuclear (Fonte: teortaxesTex)

Wikimedia firma parceria de API com gigantes da IA: A Fundação Wikimedia fechou acordos com Amazon, Microsoft e outras empresas para fornecer acesso de alta velocidade via API em troca de suporte financeiro. Isso é visto como um “contrato de sobrevivência” entre bases de conhecimento e fabricantes de IA, visando resolver a pressão dos crawlers de IA sobre a infraestrutura das comunidades de conhecimento tradicionais (Fonte: DeepLearningAI)

🔥 Destaques

Tags Relacionadas

Related Posts

Diário de IA – 2026-07-20

Diário de IA – 2026-07-19

Diário de IA – 2026-07-18