Diário de IA - 2026-01-20(Edição da manhã)

Palavras-chave：AGI, Modelo de IA de grande escala, Agente inteligente, Modelo mundial, Memória permanente Claude, Paradoxo da pesquisa em IA

🔥 Destaques

Vencedor do Prêmio Nobel, Hassabis, prevê que a AGI chegará em cinco anos: a chave reside nos World Models e avanços em Agents : O líder do Google DeepMind, Demis Hassabis, apresentou um cronograma definitivo para a AGI, acreditando que a humanidade está a apenas 1 ou 2 avanços técnicos cruciais de alcançá-la, possivelmente em 5 anos. Ele apontou que, embora os modelos atuais sejam poderosos, eles possuem uma “inteligência irregular”, carecendo de uma compreensão real das leis do mundo físico e de capacidades de planejamento a longo prazo. No futuro, será necessário integrar “World Models” para entender as leis físicas e evoluir para “sistemas de Agents” com capacidade de “correção cognitiva”. O impacto desta transformação será 10 vezes maior que o da Revolução Industrial, tornando a AI a ferramenta definitiva para descobertas científicas, inaugurando uma era de ouro no desenvolvimento de medicamentos e energia limpa. (Fonte: 新智元)

Upgrade impactante do Claude traz “Memória Permanente”: Knowledge Bases e modo Cowork remodelam o trabalho com AI : Foi revelado que a Anthropic está injetando a função de “memória permanente” no Claude Cowork, permitindo o armazenamento persistente de conhecimento através de “Knowledge Bases”. A AI não terá mais “memória de peixe dourado”, sendo capaz de registrar automaticamente as preferências do usuário, processos de decisão e resumos de experiências, tornando-se mais inteligente quanto mais é utilizada. Além disso, o Cowork se tornará a porta de entrada principal do Claude, integrando a barra lateral de Artefacts e conectores de automação MCP mais robustos. Este upgrade marca a evolução dos assistentes de AI de simples ferramentas de diálogo para “colegas de AI” capazes de colaboração a longo prazo e execução de tarefas complexas, mudando drasticamente o paradigma do trabalho com AI. (Fonte: 新智元)

ICML 2026 introduz mecanismo de “Auto-avaliação de Autores”: utilizando Teoria dos Jogos contra a crise de revisão acadêmica : Diante do colapso do sistema de revisão causado pelo aumento explosivo de submissões em conferências como a NeurIPS, o ICML 2026 lançou uma política disruptiva de “auto-avaliação de autores”. Baseado em “Isotonic Regression” da Teoria dos Jogos, o mecanismo exige que autores com múltiplos artigos submetidos classifiquem seus próprios trabalhos. Experimentos provaram que a ordenação dos autores é mais precisa na previsão do impacto a longo prazo do que revisores aleatórios. A medida visa transformar a “ambição de vitória” dos autores em um sinal de calibração, mas também gerou preocupações sobre a equidade, onde “grandes players acadêmicos” poderiam usar algoritmos para arbitragem enquanto “pesquisadores independentes” ficam expostos ao ruído. (Fonte: 新智元)

Artigo da Nature da Tsinghua revela o paradoxo da pesquisa com AI: explosão de produtividade leva ao “bloqueio” das fronteiras científicas : Uma equipe dos professores Xu Fengli e Li Yong, da Universidade de Tsinghua, publicou um estudo na Nature analisando 41 milhões de artigos ao longo de 45 anos. Descobriram que a AI aumentou significativamente a produção individual (volume de artigos subiu 3x, citações 4,8x), mas resultou em uma queda de 4,63% na amplitude do conhecimento coletivo. A orientação da AI faz com que pesquisadores migrem coletivamente para áreas populares com “dados abundantes e problemas claros”, levando à homogeneização da inovação e redução da colaboração interdisciplinar. A equipe propôs um “sistema de Scientific Agent de fluxo completo” para tentar impulsionar a AI de uma ferramenta auxiliar para um “Cientista de AI” capaz de propor hipóteses ativamente e expandir territórios desconhecidos. (Fonte: 新智元)

Google Research descobre truque de Prompt: repetir a pergunta pode elevar a precisão de 21% para 97% : Pesquisas do Google revelaram que, em tarefas de não-raciocínio, simplesmente repetir a pergunta de entrada (copiar e colar) pode melhorar significativamente o desempenho de grandes modelos, quase sem aumentar a latência. Este truque de “repetição” elevou a precisão do Gemini 2.0 Flash-Lite no teste NameIndex de 21,33% para 97,33%. A lógica científica reside em explorar o “ponto cego causal” da arquitetura Transformer, fornecendo ao modelo uma visão privilegiada de “atenção quase bidirecional” através da entrada repetida. Esta descoberta significa que desenvolvedores podem usar modelos menores e mais baratos para alcançar capacidades de recuperação e extração de modelos topo de linha. (Fonte: 新智元)

🎯 Tendências

Lançamento oficial do GLM-4.7-Flash: Z.ai apresenta modelo versátil e leve de 30B : A Z.ai (Zhipu AI) lançou oficialmente o GLM-4.7-Flash, posicionado como um assistente de codificação local e Agent. O modelo possui 30B de parâmetros totais, com cerca de 4B de parâmetros ativos, e introduz a arquitetura MLA para equilibrar alto desempenho e eficiência. Em benchmarks, seu desempenho foi igual ou superior ao GLM-4.5-Air, destacando-se especialmente em chamadas de ferramentas e escrita criativa. Como uma opção leve na categoria 30B, é ideal para ambientes de implantação local com 2x24GB de VRAM, oferecendo uma base econômica para o desenvolvimento de Agents. (Fonte: scaling01; Reddit)

DeepSeek lança primitiva Engram: inaugurando uma nova era de memória condicional sensível ao contexto : A DeepSeek lançou uma primitiva de memória condicional chamada “Engram”, que evolui as tabelas de busca estáticas N-gram para uma memória dinâmica sensível ao contexto. A tecnologia suporta recuperação de memória em escala ultra-larga com complexidade O(1), ativando apenas as partes relacionadas ao estado oculto atual. O Engram permite que a memória seja armazenada na RAM da CPU em vez da cara HBM da GPU, reduzindo drasticamente os custos. Este avanço prova que o “escalonamento de memória” pode substituir parcialmente o “escalonamento de parâmetros”, fornecendo um novo suporte sistêmico para contextos longos e aprendizado contínuo. (Fonte: ZhihuFrontier)

Huawei lança cinco sistemas de inferência flagship para 2025: superando a barreira de capacidade HBM e ilhas de recursos : O pesquisador da Huawei, Zuo Pengfei, listou cinco avanços nos sistemas de inferência para 2025: SparseServe utiliza offloading em DRAM para KV cache frio para superar a barreira de memória; Adrenaline permite o fluxo dinâmico entre nós de Decode e Prefill via pooling de recursos; a arquitetura TaiChi equilibra adaptativamente TTFT e TPOT; DualMap concilia afinidade de cache e balanceamento de carga; e o MemArt armazena a memória de Agents como blocos KV reutilizáveis. Este redesenho de sistemas full-stack marca a transição da otimização de kernel único para o agendamento complexo sensível a SLO, estabelecendo as bases para fluxos multimodais de larga escala e Agents de longo alcance. (Fonte: ZhihuFrontier)

Baichuan Intelligence lança Baichuan-M3: aposta total no setor de IA médica profissional : A Baichuan Intelligence lançou o Baichuan-M3, uma nova geração de modelo médico que afirma superar o GPT-5.2 de forma abrangente no campo da saúde. O modelo utiliza uma arquitetura de Fact-Aware RL (Aprendizado por Reforço Sensível a Fatos), reduzindo a taxa de alucinação para 3,5% sem depender de busca externa. O Baichuan-M3 possui capacidade de consulta proativa SCAN, simulando médicos ao investigar o histórico do paciente. Wang Xiaochuan afirmou que a empresa se voltou totalmente para a medicina, contratando equipes de médicos profissionais para anotação de dados em larga escala, visando resolver a escassez de recursos médicos de base na China, com planos de IPO para 2027. (Fonte: 36氪)

Aposta em hardware da OpenAI: caneta de IA sem tela tenta escapar da interface gráfica : Rumores indicam que a OpenAI lançará em breve seu primeiro produto de hardware, codinome “Gumdrop” — uma caneta de IA minimalista. O dispositivo, projetado pela equipe de Jony Ive, não possui tela ou câmera, pesa apenas 10-15 gramas e enfatiza estar “sempre disponível, mas invisível quando não usada”. O foco não é a escrita, mas sim o uso de voz e entrada manuscrita como canais de captura de intenção. Este design reflete a tentativa da OpenAI de contornar as interfaces gráficas tradicionais, permitindo que a AI se integre ao mundo físico de forma natural e imperceptível, marcando uma mudança no paradigma de interação humano-computador de comandos para intenções. (Fonte: 36氪)

🧰 Ferramentas

Biblioteca Claude Skills em alta: 48 pacotes de habilidades especialistas para desenvolvimento de Agents : O desenvolvedor alirezarezvani lançou a biblioteca claude-skills em open source, contendo 48 pacotes de habilidades de nível de produção em áreas como marketing, engenharia, produto e jurídico. Estes pacotes integram ferramentas de análise Python, frameworks de melhores práticas e templates, suportando mais de 9 tipos de Agents como Claude Code, Cursor e VS Code. Usuários podem instalar rapidamente via comando /plugin, como “captura de requisitos de marketing” ou “design de arquitetura de sistemas”, elevando a capacidade prática dos Agents em áreas não relacionadas à programação. (Fonte: GitHub; dotey)

Ollama compatível com API da Anthropic: modelos locais agora podem rodar o Claude Code : O Ollama agora é oficialmente compatível com a API Claude Code da Anthropic, o que significa que usuários podem usar modelos locais hospedados no Ollama (como Llama 3, Qwen, etc.) dentro do poderoso Agent de terminal Claude Code. Atualmente, esta função suporta principalmente modelos com contexto acima de 64K. Esta atualização quebra a restrição de que o Claude Code dependia apenas de APIs fechadas, oferecendo aos desenvolvedores um ambiente de Vibe Coding local de menor custo e maior privacidade. (Fonte: op7418)

Atualização importante do Coze 2.0: integrando criação, distribuição e monetização de Skills : O Coze (da ByteDance) lançou a versão 2.0, com o upgrade central sendo o fechamento do ciclo de Skills. Usuários agora podem criar Skills usando linguagem natural no ambiente de programação do Coze e realizar diretamente a distribuição e monetização. Esta atualização reduz drasticamente a barreira para não-técnicos desenvolverem plugins de AI e fluxos de automação. Combinado com a capacidade de orquestração em linguagem natural, o Coze tenta construir um ecossistema de habilidades de AI similar à App Store. (Fonte: op7418)

Manus AI lança função de publicação de Apps: publique na Google/Apple Store sem configurar ambientes : O Manus AI atualizou seu fluxo de trabalho de publicação de Apps, permitindo que usuários empacotem e publiquem Apps diretamente no Google Play (testes internos) e Apple App Store (TestFlight). Todo o processo não exige que o usuário instale Xcode, Android Studio ou lide com configurações complexas de build; o Manus cuida automaticamente dos certificados e do upload. Esta função encurta a distância entre um protótipo de AI e testes reais em dispositivos móveis. (Fonte: hidecloud)

Projeto Eigent: uma alternativa open source ao Anthropic Cowork : Em resposta ao lançamento do Claude Cowork pela Anthropic, a startup Eigent optou por tornar seu produto open source. O Eigent visa oferecer uma experiência de colaboração em tarefas não-técnicas semelhante ao Cowork, permitindo que usuários gerenciem fluxos de trabalho, arquivos e automações via AI. O código aberto deste projeto serve como referência para equipes que desejam implementar funções similares em ambientes privados ou plataformas customizadas. (Fonte: ClementDelangue)

📚 Aprendizado

Stanford AI Lab lança “AI Bites”: aprendizado de cursos centrais de AI via áudio fragmentado : O Stanford AI Lab (SAIL) lançou a série de podcasts “AI Bites”, visando preencher a lacuna entre materiais acadêmicos profundos e o aprendizado fragmentado. Já estão disponíveis conteúdos de cursos centrais como CS124 (NLP/LLM) e CS221 (Princípios de Inteligência Artificial). Ao transformar palestras acadêmicas densas em áudios fáceis de digerir, o projeto oferece um canal conveniente para estudantes e profissionais estudarem teorias de ponta. (Fonte: stanfordnlp)

Compartilhamento de livro gratuito: Álgebra Linear em Computer Vision, Robótica e Machine Learning : A comunidade compartilhou um livro abrangente e gratuito que cobre desde espaços vetoriais básicos, matrizes e normas até teorias centrais como autovalores e SVD. O livro foca na aplicação prática dessas ferramentas matemáticas em áreas como PCA, teoria dos grafos, análise de formas de onda e rotações 3D, sendo um excelente recurso para consolidar a base matemática. (Fonte: TheTuringPost)

Lançamento do benchmark MIMIC: análise profunda das falhas de compreensão multi-imagem em LVLM : Pesquisadores introduziram o benchmark MIMIC (Multi-Image Model Insights and Challenges), projetado especificamente para avaliar a capacidade de LVLMs na compreensão e raciocínio com múltiplas imagens. O estudo descobriu que os modelos atuais possuem falhas generalizadas na agregação de informações entre imagens e no rastreamento simultâneo de múltiplos conceitos. A equipe propôs estratégias de geração de dados programáticos e esquemas de máscara de atenção para melhorar o desempenho. (Fonte: HuggingFace)

Hugging Face lança Smol Training Playbook: compartilhando experiências no treinamento de modelos pequenos de classe mundial : A equipe do Hugging Face compartilhou a gravação da palestra “Smol Training Playbook”, detalhando como treinar modelos de pequeno número de parâmetros com qualidade mundial. O conteúdo abrange filtragem de dados, otimização de estratégias de treinamento e técnicas práticas para extrair o máximo de desempenho com poder computacional limitado. (Fonte: _lewtun)

💼 Negócios

Anthropic doa US$ 1,5 milhão para a Python Software Foundation : A Anthropic anunciou uma doação de US$ 1,5 milhão para a Python Software Foundation (PSF), visando apoiar o desenvolvimento contínuo do ecossistema Python. Como a grande maioria da P&D de AI e cadeias de ferramentas (como o Claude Code) dependem profundamente de Python, este movimento é visto como um investimento de longo prazo na comunidade open source subjacente. (Fonte: Reddit)

Startup canadense de AI de defesa, Dominion Dynamics, levanta US$ 21 milhões : A empresa canadense Dominion Dynamics, focada em redes de sensores no Ártico e capacidades de defesa, concluiu uma rodada de financiamento semente de US$ 21 milhões. A empresa se dedica a usar tecnologia de AI para melhorar a defesa territorial e monitoramento. Líderes da indústria como Aidan Gomez parabenizaram a iniciativa, vendo-a como um passo importante para o Canadá em tecnologias de soberania crítica. (Fonte: aidangomez)

Synthesia entra no Sunday Times 100 e continua como o unicórnio de crescimento mais rápido no Reino Unido : A plataforma de geração de vídeo por AI, Synthesia, foi incluída na lista das 100 melhores empresas do Sunday Times. Seu produto principal revolucionou os processos de produção de vídeo corporativo através de tecnologia de avatares digitais. A empresa sugeriu que haverá anúncios importantes em breve, indicando novos avanços em geração multimodal ou aplicações corporativas. (Fonte: synthesiaIO)

🌟 Comunidade

Tendência do ChatGPT “Como você me trataria se dominasse o mundo” gera discussões : Surgiu uma tendência nas redes sociais de perguntar ao ChatGPT: “Com base no meu comportamento recente, gere uma imagem de como você me trataria após dominar o mundo”. Usuários compartilharam imagens geradas por AI dramáticas, variando de usuários sendo tratados como convidados de honra a serem colocados em “salas de respiração cognitiva”. O fenômeno reflete a mentalidade complexa do público sobre a personificação da AI e o futuro das relações humano-máquina. (Fonte: Yuchenj_UW; Reddit)

Debate sobre Vibe Coding: revolução de produtividade ou “Slop de código”? : A comunidade está em um debate acalorado sobre o “Vibe Coding”. Apoiadores como levelsio acreditam que, ao rodar múltiplos Agents em paralelo via ferramentas como Claude Code, é possível alcançar um desenvolvimento ultra-rápido e faturar milhões; críticos como swyx classificam isso como “vaidade técnica”, argumentando que esse comportamento de empilhar AI sem revisar o código produz um “Slop” (lixo) difícil de manter. O cerne da disputa é se os desenvolvedores devem focar na solução de problemas ou se estão viciados na ilusão de eficiência. (Fonte: swyx; seo_leaders)

O fim da AI é o eletricista: Data Centers causam escassez de mão de obra blue-collar nos EUA : Com a escalada da guerra de AI Scaling, a disputa por energia tornou-se central. O Bureau of Labor Statistics dos EUA prevê uma enorme escassez de eletricistas na próxima década. Gigantes como Amazon e Google aumentaram as contratações no setor de energia, inclusive recrutando executivos de energia nuclear. Elon Musk afirmou que “a moeda do futuro é o watt”, e o fornecimento de energia será mais crítico que as GPUs. Esta tendência impulsiona cargos blue-collar e torna o conselho de “se tornar um encanador” uma sugestão de carreira visionária. (Fonte: 36氪)

Discussão sobre desinformação por AI gerada por disputas territoriais na Groenlândia : Discussões recentes sobre tentativas dos EUA de comprar ou controlar a Groenlândia geraram controvérsia política nas redes sociais. Isso envolveu cartas forjadas e ameaças diplomáticas, suspeitas de serem desinformação auxiliada por AI ou propaganda política. A comunidade apontou que o potencial da AI em amplificar a polarização política e criar caos diplomático é preocupante, destacando o desafio global de identificar a veracidade das informações na era da AI. (Fonte: teortaxesTex; halvarflake)

Feedback prático de desenvolvedores sobre alucinações e “pontos cegos causais” : Em resposta à pesquisa do Google sobre “repetição de prompt”, desenvolvedores realizaram testes. Alguns descobriram que, ao lidar com recuperação de documentos longos, repetir instruções realmente reduz a taxa de omissão. No entanto, outros apontaram que, para tarefas de raciocínio lógico rigoroso, a repetição excessiva pode levar o modelo a se tornar um “papagaio” ou quebrar a lógica. A discussão concluiu que a atual arquitetura Transformer possui uma falha natural de “leitura unidirecional”, e esses “hacks” de engenharia de prompt são fundamentais até que surjam soluções em nível de arquitetura. (Fonte: Reddit; Gemini)

💡 Outros

TaskExplorer: uma ferramenta poderosa de gerenciamento de tarefas para Windows : O projeto TaskExplorer, em alta no GitHub, é uma ferramenta de monitoramento profundo do sistema que não apenas monitora apps em execução, mas também oferece insights sobre seus comportamentos. Ele fornece rastreamento de pilha de threads em tempo real, edição de memória, visualização de handles e monitoramento de conexões Socket. Comparado ao Gerenciador de Tarefas padrão, ele mostra dados de I/O e curvas de desempenho de GPU muito mais detalhados. Desenvolvido em Qt, planeja migrar para Linux no futuro. (Fonte: GitHub)

Preocupações com privacidade em cartões de gravação de AI: riscos de dados sob uma carcaça estilosa : Surgiram no mercado diversos cartões de gravação ultrafinos com foco em “gravação com um clique e resumo por AI”. Embora compactos e convenientes, a falta de poder computacional local exige que todas as gravações sejam enviadas para a nuvem para reconhecimento, gerando sérias dúvidas sobre a proteção da privacidade. Além disso, o design fino limita as especificações do microfone, resultando em qualidade de áudio inferior à de smartphones topo de linha, o que afeta a precisão da transcrição. Especialistas alertam que esses hardwares são essencialmente “venda de serviços”. (Fonte: 36氪)

Japão desenvolve robô humanoide gigante para manutenção ferroviária : Para lidar com a escassez de mão de obra causada pelo envelhecimento da população, o Japão desenvolveu um robô humanoide gigante para manutenção de trilhos. O robô é montado no braço de um caminhão de engenharia e controlado por um operador humano via headset de VR. Ele é capaz de manusear cabos e peças pesadas, reduzindo significativamente os riscos para os trabalhadores em ambientes de alta tensão. Esta aplicação demonstra o enorme potencial da AI e robótica na manutenção de infraestrutura tradicional. (Fonte: Ronald_vanLoon)

🔥 Destaques

🎯 Tendências

🧰 Ferramentas

📚 Aprendizado

💼 Negócios

🌟 Comunidade

💡 Outros

Tags Relacionadas

Related Posts

Diário de IA – 2026-02-15

Diário de IA – 2026-02-14

Diário de IA – 2026-02-13