Palavras-chave:Módulo Engram, Cowork, Colaboração Gemini, Mecanismo de busca de conhecimento Transformer, Execução de tarefas por Agente de IA, Treinamento durante teste TTT-E2E
🔥 Destaques
DeepSeek lança módulo Engram, alcançando o desacoplamento entre armazenamento e computação: A DeepSeek, em conjunto com a Universidade de Pequim, publicou um artigo apresentando o módulo de “memória condicional” Engram. Esta tecnologia, através de modernizados Hash N-gram embeddings, dota o Transformer de um mecanismo nativo de “busca de conhecimento”, realizando uma recuperação determinística próxima de O(1). Experimentos mostram que o Engram-27B supera significativamente modelos puros de MoE sob parâmetros e computação equivalentes. Além de aumentar a reserva de conhecimento, a tecnologia libera a atenção das camadas superficiais do fardo da “memorização mecânica”, permitindo que as redes profundas se concentrem em Reasoning complexo, resultando em um salto nas capacidades de código e matemática. Esta rota de engenharia, que descarrega parâmetros massivos para a memória do host (CPU) com uma perda de inferência inferior a 3%, é vista como um primitivo central para a próxima geração de modelos esparsos, sendo altamente provável sua integração no futuro DeepSeek-V4 (Fonte: GitHub)

Anthropic lança produto estratégico Cowork, iniciando a era do “colega digital”: A Anthropic lançou oficialmente o Cowork (Research Preview), encapsulando as capacidades subjacentes do Claude Code em uma ferramenta gráfica voltada para usuários não técnicos. O Cowork permite que o Claude acesse diretamente pastas locais, com permissões para ler, editar e criar arquivos. Ele não é mais apenas um chatbot, mas um colaborador inteligente capaz de planejar etapas de forma autônoma e processar tarefas em paralelo (como organizar pastas de download, extrair dados de capturas de tela para gerar Excel ou redigir rascunhos de relatórios). O produto inclui um ambiente isolado de VM para garantir a segurança e suporta Browser automation. A comunidade acredita que isso marca uma mudança de paradigma da IA de “geração de conteúdo” para “execução de tarefas”, podendo representar um golpe fatal para diversas startups de aplicações de IA (Fonte: Anthropic)

Apple e Google fecham acordo de colaboração Gemini, Siri ganha um “cérebro externo”: Apple e Google emitiram uma declaração conjunta confirmando que os futuros Apple Foundation Models serão construídos com base no modelo Gemini e na tecnologia de nuvem do Google para impulsionar a Siri personalizada, que será lançada ainda este ano. Estima-se que a Apple pagará cerca de US$ 1 bilhão anualmente. A parceria é vista como uma “rendição transitória” da Apple diante do atraso em seus modelos próprios; o Gemini será responsável por tarefas complexas como resumos e planejamento, enquanto as funções básicas on-device continuarão sendo suportadas pelos modelos proprietários da Apple. O movimento fez o valor de mercado do Google ultrapassar US$ 4 trilhões pela primeira vez, ao mesmo tempo em que gerou críticas de Elon Musk sobre a “excessiva concentração de poder” e discussões sobre a marginalização da OpenAI no ecossistema da Apple (Fonte: Google)

TTT-E2E: Treinamento end-to-end em tempo de teste abre nova era de memória longa para LLMs: A pesquisa End-to-End Test-Time Training (TTT-E2E), publicada conjuntamente pela NVIDIA, Stanford e Astera Institute, causou grande impacto. A tecnologia defende que, sem a necessidade de novas arquiteturas radicais, é possível atualizar continuamente os pesos do modelo através da Next Token Prediction, utilizando o contexto como dados de treinamento durante a fase de inferência (tempo de teste). Este método comprime a experiência de contexto longo nos pesos do modelo, resolvendo efetivamente o problema da explosão do KV cache com o comprimento da sequência. O TTT torna o modelo um verdadeiro “aprendiz contínuo”, demonstrando extrema estabilidade ao processar sequências ultra-longas de milhões de Tokens, sendo considerado o caminho mais promissor para a modelagem de sequências puramente sub-quadráticas (Fonte: arXiv)

🎯 Tendências
Sakana AI lança DroPE: descartar Position Embeddings para realizar extrapolação de textos longos: A equipe de Llion Jones, autor principal do Transformer, lançou o DroPE em código aberto, propondo que os Position Embeddings são apenas “rodinhas de treinamento”. O DroPE descarta o Rotary Position Embedding (RoPE) durante a fase de inferência, exigindo menos de 1% do orçamento de pré-treinamento para uma calibração curta para desbloquear janelas de contexto massivas. Experimentos mostram que este método supera significativamente o escalonamento tradicional de RoPE nos testes LongBench e Needle In A Haystack, oferecendo uma nova abordagem de baixo custo para expandir capacidades de texto longo (Fonte: arXiv)
Benchmark BabyVision: a capacidade visual dos principais modelos de IA ainda é inferior à de uma criança de 3 anos: A avaliação BabyVision, lançada pela Sequoia China xbench e UniPatAI, mostra que em tarefas visuais com controle rigoroso de dependência de linguagem, a grande maioria dos modelos tem um desempenho muito inferior ao de uma criança de 3 anos. Mesmo o Gemini 3 Pro, de melhor desempenho, mal conseguiu passar no teste. O estudo aponta que a dependência excessiva dos modelos em Reasoning linguístico mascara sua falta sistemática de percepção espacial, rastreamento de trajetória e intuição geométrica; a inteligência multimodal do futuro deve reconstruir fundamentalmente a capacidade visual (Fonte: 36氪)

Recursive Language Models (RLM): DeepMind explora memória perfeita sem RAG: Pesquisadores da DeepMind propuseram os Recursive Language Models (RLM), que permitem ao modelo introspectar, dividir e chamar a si mesmo recursivamente para processar milhões de Tokens. Este mecanismo quebra as limitações das janelas de contexto tradicionais; o modelo não depende mais de RAG externo, mas alcança uma “memória perfeita” de informações massivas através da agregação recursiva de resultados. Este avanço sinaliza uma mudança qualitativa na forma como a IA processará documentos ultra-longos no futuro (Fonte: HuggingFace)

Expansão global da IA da ByteDance entra em nova fase de “ferramentas de eficiência”: A ByteDance tem feito movimentos intensos no exterior recentemente, lançando o AnyGen, um Agent para cenários de trabalho que compete com o Manus, focando em entregas de alta qualidade como redação de documentos e análise de dados. Ao mesmo tempo, o assistente de IA Dola já ultrapassou 10 milhões de usuários ativos diários no exterior. A ByteDance está tentando mudar de “exportar felicidade” (TikTok) para “vender eficiência”, entrando em combate direto com OpenAI e Anthropic no setor de Agents de escritório (Fonte: 36氪)

🧰 Ferramentas
Distil-Text2SQL: pequeno modelo de 4B alcança precisão de nível 685B localmente: A Distil-labs, através do ajuste fino do Qwen3-4B, permitiu que ele atingisse a precisão semântica do DeepSeek-V3 (685B) em tarefas de Text2SQL, superando-o na métrica de “Exact Match”. O modelo suporta execução local, processando dados CSV sem necessidade de upload para a nuvem, com tempo de resposta inferior a 2 segundos, demonstrando o enorme potencial de modelos pequenos para substituir modelos gigantes em tarefas verticais (Fonte: GitHub)

Upgrade do LlamaParse: OCR preciso de gráficos e imagens a baixo custo: A LlamaIndex atualizou sua ferramenta de análise LlamaParse para o modo Agentic, otimizada especificamente para elementos visuais complexos em documentos (como gráficos de linhas, gráficos de pizza e fluxogramas). Em comparação com o envio de capturas de tela de páginas inteiras para um VLM, esta ferramenta identifica as caixas delimitadoras de subelementos e extrai a lógica numérica, convertendo-os em Markdown de alta qualidade. É uma das soluções mais econômicas e eficientes para lidar com informações não textuais em documentos profissionais (Fonte: jerryjliu0)

Wobo: o “Tinder para busca de emprego” baseado em AI Agent: O Wobo é um aplicativo iOS que utiliza AI Agents para automatizar o envio de currículos. O usuário só precisa fazer o upload do currículo uma vez; a IA analisa sua “personalidade profissional” e, quando o usuário dá um “swipe para a direita” em uma vaga de interesse, ela navega automaticamente para sites externos complexos, gera cartas de apresentação personalizadas e responde a perguntas de triagem. A ferramenta visa acabar com o processo tedioso de preenchimento repetitivo de formulários, reduzindo um processo de aplicação de 20 minutos para 2 segundos (Fonte: Reddit)

📚 Aprendizado
Stanford CS224N 2026 retorna: novos tópicos sobre Agent e Reasoning: O clássico curso de processamento de linguagem natural CS224N anunciou seu retorno. O curso deste ano será ministrado por Diyi Yang e Yejin Choi. Além de cobrir os fundamentos de NLP com redes neurais, haverá um foco especial em AI Agents, uso de ferramentas e duas palestras dedicadas exclusivamente a “Reasoning”, acompanhando as tendências de ponta dos grandes modelos (Fonte: Stanford)

Andrew Ng lança “Build with Andrew”: construa aplicações Web sem código: Andrew Ng lançou um novo curso em sua última newsletter The Batch, orientando iniciantes sobre como construir e publicar aplicações Web funcionais utilizando ferramentas de IA apenas através de descrições de ideias em linguagem natural. O curso enfatiza o paradigma da “IA como desenvolvedor”, reduzindo a barreira de entrada para pessoas comuns no campo do desenvolvimento de software (Fonte: DeepLearningAI)

Resumo de 11 novas técnicas de Policy Optimization: O TuringPost resumiu 11 técnicas recentes de Policy Optimization, incluindo GDPO (Reward Decoupled Normalization), AT²PO (Agent Turn-based PO baseado em busca em árvore) e o muito comentado PC-GRPO (Puzzle Curriculum GRPO). Estas técnicas são fundamentais para melhorar a cadeia lógica e a capacidade de alinhamento de tarefas dos grandes modelos (Fonte: TuringPost)

💼 Negócios
OpenAI adquire startup de saúde Torch: A OpenAI anunciou a aquisição da Torch, uma startup de IA médica que integra resultados experimentais, registros de medicamentos e gravações de consultas. A equipe da Torch se juntará ao departamento ChatGPT Health. O movimento mostra que a OpenAI está acelerando a comercialização da IA na gestão de saúde e assistência clínica, buscando transformar o ChatGPT no assistente de saúde pessoal mais profissional do mundo (Fonte: OpenAI)

MiniMax estreia na bolsa de Hong Kong com alta de 109% no primeiro dia: O unicórnio chinês de IA MiniMax abriu capital na bolsa de Hong Kong em 9 de janeiro de 2026, com o preço das ações disparando 109% no primeiro dia, ultrapassando um valor de mercado de 150 bilhões de dólares de Hong Kong. Com o sucesso do Talkie e do Conch AI no mercado C-end, a MiniMax provou a atratividade no mercado de capitais de um caminho que não depende de contratos com grandes clientes, mas sim do aprofundamento em produtos multimodais para o consumidor. Este IPO é visto como um passo crucial para obter “oxigênio” na intensa corrida pelo poder computacional (Fonte: TuringPost)

xAI queima US$ 28 milhões por dia, avaliação caminha para US$ 230 bilhões: Embora a xAI tenha tido um prejuízo de US$ 7,8 bilhões nos três primeiros trimestres de 2025, ela concluiu recentemente uma rodada de financiamento de US$ 20 bilhões, atingindo uma avaliação de US$ 230 bilhões. Elon Musk está impulsionando o plano “Macrohard”, visando construir um sistema de IA autônomo capaz de alimentar os robôs da Tesla. Este modelo de “investimento massivo” reflete a barreira de entrada extremamente alta para os principais players de IA em infraestrutura e talentos (Fonte: 36氪)
🌟 Comunidade
Vibe Coding/Working gera grande debate sobre identidade profissional: Com a popularização do Claude Cowork e de várias ferramentas de Agent, o termo “Vibe Working” tornou-se popular. A comunidade discute que isso não é apenas um simples aumento de eficiência, mas sim a “monetização do conhecimento de domínio no cérebro”. O valor dos futuros engenheiros mudará de “escrever 100 mil linhas de código” para “projetar sistemas que permitam à IA escrever 100 mil linhas de código”. No entanto, há preocupações de que isso leve a um código de baixa qualidade (“Slop”) e a uma dependência excessiva da caixa-preta da IA (Fonte: nearcyan, amasad)
Detectores de IA são chamados de “puro golpe”: A comunidade do Reddit lançou críticas ferozes contra ferramentas de detecção de IA como o GPTZero, apontando taxas de falso positivo extremamente altas, chegando a marcar a Declaração de Independência como 90% gerada por IA. Os usuários acreditam que essas ferramentas medem a “familiaridade estatística” em vez da origem, resultando em muitos autores originais e estudantes sendo injustamente prejudicados. O setor educacional pede o fim da “caça às bruxas” e uma mudança para a avaliação da compreensão e aplicação do conteúdo pelos alunos (Fonte: Reddit)

Fundador da DeepSeek, Liang Wenfeng, é apelidado de “monge varredor do mundo da IA”: A comunidade discute fervorosamente o background em fundos quantitativos do fundador da DeepSeek, Liang Wenfeng. O High-Flyer Quant, sob seu comando, teve um retorno de 56,6% em 2025, superando em muito a média da indústria. Internautas comentam que ele investe o dinheiro ganho no mercado quantitativo em IA no estilo “YOLO”, seguindo rotas técnicas não convencionais (como MLA, Engram), demonstrando alto gosto arquitetônico e eficiência de engenharia, sendo visto como uma variável chave da IA chinesa contra os gigantes do Vale do Silício (Fonte: teortaxesTex)
💡 Outros
Fones de ouvido de IA Sweetpea podem ser lançados em setembro: Rumores indicam que o primeiro produto de hardware da OpenAI — codinome Sweetpea — projetado pela equipe de Jony Ive, assemelha-se a um seixo metálico e possui um chip de 2nm para suportar inferência local. A OpenAI estima que as vendas no primeiro ano chegarão a 50 milhões de unidades, desafiando diretamente a posição de mercado dos AirPods (Fonte: 36氪)

Segurança de IA torna-se o novo padrão para seleção corporativa em 2026: Com a expansão das permissões dos AI Agents, a preocupação das empresas com a segurança mudou de “opcional” para “pré-requisito”. Pesquisas mostram que 43% das empresas veem a segurança como o principal obstáculo para a implementação da IA. A tendência para 2026 é a segurança “embutida”, ou seja, a ativação padrão de auditoria e isolamento de permissões durante as fases de chamada de modelo e orquestração de Agents (Fonte: 36氪)