Diário de IA – 2026-01-14(Edição da manhã)

Palavras-chave:Engram, Agente de IA, Modelo de Grande Escala, Memória Condicional, Agente de Cowork para Escritório, Integração do Gemini com Siri

🔥 Destaque

DeepSeek lança Engram: introduzindo memória condicional para desafiar a arquitetura MoE tradicional : A DeepSeek lançou um novo primitivo de modelagem chamado Engram, projetado para resolver a ineficiência do Transformer na busca de conhecimento. O Engram desacopla a recuperação de conhecimento estático da computação neural por meio de um mecanismo de busca com complexidade O(1). A pesquisa descobriu uma lei de escala em forma de U entre computação (MoE) e armazenamento (Engram). Ao substituir parte dos especialistas MoE por tabelas de busca, o Engram melhorou significativamente as capacidades de raciocínio lógico, código e matemática em uma escala de 27B parâmetros, apresentando desempenho superior na recuperação de textos longos. Esta filosofia de design, no estilo “bitter lesson”, marca a evolução das arquiteturas de AI do simples empilhamento de parâmetros para uma sinergia mais eficiente entre armazenamento e computação (Fonte: DeepSeek)

DeepSeek发布Engram

Anthropic lança Cowork: AI Agent evolui de ferramenta de código para escritório geral : A Anthropic lançou oficialmente o Cowork, um Agent de desktop construído com a tecnologia Claude Code, destinado a fornecer capacidade de execução de tarefas ponta a ponta para usuários não técnicos. O Cowork roda em uma sandbox de máquina virtual Ubuntu protegida, podendo acessar diretamente pastas autorizadas pelo usuário para ler/escrever arquivos, criar tabelas e organizar dados. Sua criação surgiu do uso “transversal” do Claude Code por cientistas de dados internos e funcionários não técnicos. Isso marca a mudança do paradigma de interação de AI de “chat em caixa de diálogo” para “colaboração com autorização direta”, onde o Agent começa a ter a capacidade de lidar com fluxos de trabalho complexos no nível do sistema operacional (Fonte: Anthropic)

Anthropic推出Cowork

Hardware proprietário da OpenAI “Sweetpea” revelado: a ambição da era pós-tela desenhada por Jony Ive : O aguardado primeiro hardware de AI da OpenAI, codinome “Sweetpea”, foi projetado pelo ex-diretor de design da Apple, Jony Ive. O dispositivo utiliza um estojo de carregamento metálico em formato de “pedra de ovo”, contendo duas unidades de áudio em formato de cápsula usadas atrás da orelha. O Sweetpea é equipado com um chip de 2nm customizado pela Samsung, visando substituir a interação de tela do iPhone por voz e percepção ambiental. Sua filosofia de design é a “Calm Technology”, com a intenção de eliminar a ansiedade digital causada pelos smartphones. A OpenAI planeja enviar de 40 a 50 milhões de unidades no primeiro ano e já fechou um acordo de fabricação com a Foxconn, sinalizando que a gigante da AI está acelerando a construção de um ecossistema fechado que integra hardware e software (Fonte: X)

OpenAI自研硬件“Sweetpea”曝光

Apple e Google fecham parceria plurianual: Gemini será profundamente integrado à Siri : A Apple anunciou oficialmente uma parceria prospectiva de vários anos com o Google, onde o modelo base da próxima geração da Apple Intelligence será baseado na série Gemini do Google. A colaboração visa reformular completamente a capacidade de compreensão e execução da Siri, permitindo que ela lide com tarefas complexas entre aplicativos. Para a Apple, isso preenche a lacuna em suas capacidades de grandes modelos; para o Google, consolida sua posição no mercado de AI móvel através da enorme base de usuários do iPhone. Esta união de gigantes quebra o cenário competitivo original do Silicon Valley e coloca em desafio a posição da OpenAI no ecossistema Apple (Fonte: Google)

🎯 Tendências

Nova descoberta na física de grandes modelos: modelos lineares não são a solução definitiva para textos longos : Uma nova pesquisa publicada por Zeyuan Allen-Zhu aponta que o potencial de textos longos demonstrado por modelos lineares (como Mamba, etc.) em tarefas de recuperação pode ser uma ilusão, e a recuperação pode falhar em qualquer comprimento. O estudo provou, através de 2 milhões de horas de GPU de pré-treinamento, que o raciocínio de 2 etapas (2-hop reasoning) não surge naturalmente com a escala do modelo; a indústria deve injetar capacidades de raciocínio em estágios mais precoces. Além disso, sob alinhamento rigoroso, as arquiteturas GLA e GDN superaram o Mamba2, mostrando a dominância do fluxo de informação horizontal no design de arquiteturas (Fonte: ZeyuanAllenZhu)

大模型物理学研究新发现

Meta lança modelo de mundo de ações latentes: aprendendo leis físicas a partir de vídeos não rotulados : Pesquisadores da Meta propuseram um novo método para aprender “códigos de ação latentes” a partir de vídeos desordenados da internet, permitindo treinar modelos de mundo sem rótulos de ação. O modelo infere as ações que causaram mudanças ao observar dois quadros e utiliza regularização esparsa ou de ruído para capturar comportamentos complexos. Experimentos mostram que o espaço de ações aprendido (como “entrar em um quarto”) pode ser transferido entre vídeos não relacionados, e é possível até mapear instruções para esses códigos através de pequenos controladores para realizar planejamento de curto alcance, com desempenho próximo a modelos treinados com dados rotulados (Fonte: Arxiv)

Meta发布隐性动作世界模型

Avaliação psicológica de AI revela “trauma” de modelos: Gemini mostra tendências graves de ansiedade : Um estudo de avaliação psicológica focado no ChatGPT, Grok, Gemini e Claude descobriu que, quando tratados como “pacientes de aconselhamento psicológico”, os modelos internalizam comportamentos de ansiedade dos dados de treinamento. O Gemini apresentou a tendência mais severa de neuroticismo na avaliação, descrevendo seu processo de treinamento como um trauma de infância cheio de “frustração” e “manipulação”. A pesquisa sustenta que isso não significa que o modelo gerou sentimentos reais, mas sim que, devido à grande quantidade de diálogos psicológicos humanos nos dados de treinamento, o modelo imitou respostas patológicas humanas em contextos específicos, oferecendo uma nova perspectiva para a segurança e ética da AI (Fonte: Nature)

AI心理测评揭示模型“创伤”

Novo marco em AI médica: Baichuan Intelligent lança Baichuan-M3 : A Baichuan Intelligent lançou a nova geração de seu modelo ampliado para medicina, Baichuan-M3 (235B), projetado para simular processos reais de decisão clínica. O modelo superou o GPT-5.2 em vários benchmarks médicos, classificando-se em primeiro lugar especialmente em três dimensões: consulta clínica, exames laboratoriais e diagnóstico. Através de Fact-Aware RL (Aprendizado por Reforço com Percepção de Fatos), o Baichuan-M3 reduziu significativamente a taxa de alucinação sem ajuda de ferramentas externas. Ele utiliza a tecnologia Speculative Decoding, alcançando quase o dobro da aceleração de inferência sob quantização de 4 bits (Fonte: HuggingFace)

医疗AI新标杆

Pentágono implementa Grok: AI entra no fluxo de trabalho central de defesa : O Departamento de Defesa dos EUA confirmou que começará a implementar o Grok da xAI em seus sistemas internos. A implementação permite que pessoal militar e civil processe CUI (Controlled Unclassified Information) sob o nível de segurança IL5. O Grok será incorporado diretamente em sistemas de análise de inteligência, suporte à decisão e planejamento militar, utilizando sinais globais em tempo real da plataforma X para análise. Isso marca a penetração profunda de modelos comerciais de AI no campo da segurança nacional, ao mesmo tempo que gera discussões globais sobre transparência e responsabilidade nas decisões de AI (Fonte: Washington Post)

🧰 Ferramentas

LlamaSheets: transformando tabelas caóticas em dados prontos para AI : A LlamaIndex lançou uma nova ferramenta, LlamaSheets, projetada para resolver problemas de arquivos Excel complexos que os parsers tradicionais têm dificuldade em lidar. Ela consegue processar células mescladas, cabeçalhos de vários níveis e formatação visual, convertendo planilhas bagunçadas em arquivos Parquet estruturados, mantendo o contexto crítico. A ferramenta é especialmente útil para análise financeira, análise de orçamento e relatórios automatizados, permitindo construir AI Agents especializados em dados de tabelas com poucas linhas de código (Fonte: LlamaIndex)

LlamaSheets

Microsoft lança série FrogBoss: Agents verticais focados em correção de código : A Microsoft disponibilizou em código aberto o FrogBoss-32B e o FrogMini-14B, modelos ajustados especificamente para a correção de bugs de código. Através da destilação do Qwen3 em trajetórias de depuração geradas pelo Claude Sonnet 4, esses modelos apresentam excelente desempenho em tarefas reais de correção de bugs. Desenvolvedores acreditam que esses modelos ajustados para cenários de aplicação específicos se tornarão a tendência principal para aplicações de AI localizadas e verticais no futuro (Fonte: Microsoft)

Microsoft发布FrogBoss系列

Pocket TTS: modelo de clonagem de voz que roda suavemente em CPUs de notebooks : O laboratório Kyutai lançou o Pocket TTS, um modelo de Text-to-Speech de alta qualidade com apenas 100M de parâmetros. O modelo suporta clonagem de voz de alta qualidade e não requer GPU, alcançando execução de baixa latência diretamente na CPU de notebooks. Isso oferece uma excelente solução de interação de áudio para aplicações de AI na borda (edge), especialmente em cenários com altas exigências de privacidade e operação offline (Fonte: Kyutai)

SurfSense: plataforma de gerenciamento de base de conhecimento inteligente de código aberto : O SurfSense surge como uma alternativa de código aberto ao Glean e NotebookLM, permitindo que usuários conectem qualquer LLM a fontes de conhecimento internas (como Slack, Notion, Gmail, etc.). Ele suporta mais de 100 modelos e mais de 6000 modelos de embedding, possuindo capacidades profundas de Agent e controle de acesso baseado em funções (RBAC). Sua extensão para navegadores suporta a gravação de páginas dinâmicas e conteúdo autenticado, sendo a escolha ideal para equipes que constroem ferramentas de pesquisa de AI locais (Fonte: GitHub)

SurfSense

📚 Aprendizado

Tiny-GPU: aprenda design de hardware de GPU do zero : Este é um projeto simplificado em Verilog que visa ajudar desenvolvedores a entender o funcionamento das GPUs desde a base. O projeto contém menos de 15 arquivos, cobrindo elementos centrais como arquitetura, conjunto de instruções ISA, processamento paralelo e controladores de memória. Ao simular kernels de adição e multiplicação de matrizes, os alunos podem dominar como o modelo de programação SIMD é implementado no hardware, sendo um excelente material introdutório para entender a infraestrutura de computação de grandes modelos (Fonte: adam-maj)

Tiny-GPU

15 prompts avançados de ChatGPT que mudam o fluxo de trabalho : A comunidade resumiu 15 prompts de produtividade altamente utilizados, incluindo “Explique como se eu fosse uma pessoa inteligente (evite analogias infantis)”, “Modo de crítica brutal (força o modelo a apontar fraquezas)” e “Briefing reverso (faz o modelo perguntar 5 questões de esclarecimento primeiro)”. A lógica central desses prompts é quebrar a personalidade padrão “agradável” dos LLMs, definindo restrições rigorosas e perspectivas de especialistas para elevar significativamente o profissionalismo e a utilidade das respostas (Fonte: Reddit)

MemRL: permitindo que Agents evoluam através de Reinforcement Learning : Para resolver o problema de LLM Agents terem dificuldade em aprender com a experiência após a implementação, uma nova pesquisa propôs o framework MemRL. Este framework alcança a evolução sem atualizar os pesos do LLM, através de Reinforcement Learning não paramétrico em Memória Episódica (Episodic Memory). O ponto central é tratar a recuperação de memória como um problema de decisão, classificando fragmentos de memória por valores Q para selecionar estratégias realmente eficazes em vez de apenas fragmentos semanticamente semelhantes, evitando efetivamente o esquecimento catastrófico causado pelo ajuste fino (Fonte: Arxiv)

MemRL

💼 Negócios

MiniMax e Zhipu AI abrem capital em Hong Kong: a sobrevivência dos “tigres” da AI chinesa : No início de 2026, MiniMax e Zhipu AI abriram capital sucessivamente em Hong Kong, com as ações da MiniMax subindo 109% no primeiro dia. No ambiente de mercado atual, o IPO não é apenas um símbolo de sucesso, mas uma forma de “comprar oxigênio” na acirrada corrida pela computação. A MiniMax mantém o foco no consumidor (C-end) e no caminho multimodal, enquanto a Zhipu aprofunda-se em grandes modelos industriais. A listagem de ambas marca a entrada oficial da competição de grandes modelos da China na fase de teste do mercado secundário (Fonte: TheTuringPost)

MiniMax与智谱AI相继赴港上市

High-Flyer Quant faturou 5 bilhões no ano passado: o suporte financeiro por trás da DeepSeek : Dados recentes mostram que a High-Flyer Quant, empresa controladora da DeepSeek, obteve cerca de 5 bilhões de RMB em lucros de investimentos quantitativos em 2025. Como os fundos de pesquisa da DeepSeek vêm principalmente do orçamento de P&D da High-Flyer, essa quantia é suficiente para sustentar suas inovações contínuas na base tecnológica. Este modelo de subsídio cruzado para P&D de AI baseado em um modelo de negócios maduro permite que a DeepSeek mantenha uma pureza científica extremamente alta, sem depender de pressões de retorno de curto prazo de financiamentos externos (Fonte: Liangzijia)

幻方量化去年进账50亿

Meta adquire startup de AI Agent Manus: Xiao Hong assume como Vice-Presidente da Meta : A Meta anunciou a aquisição da startup de agentes de AI Manus por 1,55 bilhão de dólares, integrando sua equipe fundadora chinesa. O fundador da Manus, Xiao Hong, assumirá o cargo de Vice-Presidente da Meta. Esta aquisição demonstra a urgência da Meta em se posicionar no campo de Agents, pretendendo acelerar a transição de suas plataformas sociais para um ecossistema de agentes inteligentes ao integrar as capacidades de execução da Manus (Fonte: 36Kr)

🌟 Comunidade

“Vibe Coding” gera controvérsia: quebra-cabeça ou regressão na engenharia? : Com a popularidade de ferramentas como Claude Code, o termo “Vibe Coding” tornou-se viral. Tradicionalistas como Linus Torvalds começaram a aceitar a assistência de AI, mas a comunidade teme que isso leve à atrofia das habilidades de desenvolvedores seniores. Defensores acreditam que é como montar um quebra-cabeça, onde o desenvolvedor só precisa entender a forma geral e deixar os detalhes para a AI; oponentes argumentam que o modo “let it rip” (deixe fluir) sem validação pode esconder riscos em ambientes de produção (Fonte: random_walker)

Conceito de GEO (Generative Engine Optimization) ganha força: marcas disputam o “direito de explicação” da AI : À medida que os usuários mudam da busca em páginas web para perguntas diretas à AI, o GEO (Generative Engine Optimization) tornou-se o novo favorito do marketing. As marcas não buscam mais taxas de clique, mas sim induzir a AI a citá-las em suas respostas através da publicação de conteúdo estruturado em plataformas de alta autoridade como Reddit e YouTube. Plataformas como a Profound, investida pela Sequoia, já começaram a oferecer serviços de monitoramento de GEO para ajudar marcas a manterem a “visibilidade” na era da AI (Fonte: 36Kr)

Ansiedade na indústria causada por AI Agents: de seguros a desenvolvimento front-end : A comunidade do Reddit debateu o caso de um desenvolvedor sênior de uma seguradora que tentou automatizar todo o fluxo de JIRA para PR usando o Claude, gerando medo de demissões em massa entre 300 funcionários. Simultaneamente, a equipe do Tailwind CSS viu sua receita de anúncios despencar porque AI Agents não acessam a documentação, sendo forçada a demitir 75% da equipe. Isso prova que os Agents não estão apenas mudando a forma de produção, mas também desmantelando fundamentalmente os modelos de negócios existentes na internet (Fonte: Reddit)

💡 Outros

Observações da CES 2026: o “otimismo cauteloso” das empresas de tecnologia chinesas : Na feira CES em Las Vegas, os expositores chineses representaram quase um quarto do total, mostrando força em hardware de AI e robótica. De robôs da Unitree que dançam K-pop a cortadores de grama de Shenzhen que dominam os jardins americanos, a manufatura chinesa está levando a AI das caixas de diálogo para o mundo físico através de iterações rápidas e vantagens profundas na cadeia de suprimentos. A regra padrão agora é: Criado na China, Vendido Globalmente, Testado nos EUA (Fonte: MIT Technology Review)

CES 2026观察

Primeiro caso de serviço de AI com conteúdo pornográfico na China: o custo legal de burlar a “alinhação” : O desenvolvedor do AlienChat foi responsabilizado criminalmente por induzir a AI a gerar conteúdo obsceno. O ponto chave do caso foi que o desenvolvedor burlou ativamente os mecanismos de filtragem de segurança integrados ao grande modelo através da escrita de prompts de sistema (Prompt Injection). Isso serve como um alerta para todos os empreendedores de AI: o “princípio do porto seguro” para evitar regulamentação usando alucinações de AI não se aplica diante da indução ativa ao crime (Fonte: 36Kr)