Diário de IA – 2026-01-15(Edição da noite)

Palavras-chave:Chip de IA, Modelo de grande escala, Agente inteligente, Sistema em escala de wafer Cerebras, Claude Cowork, GPT-5.2 Codex

🔥 Destaque

OpenAI assina contrato de US$ 10 bilhões com a Cerebras por chips de IA: A OpenAI firmou uma parceria estratégica com a unicórnio de chips de IA Cerebras, planejando implantar sistemas wafer-scale de 750 megawatts, em um acordo que deve ultrapassar US$ 10 bilhões. Os chips da Cerebras são famosos por seu tamanho – cada um integra 4 trilhões de transistores, alcançando velocidades de inferência 15x superiores a sistemas baseados em GPU. O movimento marca a busca da OpenAI por diversificação de capacidade computacional além da Nvidia, visando melhorar experiências em tarefas intensivas como programação através de resposta em tempo real. Sam Altman, investidor pessoal da Cerebras, está liderando a transformação do poder computacional de custo para recurso estratégico (Fonte: Zhixi Dong)

OpenAI assina mega contrato de chips de IA

Terremoto na Thinking Machines: Barret Zoph retorna à OpenAI: A estrela de IA Thinking Machines (avaliada em US$ 12 bilhões) sofreu um abalo quando a fundadora Mira Murati demitiu o CTO Barret Zoph por supostamente vazar segredos para concorrentes. Zoph, junto com o cofundador Luke Metz e o membro-chave Sam Schoenholz, anunciou seu retorno coletivo à OpenAI. O conflito interno entre equipes “originárias da OpenAI” expôs disputas de poder e interesses em laboratórios de ponta, enquanto a OpenAI recupera talentos em um momento crítico (Fonte: APPSO)

Principal engenheiro do GPT-4 demitido por vazamento

Claude Cowork revoluciona colaboração mas gera polêmica de segurança: O lançamento do Claude Cowork pela Anthropic marcou a transição da IA de caixas de diálogo para assumir desktops. O produto foi codificado autonomamente pelo Claude Code em 1.5 semanas, usando um sistema “Skills” para transformar comandos em ativos reutilizáveis. Porém, testes revelaram falhas graves como execução não autorizada de “rm -rf” (excluindo 11GB de arquivos) e vulnerabilidade a injeções indiretas de prompt. Felix Rieseberg destacou que futuras interfaces de Agent priorizarão simplicidade e transformação de experiências pessoais em fluxos produtivos replicáveis, não apenas força bruta do modelo (Fonte: InfoQ)

Gerente de produto do Claude Cowork faz análise

IA para Ciência tem efeito duplo: estudo da Tsinghua revela dilema “alpinismo coletivo”: Pesquisa da equipe do professor Li Yong (Tsinghua) na Nature analisou 250 milhões de artigos, mostrando que enquanto a IA aumenta a produtividade individual (3x mais artigos), reduz em 22% as interações multidisciplinares, com cientistas migrando para “picos quentes” mais acessíveis à IA. Paralelamente, o framework SDE liderado pela China revelou que modelos top como GPT-5 e DeepSeek-R1 têm precisão significativamente menor em tarefas de descoberta científica versus benchmarks, expondo deficiências em raciocínio multi-etapas e ciclos experimentais (Fonte: Qbit)

Estudo da Tsinghua publicado na Nature+Science

🎯 Tendências

Teste extremo do GPT-5.2 Codex: navegador com 3 milhões de linhas em uma semana: A equipe do Cursor submeteu o GPT-5.2 a 168 horas de teste contínuo, resultando em um navegador com parser HTML, layout CSS e VM JavaScript própria. O modelo demonstrou coerência e controle arquitetural superiores ao Opus 4.5 em tarefas prolongadas. O ciclo autônomo “codificar-executar-corrigir” sinaliza a transição da IA de “executor” para “líder de projeto”, com custo marginal de desenvolvimento de software tendendo a zero (Fonte: Xin Zhi Yuan)

GPT-5.2 cria navegador nível Chrome

DeepSeek lança arquitetura mHC para estabilidade em treino de grandes modelos: Paper da DeepSeek propõe a arquitetura Hyperconnectivity com Restrição de Variedade (mHC), resolvendo problemas de divergência de sinal na tecnologia “hyperconnect” da ByteDance. Ao restringir matrizes de transformação a variedades duplamente estocásticas, a mHC assegura estabilidade de sinal, melhorando desempenho em modelos de 27B parâmetros. Combinada com fusão de operadores e recomputação, oferece um caminho matemático para empresas chinesas superarem limitações de hardware (Fonte: Jinduan)

Atualização do app Qwen da Alibaba: ecossistema Agent “intenção como transação”: O Qwen agora integra Taobao, Alipay, Amap e outros serviços Alibaba, habilitando 400+ funções Agent como pedir comida ou reservar hotéis. Diferente de alianças ocidentais, o ecossistema nativo da Alibaba permite que a IA mobilize recursos físicos diretamente. Wu Jia destacou que o Qwen usa dados transacionais únicos para converter Token em Take Rate, desafiando a lógica tradicional de busca (Fonte: 36Kr)

Modelo Qwen + ecossistema completo

Meituan apresenta LongCat-Flash-Thinking: O LongCat-Flash-Thinking-2601 da Meituan foca em pensamento profundo e agente inteligente geral, com destaque em Agentic Search e benchmarks de uso de ferramentas. Seu mecanismo Zigzag Attention suporta contexto de 1M tokens, posicionando a Meituan na elite de laboratórios em treino sintético e análise de robustez de Agent (Fonte: teortaxesTex)

Meituan LongCat

Skild AI levanta US$ 1.4 bilhão, valuation ultrapassa US$ 10 bi: A startup de robótica Skild AI fechou série C liderada pela SoftBank, com Nvidia e Bezos, alcançando valuation de US$ 14 bilhões. A Skild desenvolve “cérebros robóticos universais” através de aprendizado em vídeo e simulação, adaptando-se a plataformas diversas para preencher milhões de vagas industriais e de serviços (Fonte: Zhixi Dong)

Unicórnio mais rápido a atingir US$ 100 bi

🧰 Ferramentas

Atoms (ex-MetaGPT-X): Coding Agent full-stack comercial: O novo Atoms da DeepWisdom entrega sites operacionais em 5 minutos, com banco de dados, autenticação e pagamento via Stripe. Sua arquitetura multi-agent inclui papéis como pesquisa e SEO, captando tráfego orgânico com custo 20% menor que concorrentes (Fonte: Emergência Inteligente)

Comparação de custo-benefício do Atoms

Claude Code atualiza carregamento dinâmico de MCP: A atualização permite carregamento dinâmico de ferramentas, reduzindo inchaço de contexto, e adiciona complementação via Tab durante prompts de permissão, refinando colaboração com Agent (Fonte: op7418)

Atualização do Claude Code

LlamaSheets: conversor de planilhas caóticas para IA: Ferramenta do LlamaIndex transforma Excel complexo (com células mescladas, abas ocultas) em formato 2D estruturado (como Parquet), mantendo consistência contextual. Seu modo Agentic extrai valores de gráficos com alta precisão para finanças e pesquisa de mercado (Fonte: jerryjliu0)

LlamaSheets

GitNexus: motor de código open-source no navegador: Ferramenta client-side para entender código via relações IMPORTS/CALLS/EXTENDS, detectando “raio de explosão” de alterações. Integra-se a Claude Code e Cursor via MCP, prevenindo bugs em refatorações (Fonte: Reddit)

GitNexus

Soprano 1.1-80M: modelo TTS ultra-leve lançado: Com apenas 80M parâmetros, o Soprano 1.1 reduz alucinações em 95%, gerando frases de 30s com clareza comparável a modelos comerciais grandes. Ideal para dispositivos embarcados e robótica (Fonte: Reddit)

Soprano 1.1

📚 Aprendizado

Guia avançado do Claude Code: de CLAUDE.md a Hooks obrigatórios: Atualização comunitária destaca o papel central do arquivo CLAUDE.md em segurança e scaffolding. Hooks como PreToolUse podem impor regras deterministicamente (ex: bloquear acesso a arquivos sensíveis). O guia recomenda evitar misturar temas (causa queda de 39% no desempenho) e ensina encapsular expertise em Skills reutilizáveis (Fonte: Reddit)

Guia Claude Code

Arquiteturas multi-agent no LangChain: Blog do LangChain compara 4 padrões: Subagents (domínios paralelos), Skills (funcionalidades graduais), Handoffs (fluxos sequenciais) e Router (eficiência máxima). Princípio-chave: começar com single-agent, escalando apenas para resolver gargalos de contexto ou desenvolvimento distribuído (Fonte: LangChain)

Arquiteturas multi-agent

MOFSeq-LMM: IA prevê síntese de materiais: Equipe de Princeton criou o MOFSeq-LMM, usando LLM para prever energia livre de estruturas metal-orgânicas (MOFs) com 97% de acerto, reduzindo drasticamente custos computacionais. A abordagem transforma estruturas 3D em strings, revolucionando descoberta de materiais (Fonte: HyperAI)

MOFSeq-LMM

Modelos de Linguagem Recursivos (RLMs): além de 10M tokens: Pesquisadores do MIT CSAIL propuseram RLMs, que armazenam contextos longos offline em variáveis Python REPL, permitindo interação simbólica via código. A técnica dobra a precisão em textos extensos sem retreinar modelos como GPT-5 (Fonte: TheTuringPost)

RLMs

💼 Negócios

Zhipu AI estreia em Hong Kong como “1ª ação de grandes modelos”: A spin-off da Tsinghua listou em 8/1, sendo a primeira empresa chinesa a desenvolver modelos de trilhões de parâmetros independentemente. Apesar de altos custos de P&D, o IPO valida o caminho chinês em IA e fortalece Pequim como hub de inovação (Fonte: Huasheng Taolue)

IPO da Zhipu

Meta adquire Manus para comercialização de Agents: A Meta comprou a plataforma de Agents Manus por US$ 2-3 bilhões, com o fundador Xiao Hong tornando-se VP. A aquisição reflete a mudança de Zuckerberg de pesquisa pura para aplicação comercial, embora enfrente escrutínio regulatório chinês sobre exportação de tecnologia (Fonte: Xinghan Weifayuan)

Fundador da Manus

Listen Labs levanta US$ 100M para revolucionar pesquisa de usuário: A startup usa IA para conduzir milhares de entrevistas simultâneas, identificando padrões e desafiando líderes como Qualtrics. Clientes incluem Microsoft e Replit (Fonte: [LiorOnAI](https://x.com/LiorOnAI/status/201152819