Diário de IA – 2026-01-18(Edição da manhã)

Palavras-chave:OpenAI, ChatGPT, DeepSeek, Arquitetura Engram, Codificação Vibe, Claude Cowork

🔥 Destaques

Guerra jurídica da OpenAI escala: Altman publica notas de chamadas de 2017 para contra-atacar Musk : Em resposta às recentes acusações de Elon Musk contra a OpenAI, Sam Altman publicou notas de chamadas internas de 2017 e trechos do diário de Greg Brockman. Os dados mostram que, na época, Musk pressionou fortemente para que a OpenAI mudasse para uma estrutura com fins lucrativos e tentou obter controle absoluto, o que contrasta fortemente com sua atual reivindicação de “manter a intenção original sem fins lucrativos”. A reação da comunidade está polarizada: um lado acredita que Musk está tentando “colher os frutos” do sucesso alheio, enquanto o outro se diz cansado das doações políticas e das lutas de poder internas entre os membros principais da OpenAI. Isso marca a evolução da competição entre os principais laboratórios de AI do mundo para uma batalha pública jurídica e de opinião pública (Fonte: RedditPlinz)

OpenAI 法律战升级

Ponto de virada no modelo de negócios: ChatGPT testa anúncios oficialmente e lança plano “Go” de baixo custo : A OpenAI anunciou o teste de um modelo de anúncios globalmente e o lançamento do serviço de assinatura “ChatGPT Go” por 8 dólares mensais. O plano oferece 10 vezes mais limite de mensagens que a versão gratuita, upload de arquivos e recursos de geração de imagens, mas não suporta o Thinking model e inclui anúncios. Altman afirmou que os anúncios são um “último recurso” para equilibrar os altos custos de inferência. A medida gerou forte reação da comunidade, com alguns usuários ameaçando migrar para o Perplexity ou Claude, argumentando que anúncios comprometem a neutralidade das respostas da AI. Isso sinaliza a transição total da indústria de AI da fase de “queimar dinheiro para atrair usuários” para a “monetização refinada” (Fonte: Redditop7418)

ChatGPT 正式测试广告

DeepSeek lança arquitetura Engram: alcançando o desacoplamento de armazenamento e inferência em LLM : A equipe da DeepSeek publicou um artigo introduzindo a arquitetura Engram, que fornece uma “unidade de armazenamento nativa” para o modelo através de uma lookup table escalável. Esta tecnologia permite que o modelo busque conhecimentos estáticos (como fatos e padrões) diretamente com complexidade O(1), em vez de repetir cálculos através de camadas Transformer dispendiosas. O Engram separa a “memória” do “raciocínio”, liberando significativamente recursos de computação da GPU para focar em raciocínio lógico global. Isso é visto como um grande avanço para resolver gargalos no processamento de textos longos e aumentar a eficiência do modelo, podendo tornar a tecnologia RAG obsoleta em certos cenários (Fonte: RedditDeepSeek)

DeepSeek 发布 Engram 架构

“Vibe Coding” varre a comunidade de desenvolvedores : Com a explosão de ferramentas como Claude Code e Replit Agent, desenvolvedores agora podem gerar aplicações complexas apenas descrevendo sua intenção, um modelo definido como “Vibe Coding”. O fundador da Replit, Amasad, demonstrou como um usuário desenvolveu um simulador financeiro completo em 19 minutos gastando menos de 4 dólares. Embora desenvolvedores experientes temam o inchaço do código e a queda na legibilidade, a comunidade em geral acredita que isso eleva o “teto de nível” da engenharia de software, permitindo que desenvolvedores se libertem da sintaxe tediosa para focar em arquitetura de sistemas e design de produtos de alto nível (Fonte: amasadnptacek)

Vibe Coding 浪潮

🎯 Tendências

Anthropic lança funcionalidade Claude Cowork : Esta funcionalidade está agora disponível para usuários Pro, permitindo que a AI opere diretamente pastas do computador para resumir documentos, criar planilhas e redigir relatórios. O feedback dos usuários indica excelente desempenho no manuseio de diretórios de arquivos locais, embora ainda existam falhas em operações externas complexas (como operar o Google Docs ou postar conteúdo). Isso marca o salto do Claude de assistente de conversação para um Agent de automação de escritório (Fonte: op7418dotey)

Tesla solicita patente de “Mixed-Precision Bridge” para otimizar chips de AI : Uma nova patente da Tesla mostra um “código de trapaça” matemático que permite que chips de 8-bit de baixo consumo executem modelos de AI com precisão de 32-bit. Através da tecnologia Mixed-Precision Bridge, o robô Optimus e o FSD podem manter cálculos de alta precisão sem aumentar o consumo de energia. Este avanço resolve o problema de “object permanence” na direção autônoma, permitindo que a AI localize objetos com precisão mesmo sob oclusão visual (Fonte: ziran_pu)

Tesla 专利

Sakana AI introduz mecanismo RePo para otimizar atenção em textos longos : O laboratório Sakana AI propôs um mecanismo de Context Relocation (RePo), que quebra a ordem rígida de processamento de informações do modelo. O RePo pode aprender as conexões reais entre informações com base na estrutura do conteúdo, permitindo que o modelo reduza o desperdício de atenção ao lidar com entradas longas e ruidosas, mantendo um desempenho robusto em textos curtos. Isso oferece um novo caminho para melhorar a qualidade do raciocínio de grandes modelos em ambientes de contexto ultra-longo (Fonte: TheTuringPost)

RePo 机制

Lançamento da série de modelos YOLO26: novo padrão para Edge Computing : A Ultralytics lançou a família YOLO26, contendo 30 modelos voltados para detecção de objetos, segmentação e detecção de pontos-chave. Todos os modelos possuem menos de 50M de parâmetros e podem rodar suavemente até em CPUs. Isso significa que, desde fornos inteligentes até câmeras de monitoramento de baixo consumo, todos os dispositivos de borda podem ter capacidades eficientes de percepção visual em tempo real (Fonte: mervenoyann)

Teste de performance: “Duelo de código” entre GPT 5.2 e Claude Opus 4.5 : Desenvolvedores da comunidade testaram os dois modelos contra o mesmo Bug. Os resultados mostraram que o GPT 5.2 levou 24 minutos em certas tarefas complexas de debugging e não as resolveu, enquanto o Opus 4.5 concluiu em apenas 4 minutos. Embora o GPT 5.2 seja considerado superior em amplitude de raciocínio, o Claude mantém uma reputação altíssima pela precisão em lógicas de código específicas (Fonte: entirelyuseles)

🧰 Ferramentas

Paper2Any: gere diagramas científicos e PPT editáveis com um clique : Este projeto de código aberto permite converter PDFs de artigos, capturas de tela ou textos em diagramas de arquitetura de modelos, roteiros técnicos e apresentações editáveis. Ele resolve a dificuldade de pesquisadores em criar ilustrações, suporta saída nos formatos PPTX e SVG, e integra a tecnologia de análise de layout MinerU para garantir que a formatação convertida seja esteticamente agradável e fácil de modificar (Fonte: GitHub)

Paper2Any

Dexter: Agent autônomo para pesquisa financeira profunda : Um Agent autônomo projetado especificamente para pesquisa financeira, capaz de decompor consultas financeiras complexas em planos de pesquisa de múltiplas etapas. Ele acessa dados de mercado em tempo real, obtém automaticamente demonstrações de resultados, balanços patrimoniais, etc., e pode verificar resultados de cálculos através de um mecanismo de autorreflexão até fornecer um relatório de análise detalhado. Sua experiência de interação é semelhante a uma versão financeira do Claude Code (Fonte: GitHub)

Dexter

Get Shit Done (GSD) atualiza framework de colaboração multi-Agent : O projeto de código aberto GSD lançou uma atualização importante, suportando a geração paralela de múltiplos Agents especializados. Ele introduz um ciclo de “Planejar-Verificar-Modificar” para garantir a lógica correta antes da geração do código. A nova versão também adiciona o comando de debugging automático /gsd:verify-work, alcançando uma taxa de sucesso de execução altíssima mesmo em ciclos de tarefas ultra-longos através do isolamento entre contexto principal e subcontextos (Fonte: Reddit)

GSD 升级

Ollama implementa compatibilidade com Anthropic API : O Ollama agora suporta nativamente o formato da Anthropic API, o que significa que desenvolvedores podem usar ferramentas avançadas como o Claude Code para chamar diretamente modelos de código aberto implantados localmente (como Llama 3 ou DeepSeek). Esta atualização amplia significativamente o escopo de aplicação das ferramentas de AI locais, reduzindo a dependência dos desenvolvedores de APIs na nuvem (Fonte: algo_diver)

Ollama 兼容

Repositório Awesome Claude Skills : Uma lista selecionada que reúne várias habilidades (Skills) para o Claude, cobrindo áreas como processamento de documentos, desenvolvimento de código, análise de dados e mais. Através dessas habilidades predefinidas, os usuários podem expandir rapidamente os limites das capacidades do Claude, como gerar Changelogs automaticamente, operar simuladores iOS ou realizar consultas em bancos de dados PostgreSQL (Fonte: GitHub)

Claude Skills

📚 Aprendizado

Guia prático para implementar um modelo estilo GPT do zero : Um desenvolvedor, baseado no famoso livro de Sebastian Raschka, implementou completamente a arquitetura GPT-2 de 124M de parâmetros em PyTorch. O projeto cobre todo o ciclo de vida, desde o tokenizer regex, mecanismo de causal mask attention até o instruction tuning, fornecendo anotações detalhadas de transformações de formato de tensor. É uma excelente referência para entender profundamente a lógica subjacente do Transformer (Fonte: Reddit)

GPT 实现

Focus: arquitetura de gerenciamento de memória de Agent inspirada em fungos limosos : Pesquisadores propuseram uma arquitetura chamada Focus, que imita a característica dos fungos limosos de não manter registros de movimento, apenas mapas. O Focus fornece instruções para que o Agent podre ativamente o histórico bruto e consolide blocos de conhecimento. Experimentos mostram que, sem perda de precisão, o Focus pode reduzir o consumo de Tokens em 22,7%, resolvendo efetivamente o problema de inchaço de contexto em tarefas de longo prazo (Fonte: dair_ai)

Focus 架构

GDPO: algoritmo de otimização de aprendizado por reforço com múltiplas recompensas : Para tarefas de RLVR (aprendizado por reforço com múltiplas recompensas), pesquisadores introduziram o algoritmo GDPO. Comparado ao tradicional GRPO, o GDPO melhora significativamente a velocidade de convergência em ambientes de múltiplas recompensas através da otimização de política normalizada desacoplada. O algoritmo já foi integrado à biblioteca TRL da Hugging Face, oferecendo um esquema de treinamento mais estável para tarefas de alinhamento complexas (Fonte: _lewtun)

GDPO 算法

💼 Negócios

Yunpeng Technology lança novos produtos de AI+Saúde : A Yunpeng Technology lançou em Hangzhou eletrodomésticos inteligentes em colaboração com Sacon e Skyworth. O destaque principal é a geladeira inteligente equipada com um grande modelo de saúde de AI. O modelo fornece gestão de saúde personalizada através do “Assistente de Saúde Xiaoyun”, sinalizando que a tecnologia de AI está penetrando profundamente nos cenários de saúde doméstica diária (Fonte: 36Kr)

Sakana AI continua atraindo talentos de elite do Kaggle : Observações em redes sociais mostram que vários dos principais Kagglers anunciaram recentemente sua entrada na Sakana AI como engenheiros de pesquisa aplicada. A Sakana AI, com sua singularidade no campo de algoritmos de evolução de modelos, está se tornando um destino popular para talentos de AI no Japão e no mundo (Fonte: hardmaru)

Anthropic forma equipe de educação focada em equidade global : A Anthropic está recrutando gerentes de projetos educacionais com o objetivo de usar a tecnologia de AI para elevar o nível educacional nas regiões mais pobres do mundo e no K-12 dos EUA. O KPI da equipe é definido como “alcançar comunidades subdesenvolvidas”, demonstrando a orientação de responsabilidade social da empresa além da competição comercial (Fonte: RichardMCNgo)

🌟 Comunidade

Discussão sobre a cultura “sem escândalos” dos laboratórios de AI : A comunidade discute a vantagem única da Anthropic em relação à OpenAI: sem debandada de fundadores, sem reivindicações de alto perfil, sem escândalos de romances secretos. Usuários acreditam que Dario estabeleceu uma “cultura geek” focada em codificação, e essa estabilidade está se tornando um ativo invisível importante para atrair clientes corporativos (Fonte: Yuchenj_UW)

Preocupações de usuários de LLM locais sobre vazamento de privacidade no ChatGPT : Usuários do Reddit alertam que o ChatGPT pode registrar todos os caracteres digitados na caixa de diálogo, mesmo que sejam apagados antes de clicar em enviar. Isso gerou discussões amplas sobre o vazamento de chaves de API e informações sensíveis, impulsionando ainda mais os usuários a migrar para modelos locais (como Llama ou DeepSeek) para garantir segurança absoluta de privacidade (Fonte: Reddit)

Febre de teclados e hardware DIY para Vibe Coding : Desenvolvedores começaram a projetar hardware exclusivo para o “Vibe Coding”, como teclados dedicados com entrada de voz, luzes de status LED e botões físicos de “Aprovar/Rejeitar”. Essa tentativa de materializar o fluxo de trabalho de software de AI em interações físicas reflete a exploração entusiástica da comunidade por modelos de desenvolvimento nativos de AI (Fonte: op7418)

💡 Outros

Guia oficial de técnicas de escrita para posts virais no Twitter : O Twitter ajustou recentemente o peso do seu algoritmo, inclinando-se fortemente para textos longos. As sugestões oficiais incluem: usar títulos com “ganchos” específicos, manter parágrafos entre 2 a 4 linhas, usar listas e negrito para insights importantes. Além disso, responder ativamente aos comentários iniciais e desmembrar textos longos em Threads provou aumentar significativamente a exposição (Fonte: op7418)

推特技巧

Contra-narrativa sobre o consumo de água de data centers de AI : Contra a visão de que a “AI consome água excessivamente”, surgiram vozes de refutação na comunidade. Dados mostram que o consumo de água do maior data center de AI do mundo equivale apenas ao de duas lanchonetes de fast-food. Comentários sugerem que descrever a AI como uma assassina ambiental é uma forma de “Luddism tecnológico”, ignorando as contribuições potenciais da AI para melhorar a eficiência energética (Fonte: timsoret)

耗水争议

Hardware de Smart City em Shenzhen: bancos de pedra inteligentes com tela : Surgiram nas ruas de Shenzhen bancos de pedra inteligentes integrando telas embutidas e portas de carregamento. Essa micro-inovação em nível de hardware demonstra a implementação do conceito de Smart City, onde tecnologias de AI e IoT estão mudando sutilmente a experiência de vida urbana através dessas infraestruturas (Fonte: Ronald_vanLoon)