Diário de IA - 2025-12-26(Edição da noite)

Palavras-chave：modelo de grande escala, unicórnio de IA, OpenAI, NVIDIA, Meta, raciocínio de IA, capacidade computacional de IA, música de IA, modelo GLM-4.7, GPT-5.2-Codex-XMas, arquitetura Groq LPU, Self-play SWE-RL, série Nemotron 3

🔥 Destaque

Zhipu e MiniMax competem pelo título de “Primeira Ação de Large Model do Mundo”: A Zhipu Huazhang de Pequim e a MiniMax (Xiyu Technology) passaram sucessivamente pelas audições da HKEX e divulgaram seus prospectos, marcando o início do processo de capitalização das unicórnios de AI da China. A Zhipu alcançou uma receita de 312 milhões de yuans em 2024, com uma taxa de crescimento composta superior a 130%, mas, devido ao aumento drástico nos custos de computação, registrou um prejuízo de 2,358 bilhões de yuans no primeiro semestre de 2025. Simultaneamente, a Zhipu lançou e abriu o código do modelo GLM-4.7, que ficou em primeiro lugar entre os modelos open-source no Code Arena, superando o GPT-5.2 e demonstrando uma forte capacidade de iteração técnica. Este IPO não é apenas para financiamento, mas um evento “balizador” para a ancoragem do valor de mercado de empresas puras de Large Models (Fonte: 36氪, 市值水晶)

OpenAI lança versão personalizada de Natal do Codex, aprofundando a “Agentic Programming”: Durante o período de Natal, a OpenAI lançou o GPT-5.2-Codex-XMas, que mantém o desempenho do GPT-5.2 com atualizações personalizadas e oferece o dobro do limite de uso para assinantes. Esta atualização não é apenas marketing festivo, mas reflete a mudança estratégica da OpenAI ao posicionar o Codex como um “Engineering Agent”: fortalecendo a compreensão de contexto longo, processamento de tarefas entre arquivos e otimização da toolchain nativa do Windows. Desenvolvedores notaram que sua taxa de conclusão em projetos complexos já é superior à da maioria dos concorrentes, sinalizando que 2026 será a era da evolução de “AI escrevendo código” para “AI gerenciando engenharia” (Fonte: 新智元, op7418)

Axiom Math: Definindo o novo padrão de “Aceitação” para raciocínio de AI: Fundada por Carina Hong, uma desistente de Stanford de 24 anos, a Axiom Math obteve 64 milhões de dólares em financiamento, com uma avaliação de 300 milhões de dólares. A empresa dedica-se ao desenvolvimento de “Matemáticos de AI” capazes de verificar autonomamente a correção lógica. O avanço principal reside na introdução da linguagem de programação Lean, permitindo que cada etapa do raciocínio da AI possua uma prova formal, resolvendo o problema de confiança na “aceitação” dos resultados de Large Models. Na competição de matemática Putnam, seu sistema resolveu autonomamente 9 problemas difíceis, todos validados. Este progresso significa que a AI está mudando de uma “geração de respostas” vaga para uma “autoverificação lógica” rigorosa, tornando-se uma colaboradora confiável em pesquisa científica e industrial (Fonte: AI 深度研究员)

NVIDIA e Groq fecham licenciamento tecnológico para enfrentar gargalos de computação e memória: Diante da disparada dos preços e da escassez de capacidade da memória HBM, a NVIDIA fechou um acordo de licenciamento tecnológico não exclusivo com a Groq. O fundador e a equipe principal da Groq se juntarão à NVIDIA para auxiliar na integração de sua tecnologia de inferência. A arquitetura LPU da Groq utiliza SRAM como memória principal, com uma largura de banda várias vezes superior à HBM tradicional, aliviando drasticamente o gargalo de acesso à memória durante a inferência. Este movimento é visto como uma segunda frente aberta pela NVIDIA no contexto da “escassez de memória”, visando explorar novos caminhos tecnológicos de memória para mitigar riscos na cadeia de suprimentos de DRAM e consolidar seu domínio no mercado de inferência de AI (Fonte: 机器之心, op7418)

🎯 Tendências

Meta lança Self-play SWE-RL para permitir a auto-evolução de Agents: A equipe de pesquisa da Meta lançou o framework SSR, que permite que agentes de engenharia de software realizem auto-treinamento através de um mecanismo de self-play de “Injeção de Bugs” e “Correção de Bugs”, sem necessidade de anotação humana. O método requer apenas acesso a uma sandbox de código-fonte, onde o agente gera continuamente problemas de alta qualidade e os resolve autonomamente em um ciclo fechado de evolução autodirigida. Experimentos provaram que o desempenho do SSR melhora continuamente durante o treinamento, superando métodos de Reinforcement Learning de base. Isso sinaliza que os AI Agents estão caminhando para a “Superinteligência”, com potencial para superar as capacidades humanas na compreensão de sistemas e criação autônoma de software (Fonte: 学术头条)

Liquid AI lança o modelo 3B mais forte, com resultados significativos em Reinforcement Learning: A Liquid AI lançou o modelo experimental LFM2-2.6B-Exp, construído puramente através de Reinforcement Learning, apresentando desempenho excepcional em benchmarks de instruction following, conhecimento e matemática. Sua pontuação no IFBench superou até mesmo o DeepSeek R1, que é 263 vezes maior em escala. Feedbacks da comunidade mostram que o modelo possui “conhecimento de nível de doutorado” e pode rodar suavemente em dispositivos edge como o iPhone. Este avanço prova novamente que, através de design de algoritmos eficiente e otimização de RL, modelos de parâmetros pequenos podem demonstrar desempenho comparável aos modelos de topo em domínios específicos (Fonte: maximelabonne, huggingface)

Vazamento de código da versão Android do ChatGPT revela planos de inserção de anúncios: Desenvolvedores encontraram strings relacionadas a anúncios como “ads feature” e “search ad” no código da versão beta do ChatGPT para Android. Embora Sam Altman tenha dito que anúncios seriam o “último recurso”, sob a pressão financeira de gastos de 2,5 bilhões de dólares no primeiro semestre de 2025, a OpenAI claramente começou a se preparar para monetizar usuários gratuitos. As formas planejadas de anúncios podem incluir mensagens patrocinadas na barra lateral ou “recomendações conversacionais”, visando a monetização orientada por intenção sem interromper a conversa natural. Isso indica que a busca por AI se despedirá da era “absolutamente pura” (Fonte: 直面AI)

NVIDIA lança série Nemotron 3, focada em contexto longo e capacidades de Agent: A NVIDIA apresentou a família Nemotron 3 (Nano, Super, Ultra), utilizando uma arquitetura híbrida Mamba-Transformer e tecnologia Mixture-of-Experts (MoE). Esta série de modelos suporta comprimentos de contexto de até 1M e passou por otimização de post-training para raciocínio de Agent e chamadas de ferramentas em múltiplas etapas. A versão Nano lidera em precisão entre modelos pequenos similares com custo de inferência extremamente baixo, enquanto a versão Ultra busca desempenho de inferência de nível SOTA. A NVIDIA prometeu abrir os pesos dos modelos, software de treinamento e receitas, enriquecendo ainda mais o ecossistema open-source (Fonte: Reddit)

SAM 3: Evoluindo de clicar em pixels para “Nomear Conceitos”: A Meta lançou o SAM 3 (Segment Anything with Concepts), elevando a tecnologia de segmentação de vídeo do modo “clicar e selecionar” para o “reconhecimento de conceitos”. Os usuários precisam apenas digitar “pessoa usando óculos” e o modelo localizará automaticamente todos os objetos correspondentes na imagem ou vídeo. Através do treinamento automatizado de 4 milhões de conceitos únicos, a precisão do SAM 3 no benchmark de vídeo complexo MOSEv2 aumentou de 47,9% para 60,3%. Este avanço amplia significativamente a compreensão semântica do mundo visual pela AI, resolvendo problemas de oclusão e consistência na segmentação de vídeo (Fonte: ylecun)

🧰 Ferramentas

GAIT e GaitHub: O sistema de controle de versão “Git” para raciocínio de AI: Visando a dor da falta de rastreabilidade e reprodutibilidade nas decisões de AI, desenvolvedores lançaram o GAIT. O sistema trata as interações de AI como objetos endereçados por conteúdo, abrangendo intenção do usuário, resposta do modelo, ramificações de raciocínio e estado da memória. Com o GAIT, desenvolvedores podem realizar controle de versão, experimentos de ramificação e decisões de mesclagem no processo de raciocínio da AI, assim como gerenciam código. A plataforma de nuvem GaitHub oferece suporte para colaboração e auditoria, fornecendo a infraestrutura de engenharia necessária para fluxos de trabalho de AI de nível empresarial, resolvendo o enigma da caixa preta de “por que a AI decidiu isso” (Fonte: Reddit)

DeepFabric: Framework de fine-tuning de chamadas de ferramentas para serviços MCP específicos: O DeepFabric é um framework open-source que permite aos desenvolvedores gerar automaticamente conjuntos de dados de raciocínio específicos para qualquer servidor MCP ou conjunto de ferramentas. Ao executar trajetórias de ferramentas reais em um ambiente WebAssembly isolado, o framework pode realizar o fine-tuning de modelos pequenos como o Qwen3-4B, fazendo com que superem o Claude 4.5 e o Gemini 2.5 em tarefas específicas (como controle do Blender). Isso oferece um caminho claro para construir Agents especialistas verticais de alto desempenho e baixo custo (Fonte: Reddit)

Quint: Adeus CLI, introduzindo UI interativa para Chatbots: Quint é uma biblioteca React projetada para transformar as interações impulsionadas por LLM de texto puro para uma UI estruturada e determinística. Ela permite que desenvolvedores definam opções explícitas, onde o clique do usuário aciona exibições de informações específicas ou entradas estruturadas. O conceito central é separar a recepção do modelo, a visão do usuário e a renderização da saída, tornando as interações em cenários como MCQs e ramificações de role-play mais controláveis. O Quint não depende de provedores de AI específicos, sinalizando um futuro onde LLMs renderizarão diretamente componentes de UI dinâmicos, melhorando a experiência do usuário (Fonte: Reddit)

📚 Aprendizado

Hugging Face lança série de cursos gratuitos de AI: A Hugging Face lançou durante as férias uma matriz de cursos gratuitos cobrindo as tecnologias de AI mais recentes. O conteúdo inclui: curso de Robotics para construir robôs usando LeRobot, curso de MCP para aprender o Model Context Protocol, curso de Agents focado na construção e implantação de agentes, além de tutoriais técnicos profundos sobre LLM, Deep Reinforcement Learning, modelos de difusão, entre outros. Estes cursos baseiam-se no ecossistema da HF e visam ajudar desenvolvedores a dominar rapidamente habilidades práticas, desde modelos básicos até arquiteturas de Agents de ponta (Fonte: huggingface)

WildVideo: O primeiro benchmark para classificar sistematicamente alucinações em Video QA: Equipes da National University of Defense Technology e da Sun Yat-sen University lançaram o benchmark WildVideo, definindo 9 categorias de tarefas como percepção, cognição e compreensão de contexto para o problema de “alucinação” em modelos multimodais durante interações de vídeo. Experimentos mostram que mesmo a precisão do GPT-4o em tarefas de múltiplas rodadas é de apenas 52,7%, com desempenho inferior em vídeos de perspectiva em primeira pessoa. O benchmark fornece ferramentas precisas para diagnosticar falhas dos modelos em percepção dinâmica, raciocínio profundo e consistência em diálogos longos, impulsionando a avaliação de compreensão de vídeo para interações reais (Fonte: 新智元)

PhononBench: Uma nova régua para avaliar a estabilidade de cristais gerados por AI: PhononBench é o primeiro benchmark de larga escala focado na estabilidade dinâmica de cristais gerados por AI. Através da função de potencial MatterSim, ele realizou cálculos eficientes em mais de 100.000 estruturas produzidas por seis modelos generativos líderes. Os resultados revelam as limitações comuns dos modelos atuais: a estabilidade média é de apenas 25,83%. Este trabalho não apenas aponta as deficiências dos modelos generativos em termos de viabilidade física, mas também seleciona 28.000 estruturas cristalinas com fônons estáveis, fornecendo um pool de candidatos confiáveis para a exploração de novos materiais no futuro (Fonte: HuggingFace)

💼 Negócios

“Dívida Fantasma” de 120 bilhões de dólares de gigantes da AI gera preocupação: Gigantes da tecnologia como Meta, xAI e Oracle estão movendo mais de 120 bilhões de dólares em gastos com data centers para fora de seus balanços patrimoniais através de Veículos de Propósito Especial (SPV). Embora este modelo de financiamento extrapatrimonial proteja a classificação de crédito das empresas, ele também oculta riscos financeiros significativos. Se a demanda por AI não atingir as expectativas, a dívida massiva pode desencadear uma reação em cadeia em Wall Street. Dados do UBS mostram que cerca de 125 bilhões de dólares fluíram para este tipo de “project finance” este ano, refletindo que a corrida armamentista da AI entrou em uma fase de jogo de capital de alto risco (Fonte: 财联社)

“Ação Fantasma de AI” da Índia sobe 550 vezes e é revelada sem negócios de chips: A RRP Semiconductor Ltd da Índia viu o preço de suas ações disparar 55.000% nos últimos 20 meses, com o valor de mercado saltando para 1,7 bilhão de dólares, superando até o crescimento da NVIDIA. No entanto, investigações descobriram que a empresa possui apenas 2 funcionários formais e não realiza nenhuma atividade de fabricação de semicondutores, tendo inclusive receita negativa. Este fenômeno absurdo reflete a busca cega dos investidores de varejo indianos pelo conceito de AI e falhas regulatórias, tornando-se um alerta especulativo típico na bolha de AI de 2025 (Fonte: 新智元)

Demanda por computação de AI faz preço de memória de 256GB superar a RTX 5090: Com gigantes como a OpenAI garantindo 40% do suprimento global de DRAM, o mercado de memória enfrenta uma escassez estrutural. O preço de mercado de um único pente de memória DDR5 de 256GB disparou para 3.500-5.000 dólares, superando em muito as placas de vídeo topo de linha. Este fenômeno reflete como os altos lances dos servidores de AI por HBM e memórias de alto desempenho estão “sequestrando” a capacidade de produção de nível de consumo. Não apenas acessórios de PC, mas a necessidade intrínseca de grandes memórias no conceito de AI PC elevou ainda mais a barreira, com consumidores comuns enfrentando um aumento drástico nos custos de hardware devido ao prêmio da AI (Fonte: 机器之心)

🌟 Comunidade

Retrospectiva de termos quentes de AI de 2025: De “Vibe Coding” a “Slop”: A MIT Technology Review selecionou os termos de AI do ano, com “Vibe Coding” no topo, enfatizando que as pessoas só precisam expressar o objetivo e a AI se encarrega da implementação. Ao mesmo tempo, “Modelos de Raciocínio” e “Modelos de Mundo” refletem a evolução da profundidade técnica, enquanto “Slop” (conteúdo lixo de AI) e “Bolha” refletem as reflexões da comunidade sobre a inundação de conteúdo e o superaquecimento do capital. Além disso, o “GEO” (Generative Engine Optimization) está substituindo o SEO como o novo campo de batalha para marcas obterem tráfego na era da AI (Fonte: 腾讯科技, 硅星GenAI)

Yann LeCun compartilha: As “Sete Rachaduras” no julgamento entre humanos e LLMs: Um artigo comparou as diferenças de julgamento entre humanos e LLMs em sete estágios cognitivos, apontando que os LLMs possuem falhas fundamentais em ancoragem perceptiva, orientação motivacional, raciocínio causal e metacognição. Embora a linguagem gerada pelos LLMs seja fluente e enganosa, sua essência é a previsão probabilística e não uma “mente”. Discussões na comunidade sugerem que essa “sensação de inteligência artificial” é altamente enganosa na ausência de verificação, e os humanos tendem a confiar excessivamente na saída da AI devido ao “viés de crédito”, o que constitui um desafio estrutural na era da AI (Fonte: ylecun)

Discussão no Reddit: Usando o ChatGPT como ferramenta de reabilitação cognitiva: Um usuário com histórico de PTSD compartilhou sua experiência utilizando o ChatGPT para suporte cognitivo estruturado. Através de interações conversacionais de longo prazo, o usuário obteve progressos significativos reconhecidos por médicos clínicos em regulação emocional, organização lógica e auto-advocacia. A comunidade reagiu fortemente, com o foco da discussão em como a AI pode atuar como um “espelho de consistência” para auxiliar na recuperação psicológica, ao mesmo tempo em que alerta para a dependência excessiva e o possível efeito de “eco” enganoso gerado pela AI (Fonte: Reddit)

💡 Outros

Experimento em animais para Doença de Alzheimer alcança reversão total: Uma equipe de pesquisa da Case Western Reserve University publicou um avanço na Cell Reports Medicine, alcançando a recuperação total da função neurológica em camundongos com Alzheimer em estágio avançado através do composto P7C3-A20, que restaura o equilíbrio de NAD+ no cérebro. Diferente da suplementação cega de NAD+, esta terapia foca na regulação precisa, não apenas reparando danos patológicos, mas também restaurando a capacidade de memória. Embora a aplicação em humanos ainda leve tempo, ela abre as portas da esperança para a “cura definitiva” da demência (Fonte: dotey)

Robô humanoide acionado por cabos da Stardust Intelligence começa a vender blind boxes: No dia de Natal, o robô humanoide S1 acionado por cabos, desenvolvido pela Stardust Intelligence, começou oficialmente a “trabalhar” em distritos comerciais de Pequim, Xangai e Guangzhou, sendo responsável por recepção por voz, captura de blind boxes e entrega de mercadorias. A tecnologia de acionamento por cabos confere ao robô flexibilidade e controle de força refinado semelhante aos músculos humanos, tornando-o mais seguro e “responsivo” na interação humano-robô. O conceito de “Inteligência por Avatar” proposto pela empresa visa permitir que robôs entrem primeiro em cenários reais, como laboratórios tóxicos ou serviços remotos, através de teleoperação (Fonte: 智能涌现)

Hit musical de AI “Seven-Day Lover” gera disputa sobre direitos autorais e atenção: A música “Seven-Day Lover”, gerada por um programador usando DeepSeek e ferramentas de música de AI, ultrapassou 2 milhões de reproduções no NetEase Cloud Music, com direitos autorais vendidos por dezenas de milhares de yuans. Este evento prova que a música de AI já possui capacidade real de monetização e está impactando o sistema tradicional de direitos autorais. O Qishui Music da ByteDance define caminhos para sucessos através do ecossistema TikTok, enquanto Tencent e NetEase mantêm vigilância rigorosa sobre auditoria e distribuição de lucros. A “oferta infinita” trazida pela AI está forçando as plataformas a mudar da competição por direitos autorais para a guerra pela eficiência na distribuição da atenção (Fonte: 市象)

🔥 Destaque

🎯 Tendências

🧰 Ferramentas

📚 Aprendizado

💼 Negócios

🌟 Comunidade

💡 Outros

Tags Relacionadas

Related Posts

Diário de IA – 2026-07-20

Diário de IA – 2026-07-19

Diário de IA – 2026-07-18