Diário de IA - 2025-12-31(Edição da noite)

Palavras-chave：Agente de IA inteligente, Aquisição da Meta, Investimento da OpenAI, Planejamento de tarefas para agentes de inteligência geral, Infraestrutura de IA Stargate, Codificação autônoma Claude Code

🔥 Destaques

Meta adquire a startup de AI Agent Manus por bilhões de dólares: No final de 2025, a Meta concluiu sua terceira maior aquisição desde a fundação, incorporando a Manus, a “zebra” do setor de AI Agent, por mais de US$ 2 bilhões. A transação foi conduzida pessoalmente por Mark Zuckerberg e finalizada em apenas dez dias. Com o posicionamento de “agente inteligente universal”, a Manus alcançou um ARR de US$ 100 milhões em menos de um ano, tendo como vantagem principal seu poderoso framework de planejamento e execução de tarefas. Este movimento marca uma mudança de paradigma na indústria de AI, do “modelo de diálogo” para a “inteligência de ação”. A Meta tenta remodelar seu ecossistema interno de aplicações de AI ao introduzir este “peixe-gato chinês”, suprindo suas deficiências na camada de execução de Agent em relação à OpenAI e Anthropic (Fonte: 36氪, ZhihuFrontier, TheRundownAI)

SoftBank conclui investimento massivo de US$ 40 bilhões na OpenAI: O SoftBank pagou integralmente o capital prometido à OpenAI, com a última parcela de US$ 22,5 bilhões depositada na semana passada, elevando sua participação para cerca de 11%. Este financiamento foi um pré-requisito crucial para a OpenAI concluir sua reestruturação e se tornar uma organização com fins lucrativos. Masayoshi Son levantou os fundos através de empréstimos garantidos por ações da Arm e pela liquidação de ações da NVIDIA, visando apoiar totalmente o projeto de infraestrutura de AI “Stargate” em parceria com a Oracle. Isso sinaliza que a corrida armamentista global de AI entrou em uma era de infraestrutura de trilhões de dólares, com a intensidade de capital atingindo um pico histórico (Fonte: 36氪)

Zhipu e MiniMax batem às portas da HKEX: A Zhipu passou oficialmente pela audição da HKEX e iniciou sua oferta pública, com planos de listagem para 8 de janeiro de 2026; o valor de mercado do IPO pode superar 51,1 bilhões de HKD. A MiniMax seguiu o exemplo e submeteu seu prospecto logo em seguida. Como representantes das “Seis Pequenas Gigantes” de modelos de linguagem da China, a listagem de ambas as empresas marca a transição da indústria da “corrida de parâmetros” para a “calibração de capital”. O prospecto revela a coexistência de alto crescimento e grandes prejuízos, com a Zhipu registrando um prejuízo líquido de 820 milhões de RMB no primeiro semestre de 2025. O mercado examinará, através de dados financeiros públicos, a real lucratividade e o ponto de inflexão dos custos de computação no caminho da comercialização de grandes modelos (Fonte: 36氪, andrew_n_carr)

Claude Code atinge 100% de contribuição de código autônoma por AI: O engenheiro da Anthropic, Boris Cherry, revelou que, nos últimos 30 dias, centenas de PRs e dezenas de milhares de linhas de código contribuídas para o projeto Claude Code foram 100% realizadas por AI, com humanos responsáveis apenas por “cutucar” o stop hook para mantê-lo rodando. O Claude Opus 4.5 demonstrou até 5 horas de capacidade de codificação autônoma no teste METR, superando de longe o GPT-5.1-Codex da OpenAI. Este avanço indica que a engenharia de software está entrando na era do “AI Operator”, onde o papel do programador muda de escritor para auditor e orquestrador de sistemas (Fonte: ylecun, imjaredz)

🎯 Tendências

Retrospectiva do roadmap de lançamento de modelos da OpenAI em 2025: Em 2025, a OpenAI alcançou a convergência da capacidade de raciocínio e avanços em multimodalidade em tempo real através da série GPT-5.2. As novas Responses API, Agents SDK e o protocolo MCP construíram os módulos de desenvolvimento nativos de Agent. Em termos de desempenho, o GPT-5.2 atingiu 100% de precisão na competição de matemática AIME, e a pontuação no SWE-bench Verified subiu para 80.0. Simultaneamente, a OpenAI começou a lançar modelos de pesos abertos como o gpt-oss, tentando combater concorrentes através de um ecossistema open-source enquanto mantém a liderança em modelos fechados (Fonte: reach_vb)

Redes neurais armazenam fatos como estruturas geométricas e não como tabelas de consulta: Um novo artigo do Google e da Carnegie Mellon University revela que os modelos Transformer e Mamba tendem a organizar fatos como relações em um espaço geométrico durante o treinamento. Nesta memória geométrica, o raciocínio de múltiplas etapas pode ser convertido em verificações de distância de etapa única, permitindo que o modelo atinja 100% de precisão em consultas de caminhos de grafos com 50.000 nós. Esta descoberta explica por que modelos de sequência profunda conseguem emergir com uma compreensão lógica global que transcende conexões locais (Fonte: jpt401)

NVIDIA lança NitroGen, um modelo base de AI genérico para jogos: O modelo foi treinado através de clonagem comportamental em larga escala com 40.000 horas de vídeos de gameplay, cobrindo mais de 1.000 títulos de jogos, e pode servir como base para AI Agents genéricos em jogos. O CEO da NVIDIA, Jensen Huang, enfatizou em uma entrevista exclusiva que a NVIDIA está criando uma “máquina do tempo” através da fusão do Omniverse com o mundo físico para prever a evolução de sistemas futuros. Além disso, a NVIDIA alcançou um aumento de 10.000 vezes na eficiência energética computacional em 8 anos, vendo os limites de energia como a fronteira física central do desenvolvimento da AI (Fonte: Reddit, 36氪)

Modelo Self-E desbloqueia geração de imagens a partir de texto com qualquer número de etapas: Pesquisadores introduziram o modelo de autoavaliação (Self-E), um framework de geração de imagens que suporta desde raciocínio de etapa única até múltiplas etapas. Diferente dos métodos de destilação que dependem de um professor pré-treinado, o Self-E realiza correspondência global autodirigida através de um mecanismo de autoavaliação dinâmica. Experimentos mostram que o modelo tem excelente desempenho com poucas etapas e que a performance aumenta monotonicamente com o número de etapas de raciocínio, fornecendo um framework unificado para geração de imagens eficiente e escalável (Fonte: HuggingFace)

🧰 Ferramentas

Manus lança funções Design View e Mark Tool: Para reduzir a lacuna entre a concepção do design e a imagem final gerada, a Manus lançou novas ferramentas de edição visual. Os usuários podem usar a Mark Tool para marcar diretamente na imagem as áreas que precisam de modificação, em vez de ajustar repetidamente os prompts. Esta forma de interação oferece controle granular sobre a geração de imagens, transformando o desenho por AI de um “modo caixa surpresa” para uma “edição de precisão” (Fonte: Reddit)

HelloBoss lança aplicação de “Headhunter de AI” baseada em AI Agent: A plataforma foca nos pontos problemáticos do mercado de recrutamento no Japão e globalmente, completando autonomamente 90% do processo de recrutamento, incluindo publicação de vagas, correspondência inteligente de currículos e compartilhamento de registros de entrevistas. O HelloBoss adota um modelo de pagamento por resultado, reduzindo os custos de recrutamento em 20% e encurtando o ciclo em mais da metade. Atualmente, a plataforma possui mais de 500.000 vagas online e recebeu financiamento da Série A do BAI Capital do Bertelsmann Group (Fonte: 36氪)

LangChain lança ferramenta de análise AI Wrapped 2025: Esta ferramenta utiliza agentes do LangSmith Insights para analisar o histórico de conversas dos usuários no ChatGPT e Claude, identificando padrões de uso, tendências e agrupamentos anômalos do último ano. Sua base subjacente é inspirada no artigo CLIO da Anthropic, visando ajudar os usuários a revisar como colaboraram com a AI através de dados, revelando hábitos de interação ocultos (Fonte: LangChainAI)

Typeless lança teclado de voz com AI para iOS: O aplicativo afirma converter voz em texto polido, sendo 4 vezes mais rápido do que digitar. Ele suporta mais de 100 idiomas e pode ser chamado diretamente em aplicativos como WhatsApp, Slack e e-mail. Isso reflete a mudança da interação de AI em dispositivos móveis do simples reconhecimento de voz para modos de comunicação nativos com compreensão de contexto e polimento de estilo (Fonte: Reddit)

📚 Aprendizado

Google lança plataforma educacional gratuita Google Skills: O centro contém 3.000 módulos técnicos, abrangendo desde a arquitetura básica de Transformer até fluxos de trabalho de pesquisa da DeepMind. Diferente dos “tutoriais de prompt” que inundam o mercado, o Google Skills foca em princípios técnicos fundamentais e caminhos de pesquisa de ponta, visando abrir os cursos de treinamento interno de laboratórios de elite para o público (Fonte: JeffDean)

BrennerBot: Recurso de metodologia científica baseado em entrevistas de Sydney Brenner: Desenvolvedores utilizaram o GPT-5.2 Pro e o Opus 4.5 para destilar profundamente 236 registros de entrevistas do biólogo Sydney Brenner, construindo o brennerbot.org. O projeto demonstra como usar modelos de contexto longo para extrair “fios de pensamento” de vastas quantidades de dados não estruturados, explorando como Brenner formava rapidamente hipóteses científicas através de inferência bayesiana e indução lógica em situações de escassez de recursos (Fonte: doodlestein)

23 artigos de pesquisa fundamentais que sinalizam o futuro da AI em 2025: O TheTuringPost compilou os artigos mais influentes do ano, incluindo LeJEPA, Absolute Zero (autorreprodução por reforço com zero dados) e o framework de pensamento System 3. O System 3 é definido como uma camada de autoaperfeiçoamento acima da percepção e do raciocínio, responsável pelo comportamento de longo prazo e construção de identidade de AI Agents, prevendo que em 2026 os Agents evoluirão de ferramentas estáticas para entidades em crescimento dinâmico (Fonte: TheTuringPost)

💼 Negócios

SoftBank adquire DigitalBridge por US$ 4 bilhões para expandir infraestrutura de AI: Através desta aquisição, o SoftBank obteve uma grande quantidade de ativos de data centers, torres de celular e redes de fibra óptica. Masayoshi Son está concentrando capital nos elos centrais da cadeia de valor de AI através de reestruturação de ativos e financiamento, pavimentando o caminho para a comercialização subsequente da OpenAI e o centro de computação “Stargate” (Fonte: 36氪)

Adobe e Runway estabelecem parceria estratégica plurianual: Os modelos e tecnologias da Runway serão integrados diretamente nas ferramentas de criação da Adobe. Ambas as partes desenvolverão conjuntamente funções avançadas de AI voltadas especificamente para fluxos de trabalho profissionais, disponíveis exclusivamente em aplicativos Adobe. Isso marca a integração profunda da tecnologia de geração de vídeo de aplicações independentes para ecossistemas criativos maduros (Fonte: c_valenzuelab)

UBTECH planeja adquirir a empresa Fenglong listada em A-share por 1,665 bilhão de RMB: Esta aquisição entre mercados visa completar o quebra-cabeça da fabricação e cadeia de suprimentos de robôs humanoides. A UBTECH tenta integrar a capacidade de fabricação de precisão da Fenglong para apoiar a produção em massa de robôs humanoides industriais como o Walker S2, lidando com a crescente pressão de pedidos comerciais (Fonte: 36氪)

🌟 Comunidade

Desenvolvedores profissionais rejeitam “Vibe Coding” e enfatizam o controle: A comunidade debateu calorosamente uma pesquisa com desenvolvedores experientes, onde 100% dos profissionais insistiram em manter o controle sobre o design da arquitetura ao utilizar AI. O chamado “Vibe Coding” costuma falhar ao lidar com lógica de negócios complexa e integração de código legado. Desenvolvedores acreditam que a AI deve ser um parceiro colaborativo controlável, e não uma máquina automática sem supervisão humana; a competência central reside em “definir o problema” e não em “ajustar a ferramenta” (Fonte: omarsar0, random_walker)

Produtos de AI entram em período de fadiga estética devido à “Adaptação Hedônica”: Usuários do Reddit discutem o fenômeno da “fadiga de AI”, acreditando que, com a diminuição dos efeitos marginais da Scaling Law e o esgotamento dos dados da internet, o impacto de choque de novos produtos está desaparecendo. Os usuários tornaram-se dessensibilizados a simples “diálogos” e “geração de imagens”; a comunidade começou a mudar de “modelos mais inteligentes” para “quem realmente consegue terminar o trabalho” — barras de progresso são mais atraentes que caixas de diálogo (Fonte: Reddit, dotey)

O mundo físico é o “professor honesto” para o aprendizado da AI: A comunidade discute o valor da inteligência incorporada (embodied intelligence), acreditando que ambientes de simulação podem mentir, mas as leis da física são honestas. O feedback do solo fornecido por robôs é uma verdade imutável; este ciclo de feedback imediato e real é o caminho necessário para a AI alcançar uma inteligência de nível superior. O robô de pequeno porte Q1 lançado por Zhihui Jun é visto como uma tentativa importante de reduzir as barreiras de pesquisa e permitir que mais equipes tenham contato com o “feedback físico” (Fonte: ziran_pu, 机器之心)

💡 Outros

Computadores quânticos simulam com sucesso física complexa além da capacidade de supercomputadores: A computação quântica demonstrou supremacia quântica ao simular sistemas físicos específicos, processando cálculos que computadores tradicionais não conseguem realizar. Isso sugere que o poder computacional futuro da AI pode alcançar um crescimento exponencial através da aceleração quântica, especialmente em ciência de materiais e desenvolvimento de medicamentos (Fonte: Ronald_vanLoon)

Ferramentas médicas de AI enfrentam ceticismo de “vincular astrologia à física”: Em relação a aplicações como psicólogos de AI, há visões de que, embora a análise de fenótipo digital seja precisa como medições físicas, se vinculada a frameworks psiquiátricos com hipóteses instáveis, pode levar a intervenções erradas. A comunidade alerta para o risco da AI achatar emoções humanas complexas em padrões preditivos (Fonte: MIT Technology Review)

Plataformas de vídeos curtos são inundadas por “AI Slop”: Estudos mostram que 21% do fluxo de recomendação para novos usuários no YouTube é conteúdo gerado por AI. Embora esses vídeos de baixo custo, alta repetição e forte estímulo sensorial consigam enganar algoritmos para obter recomendações e taxas de publicidade, eles diluem o valor do ecossistema de conteúdo. A recompensa dos algoritmos por sinais comportamentais está involuntariamente gerando uma cadeia industrial massiva de conteúdo de baixa densidade de informação (Fonte: 36氪)

🔥 Destaques

🎯 Tendências

🧰 Ferramentas

📚 Aprendizado

💼 Negócios

🌟 Comunidade

💡 Outros

Tags Relacionadas

Related Posts

Diário de IA – 2026-07-21

Diário de IA – 2026-07-20

Diário de IA – 2026-07-19