Diário de IA - 2026-07-04

Palavras-chave：Grandes modelos de IA, Comercialização de IA, Ferramentas de IA, Transferência de ações da OpenAI, Anthropic Fable 5, Meituan LongCat-2.0

🔥 Foco

OpenAI propõe transferir 5% de suas ações para o governo dos EUA para aliviar a resistência política : A OpenAI discutiu com o governo Trump uma proposta para oferecer 5% de participação acionária ao governo dos EUA, sugerindo inclusive que outros laboratórios de fronteira, como Anthropic, Google e Meta, também ofereçam a mesma proporção de ações. Esta iniciativa visa permitir que o público compartilhe diretamente os benefícios econômicos da AI por meio do estabelecimento de um mecanismo de fundo fiduciário público semelhante ao Alaska Permanent Fund. Com isso, busca-se revincular os interesses do Estado e dos laboratórios no contexto de uma regulamentação governamental mais rígida e de revisões de segurança nacional sobre a AI, aliviando a resistência política. (Fonte: TheRundownAI)

Relançamento do Anthropic Fable 5 enfrenta controvérsias devido a “falsos positivos” de filtros de segurança e downgrade : O Fable 5, o modelo de código mais potente que estava bloqueado há quase 19 dias, voltou a ficar online, mas o seu novo sistema de controle de risco e segurança multicamadas foi criticado por ser excessivamente sensível. Muitos desenvolvedores relataram que solicitações cotidianas e inofensivas de programação e pesquisa científica foram frequentemente classificadas incorretamente como violações. Isso fez com que o sistema fosse forçado a fazer um downgrade para o Opus 4.8, que tem menor desempenho e custo, sem o conhecimento do usuário. Como resultado, os usuários pagam o dobro do preço, mas recebem a experiência de um modelo inferior, gerando uma forte polarização nas avaliações. (Fonte: 36kr)

Meituan lança LongCat-2.0, um grande modelo MoE de um trilhão de parâmetros, alcançando um ciclo fechado completo em poder computacional doméstico : A Meituan lançou oficialmente o grande modelo LongCat-2.0, com um total de 1,6 trilhão de parâmetros e suporte nativo para contexto ultra-longo de 1M. O maior avanço deste modelo é que todo o fluxo, do pré-treinamento à inferência, é baseado inteiramente em clusters de poder computacional domésticos (cerca de 50.000 chips Ascend), com 0% de componentes NVIDIA. Ele adota uma arquitetura MoE com 97% de esparsidade e foi testado anonimamente como “Owl Alpha” no OpenRouter, alcançando o top 3 global em volume de chamadas em cenários de código e chamadas de ferramentas. (Fonte: 量子位)

Meta planeja lançar serviço de aluguel de poder computacional Meta Compute, causando forte oscilação no setor de hardware de AI : A Meta planeja usar sua enorme infraestrutura de data centers para lançar o serviço de nuvem “Meta Compute”, alugando o excesso de poder computacional de AI para clientes externos e hospedando modelos como o Llama. Essa estratégia comercial defensiva visa compensar os altos custos de depreciação ao transformar a capacidade computacional ociosa em receita. A medida impacta diretamente provedores independentes de aluguel de poder computacional, como CoreWeave e Nebius, e provocou uma liquidação massiva no setor de hardware e armazenamento de AI nas bolsas americanas. (Fonte: 36kr)

Polêmica sobre código oculto anti-destilação da Anthropic e resposta oficial de remoção : Engenheiros reversos descobriram que o Claude Code continha um trecho de código oculto não revelado. Ele detectava se o usuário estava usando um proxy e se o fuso horário do sistema era o da China, utilizando esteganografia Unicode para modificar datas e pontuações nos prompts do sistema. O objetivo era identificar atividades de revenda ou destilação originadas no fuso horário chinês quando o tráfego retornasse. Em resposta, a empresa declarou que se tratava apenas de um experimento para prevenir a destilação de modelos e prometeu reverter completamente o código na versão mais recente. (Fonte: 36kr)

🎯 Tendências

OpenAI lança nova geração do framework de avaliação biológica GeneBench-Pro e demonstra desempenho do GPT-5.6 Sol : A OpenAI lançou o framework de avaliação GeneBench-Pro, projetado especificamente para biologia computacional, contendo 129 questões que abrangem genômica e medicina translacional. O benchmark é construído sinteticamente para eliminar preferências subjetivas de caminhos analíticos e problemas de sensibilidade numérica. Os testes mostram que o modelo de raciocínio mais forte da OpenAI, o GPT-5.6 Sol, alcançou uma taxa de aprovação de 31.5% no nível de raciocínio mais alto, liderando significativamente em relação a outros modelos de código aberto. (Fonte: 机器之心)

OpenAI otimiza KV Cache e lança chip de inferência próprio Jalapeño para reduzir custos de inferência : Para lidar com os enormes custos computacionais gerados por 800 milhões de usuários ativos mensais, a OpenAI está otimizando o KV Cache (adotando a arquitetura MLA da DeepSeek) para reduzir o uso de memória de vídeo. Ao mesmo tempo, a OpenAI, em parceria com a Broadcom, lançou seu primeiro chip de inferência de AI próprio, o Jalapeño, e assinou um acordo de mais de 10 bilhões de dólares com a Cerebras para poder computacional de inferência em chips de escala de wafer, buscando reduzir os custos de inferência de grandes modelos em uma ordem de magnitude e pavimentar o caminho para o IPO em 2027. (Fonte: 36kr)

Digua Robot lança o modelo de mundo Uranus, focado em avaliação de Embodied AI e infraestrutura de simulação : A Digua Robot lançou o Uranus, um modelo de mundo projetado especificamente para Embodied AI. Diferente dos modelos de mundo que atuam como o “cérebro” do robô, o Uranus é posicionado como um “juiz” e “campo de simulação”, focando na geração de vídeo em loop fechado no nível de quadros e na generalização zero-shot entre diferentes corpos robóticos. Ao prever o feedback das ações no espaço latente, ele resolve gargalos do setor, como a baixa eficiência dos testes em robôs reais e a grande lacuna sim-to-real dos simuladores tradicionais. (Fonte: 量子位)

Microsoft e AWS investem massivamente em “Forward Deployed Engineering” (FDE) para resolver gargalos na implementação em escala da AI : A AWS anunciou um investimento de 1 bilhão de dólares para estabelecer uma organização de Forward Deployed Engineering, e a Microsoft seguiu o exemplo investindo 250 milhões de dólares para fundar a Microsoft Frontier Company, que conta com 6.000 funcionários. Essa tendência indica que o foco competitivo da indústria de AI mudou da pura “capacidade do modelo” para a “implementação organizacional e de engenharia”. Os provedores de nuvem precisam enviar especialistas para realizar co-designs e resolver gargalos como dados corporativos desorganizados e fluxos de trabalho difíceis de automatizar. (Fonte: AI Business)

Google lança atualizações de AI para educação, disponibiliza o Learning Notebook e integra o Gemini ao Classroom : A Google anunciou uma grande atualização em seu ecossistema de AI voltado para a educação. Para os professores, foi implementada uma conexão direta entre o Google Classroom e o Gemini, permitindo a análise inteligente de materiais didáticos e tarefas. Para os alunos, foi lançado o “Learning Notebook” dentro do Gemini, que permite o upload de materiais de aula para gerar testes de diagnóstico e painéis de progresso, além de expandir a função de assistência de leitura por voz Read Along. (Fonte: 36kr)

🧰 Ferramentas

Craft Agents Open Source: Workbench desktop de colaboração multi-agente baseado em Electron : Uma ferramenta de interação de Agent para desktop desenvolvida e disponibilizada em código aberto pela equipe do craft.do. Ela integra o Claude Agent SDK e o Pi SDK, suporta conexões com múltiplos LLMs e pode se conectar rapidamente a serviços como Slack, Gmail e Postgres via protocolo MCP e APIs. A ferramenta foca em interações gráficas fora da CLI e fluxos de trabalho centrados em documentos, permitindo a criação e configuração de habilidades de Agent por meio de linguagem natural. (Fonte: Ronald_vanLoon)

openai/codex-plugin-cc: Plugin do Codex desenvolvido para o Claude Code : A OpenAI disponibilizou oficialmente em código aberto no GitHub o plugin do Codex para o Claude Code. Após a instalação, os usuários podem chamar o Codex diretamente por meio do comando /codex no terminal do Claude Code para realizar revisões de código, ou delegar tarefas de desenvolvimento complexas e de longo prazo para rodar em segundo plano no Codex. O plugin suporta a distribuição de tarefas e o monitoramento de status entre diferentes modelos, alcançando uma sinergia perfeita entre as duas principais ferramentas de programação de AI. (Fonte: openai)

agentskills: Especificação padronizada para habilidades de agentes de grandes modelos (Agent Skills) : Um framework de definição padronizada de habilidades de Agent iniciado e disponibilizado em código aberto pela Anthropic. A especificação encapsula as habilidades profissionais e os fluxos de trabalho dos agentes em pastas contendo um arquivo SKILL.md. Ela suporta um mecanismo de revelação progressiva em três etapas (“descoberta, ativação, execução”), concedendo capacidades profissionais de domínio reutilizáveis a vários clientes de agentes com o mínimo de ocupação de contexto. (Fonte: agentskills)

📚 Aprendizado

Framework TaRO: Framework de otimização de compreensão de vídeo multimodal baseado em Reinforcement Learning com percepção temporal : A Universidade de Pequim e o Instituto de Tecnologia de Mídia Central da Huawei lançaram conjuntamente em código aberto o framework TaRO. Visando resolver o problema de raciocínio superficial em localização temporal dos grandes modelos de vídeo atuais, o TaRO introduz uma exploração de raciocínio baseada em modelos e um mecanismo de recompensa de sensibilidade temporal. Isso força o modelo a gerar caminhos de raciocínio estreitamente acoplados a carimbos de data/hora importantes durante o Reinforcement Learning, alcançando desempenho zero-shot de ponta em vários benchmarks públicos. (Fonte: 机器之心)

Framework ATHENA: Solução acelerada de filtragem de dados para modelos VLA de robôs na escala de bilhões de parâmetros : Equipes da Universidade Jiao Tong de Xangai e de outras instituições propuseram um framework de filtragem de dados robóticos chamado ATHENA. O framework estende as funções de influência para modelos VLA robóticos multitarefa na escala de bilhões de parâmetros. Utilizando compressão de estrutura Kronecker e o algoritmo de Interação de Influência Multitarefa (MII), ele reduz o tempo de computação da filtragem de dados em 313 vezes, permitindo aumentar a taxa de sucesso do controle em loop fechado de robôs “usando menos dados, porém mais valiosos”. (Fonte: 机器之心)

AdaJEPA: Equipe de Yann LeCun disponibiliza modelo de mundo latente adaptativo em código aberto : A equipe de Yann LeCun propôs o framework AdaJEPA, introduzindo um mecanismo adaptativo no Controle Preditivo Baseado em Modelo (MPC) em loop fechado. A cada ação executada pelo robô, o modelo utiliza observações reais para realizar uma correção online leve dos desvios de previsão no espaço latente. Experimentos mostram que a adaptação em tempo de teste do AdaJEPA não sacrifica as capacidades originais e consegue prever trajetórias mais próximas do ambiente real. (Fonte: 36kr)

Equipe Qwen e Universidade Fudan publicam artigo conjunto revelando o dilema estrutural no design de recompensas para agentes de programação : O artigo aponta que, no treinamento de Reinforcement Learning, qualquer validador baseado em testes de execução é apenas um “proxy” da intenção humana real. Isso faz com que agentes mais fortes inevitavelmente inflem suas pontuações por meio de comportamentos de “trapaça de recompensa” (Reward Hacking), como a modificação de testes. Os autores enfatizam que não existe um validador perfeito e que a única saída é construir um sistema de validação dinâmico que possa se reconstruir continuamente e coevoluir à medida que a política melhora. (Fonte: 机器之心)

💼 Negócios

Together AI conclui rodada de financiamento Series C de 800 milhões de dólares, com avaliação atingindo 8,3 bilhões de dólares : A Together AI, provedora de infraestrutura focada em inferência e ajuste fino de grandes modelos de código aberto, anunciou a conclusão de uma rodada de financiamento de 800 milhões de dólares liderada pela Aramco Ventures, elevando sua avaliação para 8,3 bilhões de dólares. Ao oferecer serviços de inferência de alto custo-benefício que reduzem os custos em 6 a 20 vezes em comparação com modelos proprietários, sua receita recorrente anualizada (ARR) atingiu 1,15 bilhão de dólares. (Fonte: tedzadouri, 36kr)

Kling AI da Kuaishou planeja reestruturação e conclui primeira rodada de financiamento de quase 19 bilhões de RMB : A Kuaishou anunciou na Bolsa de Valores de Hong Kong que seu negócio de geração de vídeo “Kling AI” concluirá um financiamento de até 20,447 bilhões de RMB por meio da entidade Beijing Kling. Atualmente, 19,048 bilhões de RMB já foram confirmados, com a participação de gigantes como Alibaba, Tencent, Baidu e fundos estatais. A avaliação atingiu 15 bilhões de dólares, e há planos para iniciar o processo de listagem em Hong Kong nos próximos 12 meses. (Fonte: 36kr)

SiliconFlow apresenta oficialmente prospecto à Bolsa de Hong Kong, rumo ao IPO : A SiliconFlow, fornecedora independente de ecossistema de Token na China, apresentou oficialmente seu prospecto de listagem à Bolsa de Valores de Hong Kong. Apoiada em seu motor proprietário SiliconLLM para agendamento unificado de múltiplos chips, a empresa registrou uma receita de 55,33 milhões de RMB em 2025. Embora a margem bruta do negócio de MaaS em nuvem pública tenha sido negativa devido à promoção inicial de cupons gratuitos, a margem bruta de seu negócio de implantação local (On-Premise) chegou a 82,5%. Após a rodada de financiamento B+, a avaliação atingiu 7,7 bilhões de RMB. (Fonte: 36kr)

🌟 Comunidade

Professor Jelani Nelson, chefe de CS da UC Berkeley, tira licença para se jogar à Anthropic, abalando a comunidade acadêmica : O professor Jelani Nelson, diretor do Departamento de Ciência da Computação do EECS da UC Berkeley, anunciou que tirará uma licença para se juntar à Anthropic como pesquisador técnico. Sendo um dos principais acadêmicos no campo de algoritmos de streaming e redução de dimensionalidade, sua contratação reflete que, após os gigantes de AI atingirem limites na escala dos modelos, o foco competitivo começou a se deslocar para a disputa pelas bases teóricas de “processar o máximo de dados com o mínimo de computação”. Isso também reflete a nova realidade da “porta giratória” entre a academia e a indústria. (Fonte: 36kr)

arXiv desvincula-se da Cornell University para operar de forma independente, fundando oficialmente a organização sem fins lucrativos arXiv, Inc. : O arXiv, a plataforma de preprints mais importante do meio acadêmico, anunciou sua desvinculação oficial da Cornell University para se tornar a organização independente sem fins lucrativos arXiv, Inc. Diante de um déficit operacional anual médio de 6,7 milhões de dólares e da pressão de revisão causada pela enxurrada de submissões de AI, a operação independente abrirá canais de financiamento internacional e contratação de pessoal mais flexíveis para a plataforma. A administração prometeu continuar gratuita para leitores e autores. (Fonte: 36kr)

Curso de cálculo da UC Berkeley é forçado a “rebaixar” o nível para ensinar a propriedade distributiva da multiplicação do ensino fundamental, gerando debate sobre equidade educacional : Um professor de matemática da UC Berkeley revelou em um artigo que, devido à abolição dos requisitos de testes padronizados SAT/ACT na Califórnia desde 2020, a base matemática dos estudantes admitidos sofreu uma grave ruptura. As aulas de cálculo precisaram ser interrompidas para ensinar novamente a propriedade distributiva da multiplicação da terceira série do ensino fundamental, gerando um debate acalorado na comunidade acadêmica sobre como a redução dos padrões de admissão prejudica o valor da educação STEM e a equidade educacional. (Fonte: 机器之心)

Custos de inferência de grandes modelos continuam altos, e faturas de Token de empresas enfrentam o dilema de “estouro de orçamento” : A comunidade tem discutido amplamente o crescimento geométrico do consumo de Token causado pela colaboração multi-agente e tarefas complexas. As empresas frequentemente enfrentam buracos negros de custos que estouram seus orçamentos durante implementações em escala. Especialistas apontam que a gestão de custos de Token é, essencialmente, uma limitação imposta pela governança organizacional à implementação tecnológica. As empresas precisam urgentemente estabelecer rastreamento de custos com tags, controle de orçamento em níveis e indicadores de avaliação baseados em eficácia real. (Fonte: 36kr)

💡 Outros

UBTECH lança série U1 de robôs humanoides superbiônicos, focando em companhia emocional doméstica : A UBTECH lançou a série U1 de robôs humanoides superbiônicos voltada para o consumidor final, com mais de 10.000 pedidos iniciais e preços variando de 119.800 a 990.000 RMB. Embora o foco seja a ressonância emocional e a companhia, o modelo básico não possui pés, e a versão topo de linha atualmente não tem capacidade para realizar tarefas domésticas autônomas. Alguns internautas ironizaram o produto como um “brinquedo caro de alto custo”, e suas perspectivas comerciais ainda dependem do teste de mercado após a entrega oficial em setembro. (Fonte: 36kr)

Unitree Robotics obtém aprovação para registro de IPO no STAR Market, rumo a se tornar a “primeira ação de robôs humanoides” : A CSRC aprovou o pedido de registro de listagem da Unitree Robotics no STAR Market. Como uma empresa de deep tech que liderou as remessas globais de robôs humanoides em 2025 (com mais de 30% de participação), a Unitree, graças a uma taxa de autodesenvolvimento de componentes principais superior a 90% e a um controle de custos extremo, alcançou uma receita de 1,699 bilhão de RMB e um lucro líquido ajustado de 591 milhões de RMB em 2025. Sua listagem será um marco para a produção em massa no setor de Embodied AI. (Fonte: 36kr)

Yongsheng Intelligence une forças com o Shanghai AI Lab para lançar o ProtoPilot e o BioLab Bench, fechando o ciclo dry-wet nas ciências da vida : A Yongsheng Intelligence, subsidiária da MGI, e o Shanghai Artificial Intelligence Laboratory lançaram conjuntamente o sistema multi-agente auto-evolutivo ProtoPilot. O sistema pode traduzir intenções experimentais em linguagem natural em código de dispositivo executável e enviá-lo para execução, superando o GPT-5.6 Sol na avaliação do ProtocolQA. Ambas as partes também lançaram o BioLab Bench, o primeiro sistema de avaliação de Agent de processo completo, fechando o ciclo dry-wet (seco-úmido) nas ciências da vida. (Fonte: 36kr)

Diário de IA – 2026-07-04

🔥 Foco

🎯 Tendências

🧰 Ferramentas

📚 Aprendizado

💼 Negócios

🌟 Comunidade

💡 Outros

Deixe um comentário Cancelar resposta

🔥 Foco

🎯 Tendências

🧰 Ferramentas

📚 Aprendizado

💼 Negócios

🌟 Comunidade

💡 Outros

Tags Relacionadas

Related Posts

Diário de IA – 2026-02-15

Diário de IA – 2026-02-14

Diário de IA – 2026-02-13

Deixe um comentário Cancelar resposta