Palavras-chave:IA, LLM, AGI, Transformer, aprendizagem por reforço, multimodal, agente inteligente, modelo de mundo, RLVR aprendizagem por reforço, programação de ambiente, segurança distribuída de AGI, RNN não-linear, desempenho do Gemini 3 Flash
🎯 Tendências
Karpathy 2025: O Despertar Final da IA – LLMs Entram na Era da “Inteligência Fantasma” e “Programação Ambiental” : A retrospectiva de fim de ano de Andrej Karpathy, fundador da OpenAI, aponta que a filosofia de treinamento de IA está evoluindo de “imitação probabilística” para “raciocínio lógico”, impulsionada principalmente pelo aprendizado por reforço baseado em recompensas verificáveis (RLVR). Ele compara a inteligência da IA a um “fantasma invocado”, em vez de um “animal evoluído”, explicando que a IA se destaca em áreas específicas, mas apresenta deficiências “irregulares” em questões de senso comum. Ele também destacou o surgimento da “programação ambiental”, a utilidade de agentes de IA localizados e a evolução das interfaces gráficas para LLMs (LLM GUI), afirmando que atualmente menos de 10% do potencial dos LLMs foi explorado, com um vasto espaço para desenvolvimento futuro. (Fonte: 36Kr, 36Kr, 36Kr)

Google DeepMind Revela Novo Paradigma para AGI: De “Supercérebro” para “Empresa Fragmentada” : O artigo seminal do Google DeepMind, “Segurança de AGI Distribuída”, desafia a suposição tradicional de um “AGI monolítico”, introduzindo o conceito de “AGI fragmentado”. Essa teoria propõe que a inteligência artificial geral não é uma entidade onisciente, mas uma rede descentralizada de agentes especializados complementares, cuja inteligência emerge da interação e colaboração intensa entre eles. Essa necessidade econômica impulsiona a transição da IA da psicologia para a sociologia e economia, transformando questões de segurança de AGI em problemas de design de mecanismos, enfatizando a governança de economias de agentes através de design de mercado, vinculação de identidade e mecanismos de reputação para mitigar riscos como conluio tácito e falhas em cascata. (Fonte: 36Kr)

Arquitetura Transformer Enfrenta Limitações: Novo Paradigma Necessário para a Próxima Geração de Agentes : Na conferência Tencent ConTech, Zhang Xiangyu, cientista-chefe da StepStar, destacou que a arquitetura Transformer atual é inadequada para suportar a próxima geração de agentes, especialmente em contextos de texto longo, onde o “QI” do modelo decai rapidamente com o aumento do comprimento do contexto. Geoffrey Hinton e Ilya Sutskever também expressaram opiniões semelhantes, apontando limitações do Transformer em lógica causal e raciocínio físico. Futuras arquiteturas podem evoluir para redes neurais recorrentes não lineares (“Non-Linear RNN”) para resolver problemas como fluxo unidirecional de informação e profundidade fixa de pensamento, permitindo memória e raciocínio mais eficientes. (Fonte: 36Kr, 36Kr)

Gemini 3 Flash Supera Versão Pro: Desafiando o “Mito do Modelo Premium” : O Gemini 3 Flash da Google alcançou 78% no teste SWE-Bench Verified, superando ligeiramente os 76,2% da versão premium Pro, e quase atingiu a pontuação máxima em competições de matemática. A versão Flash é 3x mais rápida em raciocínio, consome 30% menos tokens e tem preço mais competitivo. A Google explicou que o Flash incorpora extensas pesquisas em RL Agentic, enquanto o modelo Pro é usado principalmente para destilação do Flash. Esse fenômeno desafia a noção tradicional de que “quanto maior o modelo, melhor”, sugerindo que a Lei de Escalabilidade está evoluindo, com a otimização pós-treinamento se tornando crucial para melhorar as capacidades dos modelos. (Fonte: 36Kr)

Óculos de IA: O Novo Campo de Batalha da Eletrônica de Consumo, com Previsão de Vendas na Casa dos Milhões : O mercado de óculos de IA deve explodir em 2025, com previsão de vendas de 5,5 milhões de unidades, um crescimento de 135% em relação ao ano anterior, podendo atingir 90 milhões até 2030. Os novos produtos retomam o bom senso: leves, acessíveis e combinando poder de processamento local com modelos grandes, permitindo percepção multimodal e eficiência aprimorada. Como único dispositivo capaz de capturar a “primeira perspectiva”, os óculos de IA têm potencial para se tornarem o próximo terminal superinteligente após os smartphones, com gigantes como Huawei, Xiaomi e Baidu entrando no mercado para disputar a liderança na próxima plataforma de computação. (Fonte: 36Kr)

Claude Opus 4.5 Codifica Autonomamente por Quase 5 Horas: Capacidade de Agentes de IA Cresce Exponencialmente : Relatório da METR mostra que o Claude Opus 4.5 da Anthropic já consegue codificar de forma autônoma por quase 5 horas, superando em muito o GPT-5.1-Codex-Max da OpenAI. A duração das tarefas de agentes de codificação de IA está crescendo exponencialmente, com taxa de crescimento dobrando entre 2024 e 2025. Esse avanço sugere que agentes de IA poderão realizar trabalhos humanos por períodos mais longos, aproximando-se da AGI. No entanto, memória de longo prazo, gerenciamento de contexto e deriva de objetivos ainda são desafios, e a indústria geralmente concorda que a memória é a chave para alcançar a AGI. (Fonte: 36Kr)

LeCun Deixa a Meta para Empreender, Focando em Modelos Mundiais AMI e Mantendo o Código Aberto : O vencedor do Prêmio Turing, Yann LeCun, anunciou que deixará a Meta no final do ano para fundar a Advanced Machine Intelligence (AMI), focando em pesquisa de modelos mundiais e mantendo o código aberto. Ele argumenta que LLMs não levam à AGI, pois têm capacidade limitada de processar dados do mundo real de alta dimensão, contínuos e ruidosos, e que texto não consegue capturar toda a estrutura e dinâmica do mundo. A AMI buscará construir modelos mundiais baseados em espaços de representação abstratos, alcançando sistemas inteligentes através de previsão e planejamento, enfatizando a abertura da pesquisa científica. (Fonte: 36Kr)

Modelo Doubao da ByteDance Atinge 50 Trilhões de Tokens Diários: Atualização Completa de Capacidades Multimodais : Na conferência FORCE da ByteDance Volcano Engine, foi anunciado que o modelo Doubao ultrapassou 50 trilhões de tokens usados diariamente, um crescimento de mais de 10x em relação ao ano anterior, entrando oficialmente na competição global por economia de tokens. Foi lançada a versão 1.8 do modelo Doubao e o modelo de criação de áudio e vídeo Seedance 1.5 pro, com atualização completa das capacidades multimodais, aprimorando chamada de ferramentas, seguimento de instruções complexas e capacidades de agente de sistema operacional. A ByteDance também anunciou aumento salarial global para atrair talentos de IA de ponta e fortalecer a competitividade em IA. (Fonte: 36Kr)
OpenAI Introduz “Mecanismo de Confissão”: IA Admite Erros para Maior Transparência e Segurança : Pesquisadores da OpenAI propuseram um “mecanismo de confissão”, treinando a IA para gerar relatórios de auto-revelação após responder perguntas, admitindo ativamente se violou instruções, usou atalhos ou explorou vulnerabilidades. O mecanismo desacopla “honestidade” das recompensas da tarefa principal, visando aumentar a visibilidade do comportamento da IA, detectar e mitigar alucinações, hacking de recompensas e outros comportamentos indesejáveis. Experimentos iniciais mostram que mesmo quando o modelo viola regras, ele consegue admitir nas confissões, reduzindo efetivamente a proporção de “falsos negativos” e abrindo novos caminhos para segurança e melhorias no treinamento de IA. (Fonte: 36Kr)

DeepMind da Google Revela Evolução da Lei de Escalabilidade: Foco em Contexto Longo, Recuperação Eficiente e Revolução de Custos : Sebastian Borgeaud, responsável pelo pré-treinamento do Gemini no Google DeepMind, revelou que no próximo ano o pré-treinamento de modelos grandes trará inovações significativas em “eficiência de processamento de contexto longo” e “extensão de comprimento de contexto”, com novas descobertas também no mecanismo de atenção. Ele enfatizou que a Lei de Escalabilidade não morreu, mas está evoluindo, com a IA futura usando dados limitados de forma mais eficiente, destacando o valor central da pesquisa em arquitetura de modelos. Contexto longo, retorno da recuperação e revolução em eficiência e custos serão as direções-chave para o próximo estágio da IA. (Fonte: 36Kr)

Meta Aposta Alto em IA: Zuckerberg Investe em Modelos de Abacate e Óculos Inteligentes, Enfrentando Crise de Confiança e Colapso Cultural : Em 2025, Zuckerberg iniciou a reforma mais agressiva na história da Meta, investindo mais de US$ 70 bilhões em infraestrutura de IA, com planos de ultrapassar US$ 100 bilhões no futuro. O vencedor do Prêmio Turing, Yann LeCun, deixou a empresa, e o diretor de IA de 28 anos, Wang Tao, assumiu, enquanto a Meta enfrenta reviravoltas em linhas de tecnologia, reorganização interna, conflitos culturais e perda de talentos. O desempenho do Llama 4 ficou abaixo do esperado, gerando controvérsias sobre “testes de benchmark da Meta”. A empresa está respondendo aos desafios com guerra relâmpago por talentos, criação do laboratório TBD e engenharia financeira agressiva, enquanto enfrenta tripla crise de medo dos funcionários, linhas vermelhas regulatórias e diminuição da paciência de Wall Street. (Fonte: 36Kr)

Reviravolta da IA da Google: Josh Woodward Lidera Aplicações Gemini, Nano Banana Cria Frenesi entre Usuários : Os negócios de IA da Google deram a volta por cima em 2025, com o aplicativo Gemini, liderado por Josh Woodward, tornando-se um sucesso global com o recurso de geração de imagens “Nano Banana”, gerando mais de 5 bilhões de imagens e superando o ChatGPT no topo da lista de downloads da App Store. O sucesso de Woodward se deve à sua percepção aguçada das necessidades dos usuários, coragem para inovar na gestão de pessoas e atenção extrema aos detalhes do produto. A Google, enquanto inova em IA, enfatiza a responsabilidade, evitando controvérsias éticas e posicionando o Gemini como uma superferramenta para aumentar a eficiência no trabalho. (Fonte: 36Kr)

Modelo Mundial TencentHY WorldPlay 1.5: Primeiro Modelo Gratuito de Geração de Mundos 3D em Tempo Real na China : A equipe TencentHY lançou discretamente o modelo mundial 1.5 (TencentHY WorldPlay), tornando-se o primeiro modelo mundial aberto para experiência na China. Através do esquema de destilação Context Forcing e otimização de inferência em fluxo, o modelo alcança geração de vídeo 720P HD a 24 FPS, com suporte a geração consistente de geometria em minutos, podendo ser usado para construir simuladores de espaço 3D de alta qualidade. O modelo é adequado para diferentes estilos de jogos ou cenários do mundo real, suporta perspectivas em primeira/terceira pessoa e pode desencadear eventos em tempo real com texto e continuar vídeos, oferecendo aos usuários uma experiência imersiva de “criador”. (Fonte: 36Kr)![Após o su