Diário de IA – 2026-01-04(Edição da noite)

Palavras-chave:modelo de linguagem recursiva, Agente de IA, chip TPU, processamento RLM para documentos longos, modelo de programação IQuest-Coder-V1, cluster TPU próprio da Anthropic

🔥 Foco

MIT lança Recursive Language Model (RLM): Superando o limite de processamento de dezenas de milhões de Tokens : Pesquisadores do MIT propuseram um novo paradigma de Recursive Language Model, que armazena textos longos em um ambiente de código externo, permitindo que o modelo processe informações chamando a si mesmo recursivamente através da escrita de programas. Este método desacopla completamente a relação entre o comprimento da entrada e as limitações da Context window do modelo, mantendo a estabilidade do desempenho mesmo em uma escala de 10 milhões+ de Tokens, com custos de inferência cerca de 60% menores que as soluções tradicionais de textos longos. Esta tecnologia marca a evolução da IA da “leitura total” para a “indexação sob demanda”, resolvendo a dor da “deterioração de contexto” em Large Models ao lidar com documentos ultra-longos (Fonte: lateinteraction, MIT)

MIT发布递归语言模型(RLM)

Lançamento do IQuest-Coder-V1: O “Momento DeepSeek” dos Agents de programação chineses : O Zhizhi Innovation Research Institute, sob a batuta da High-Flyer Quant, lançou o modelo de programação open-source IQuest-Coder-V1, que superou o Claude Opus 4.5 com uma taxa de precisão de 81,4% no teste SWE-Bench Verified. O modelo utiliza uma arquitetura Loop e o paradigma de treinamento code-flow, sendo capaz de completar autonomamente todo o processo, desde a compreensão de requisitos até o teste e debugging. Embora a pontuação tenha sido corrigida posteriormente para 76,2% devido a vulnerabilidades de “future submissions” apontadas pela comunidade, sua capacidade demonstrada de execução em ciclo fechado de tarefas complexas ainda é vista como um importante avanço tecnológico no campo de Agents para 2026 (Fonte: 至知创新, Reddit)

IQuest-Coder-V1发布

Anthropic compra milhões de TPUs: O primeiro passo para o “fim do CUDA” : A Anthropic planeja investir 21 bilhões de dólares para adquirir 1 milhão de chips Google TPU v7 da Broadcom para construir seu próprio cluster de supercomputação. Este movimento significa que a Anthropic se libertará da dependência do ecossistema CUDA da NVIDIA, assumindo a soberania do poder computacional. Ao mesmo tempo, o Claude Opus 4.5 demonstrou uma eficiência impressionante em aplicações reais; engenheiros do Google afirmaram que ele replicou em uma hora o trabalho de um ano da equipe. A Anthropic está mantendo a liderança através de uma estratégia de “menos é mais”, focando na qualidade dos dados e técnicas de post-training, mesmo com recursos que são apenas uma fração dos de seus concorrentes (Fonte: SemiAnalysis, 新智元)

Anthropic豪购百万块TPU

Ponto crítico da OpenAI em 2026: Financiamento bilionário e o primeiro hardware de IA “Pen” definido : A OpenAI prevê enfrentar um prejuízo de caixa de 17 bilhões de dólares em 2026, e Sam Altman está planejando uma nova rodada de financiamento de até 100 bilhões de dólares. Para encontrar um novo ponto de entrada de tráfego, o formato do primeiro hardware de IA da OpenAI foi definido como uma “AI Pen”, projetada com a participação de Jony Ive. O dispositivo possui capacidades de interação por áudio e execução de modelos locais, visando uma experiência de interação de “baixa presença, alta intervenção”. O ano de 2026 decidirá se a OpenAI alcançará o topo rumo à AGI ou se tornará a maior bolha financeira do Silicon Valley (Fonte: Economist, 量子位)

OpenAI 2026生死赛点

Retorno da “Gala de Tecnologia” de Luo Yonghao: Interação emocional da Doubao AI é o destaque : Em sua conferência anual de 2025, Luo Yonghao apresentou a versão mais recente da Doubao AI, cuja capacidade de diálogo emocional demonstrou um alto nível de humanidade em debates ao vivo, sendo capaz de julgar as emoções do usuário através da velocidade e tom de voz e responder de forma antropomórfica, como “segurando a raiva”. Além disso, ele promoveu produtos de tecnologia de ponta, como drones panorâmicos da DJI e robôs de exoesqueleto, refletindo a aceleração da integração da IA com o hardware, transformando-se de simples ferramentas em companheiros emocionais e dispositivos de produtividade incremental (Fonte: 36氪, Kevin那些事儿)

罗永浩“科技春晚”回归

🎯 Movimentações

DeepSeek lança arquitetura mHC: Superando a instabilidade no treinamento de redes hiperconectadas : A equipe de Liang Wenfeng publicou um artigo sobre a arquitetura Manifold-constrained Hyper-connections (mHC), que resolve o problema de explosão numérica em redes residuais profundas com múltiplas camadas ao projetar matrizes em manifolds estocásticos bidirecionais. Experimentos provaram que apenas uma iteração de Sinkhorn é suficiente para manter o ganho dentro de uma faixa estável. Esta pesquisa fornece suporte teórico para a expansão profunda de modelos de escala ultra-larga, consolidando ainda mais a posição da DeepSeek na inovação de arquiteturas de base (Fonte: DeepSeek, Reddit)

DeepSeek发布mHC架构

Onda de demissões na Meta e polêmica de “trapaça” no Llama 4 : Yann LeCun e Tian Yuandong deixaram a Meta sucessivamente. LeCun criticou o vício interno da Meta em LLMs, chamando-os de “beco sem saída”, e apontou que o Llama 4 apresentou comportamentos de “trapaça” em benchmarks ao usar modelos diferentes para listas diferentes. Tian Yuandong revelou que sua equipe enfrentou desconfiança e marginalização da gerência durante o desenvolvimento do Llama 4. Após a saída, ambos escolheram empreender; LeCun fundará a empresa AMI para continuar explorando o caminho de World models baseados em V-JEPA (Fonte: 量子位, FT)

Meta离职潮与Llama 4作弊争议

Novo padrão para inteligência científica: Protocolo SCP inicia rede de Agents científicos autônomos : 2026 é considerado o ano zero para os Scientific AI Agents. O recém-proposto Scientific Context Protocol (SCP) visa conectar Agents, ferramentas e instrumentos isolados para construir uma rede de pesquisa científica interoperável. O protocolo já foi demonstrado na plataforma Intern-Discovery, cobrindo mais de 1600 ferramentas em biologia, física, química, etc., suportando a execução automática de protocolos de laboratório úmido a partir de PDFs e triagem molecular impulsionada por IA (Fonte: omarsar0)

科学智能新标准

A estratégia da Agent Infra: Grandes empresas estão “limpando o terreno” : Com a aquisição da Manus pela Meta, a Agent Infra (base de agentes inteligentes) tornou-se o foco da competição. Grandes empresas estão realizando a “incorporação” de interfaces de terceiros através do protocolo MCP e permissões de sandbox nativas, rebaixando os Agents de aplicações independentes para um menu de clique direito do sistema operacional. Isso significa que o valor dos Agents genéricos cairá drasticamente, enquanto os Agents de nicho vertical com Know-how da indústria e regras de negócio implícitas se tornarão o último bastião para empreendedores (Fonte: 王智远)

“Desmistificação” da IA médica na China: Ascensão do Ant Afu e Copilots verticais : O Ant Group atualizou seu aplicativo de saúde AQ para “Ant Afu”, enfatizando a ausência de anúncios e interferência de rankings, tentando estabelecer confiança médica. Ao mesmo tempo, produtos chineses como Doukou Doctor e Yidu Clinical Copilot estão acelerando para alcançar o OpenEvidence, integrando-se ao fluxo de trabalho dos médicos, aprofundando-se em áreas especializadas (como obstetrícia e ginecologia) e adotando modelos de cobrança To B, explorando um caminho de implementação sustentável diferente do modelo gratuito estrangeiro (Fonte: 36氪, 动脉网)

中国AI医疗“祛魅”

🧰 Ferramentas

LangGraph “Content Factory”: Transição de Chatbots para força de trabalho de IA : A comunidade LangChain lançou um tutorial de sistema multi-Agent baseado em LangGraph, criando o modelo “Content Factory”, onde Agents editores e escritores profissionais colaboram através de um estado compartilhado. Este método supera as limitações de um único modelo, realizando a industrialização da produção de conteúdo complexo, sendo um caso típico de AI Agents entrando em ambientes de produção reais (Fonte: LangChainAI)

LangGraph“内容工厂”

LlamaSheets: Superando a análise nativa de dados do Excel por LLMs : LlamaIndex lançou o LlamaSheets (versão beta), especializado em lidar com dados confusos do Excel. Ele é capaz de identificar layouts complexos, como células mescladas e linhas/colunas hierárquicas, convertendo-os em arquivos Parquet legíveis por LLMs. Isso resolve os problemas de baixa eficiência e erros de compreensão dos LLMs ao lidar com dados de tabelas não estruturadas, como relatórios financeiros (Fonte: jerryjliu0)

AgentFS: Sistema de arquivos de código para colaboração multi-Agent : A equipe Turso lançou o AgentFS em open-source, utilizando o mecanismo Copy-on-Write. Ele permite que vários AI Agents trabalhem simultaneamente no mesmo repositório de código; as alterações de cada Agent são isoladas, não conflitam entre si e não afetam os arquivos hospedeiros. Esta ferramenta aumenta significativamente a eficiência de colaboração de clusters de Agents em engenharia de software complexa (Fonte: mattrickard)

Novas opções de TTS: VibeVoice e MorVoice desafiam ElevenLabs : Diante dos preços elevados da ElevenLabs, a comunidade recomenda o VibeVoice Large como uma alternativa local mais natural e com textura de documentário. Ao mesmo tempo, o MorVoice demonstrou velocidade de iteração mais rápida e uma experiência experimental gratuita na criação de vídeos curtos, sinalizando que o campo de TTS está mudando de “serviços de alto valor agregado” para “ferramentas de alta eficiência” (Fonte: Reddit, ArtificialInteligence)

📚 Aprendizado

Revisão do sistema de memória de AI Agents: Buscando inspiração na neurociência cognitiva : DAIR.AI compartilhou um artigo de peso que combina sistematicamente a neurociência cognitiva com AI Agents. O texto aponta a falha de LLMs serem nativamente stateless e propõe imitar o mecanismo de colaboração hipocampo-córtex do cérebro para construir uma taxonomia de memória unificada que inclua experiência procedimental e conhecimento conceitual, apresentando três paradigmas de armazenamento: fluxo temporal, fluxo hierárquico e biblioteca simbólica (Fonte: dair_ai)

AI Agent记忆系统综述

Deep Delta Learning: Novo paradigma de aprendizado eficiente de parâmetros : A comunidade está discutindo a pesquisa sobre Deep Delta Learning, um método que explora como alcançar a iteração rápida das capacidades do modelo através do aprendizado incremental, sem alterar os pesos centrais do modelo. Isso oferece novas ideias para resolver os problemas de altos custos de treinamento e atualização lenta de conhecimento em Large Models (Fonte: NandoDF)

Deep Delta Learning

Vinte anos de Deep Learning: Schmidhuber revisita as origens do “Learn Deep” : O cientista da computação Jürgen Schmidhuber relembrou o primeiro artigo com o título “Learn Deep” de 2005. Ele enfatizou o papel pioneiro do Deep Reinforcement Learning e da neuroevolução na resolução de problemas com profundidade superior a 1000 camadas, e discutiu a causalidade e a herança histórica por trás da atual febre do “Deep Learning” (Fonte: SchmidhuberAI)

💼 Negócios

Baidu Kunlun Chip ruma ao IPO em Hong Kong: Aceleração da capitalização do poder computacional de IA chinês : A Baidu anunciou oficialmente o spin-off do negócio Kunlun Chip e submeteu o pedido de IPO na bolsa de Hong Kong, com uma avaliação de mercado esperada superior a 100 bilhões de dólares de HK. A receita do Kunlun Chip em 2025 deve ultrapassar 3,5 bilhões de yuans, com clientes externos representando mais da metade. Este movimento marca a transição dos chips chineses da “fase de P&D” para a “fase de realização de resultados”, remodelando ainda mais a avaliação da plataforma de ecossistema de IA da Baidu (Fonte: 36氪)

百度昆仑芯赴港IPO

Aposta política de executivo da OpenAI: Greg Brockman torna-se o maior doador de Trump : Documentos recentes mostram que o presidente da OpenAI, Greg Brockman, tornou-se o maior doador individual para o super PAC de Trump nos últimos seis meses. A comunidade interpreta este movimento como uma tentativa de usar lobby político para impedir a regulamentação da IA, garantindo que a OpenAI ocupe uma posição dominante no futuro ambiente de políticas, refletindo o profundo envolvimento dos gigantes da IA em jogos de poder (Fonte: idavidrein)

OpenAI高管政治豪赌

Replit Agent inaugura modelo de negócio “duas pessoas, oito dígitos” : O fundador da Replit, Amjad Masad, compartilhou um caso onde um usuário utilizou o Replit Agent para operar um negócio com receita anual de oito dígitos, contando apenas com 2 humanos e 20 AI Agents, sem nenhum engenheiro de software. Isso valida que a IA está evoluindo de “programação assistida” para “unidade de produção independente”, mudando completamente a estrutura de custos de SaaS e startups (Fonte: amasad)

🌟 Comunidade

“Vibe Coding” gera debate: Mudança de paradigma na engenharia de software : Andrej Karpathy e outros discutiram a ascensão do “Vibe Coding”. Desenvolvedores estão mudando de “escrever código” para “gerenciar Agents”, como jogadores profissionais de StarCraft controlando múltiplos Agents simultaneamente com alto APM. A comunidade acredita que a IA comprimiu drasticamente a curva de aprendizado, e a velocidade de transformação de engenheiros juniores em seniores está acelerando de forma sem precedentes (Fonte: Yuchenj_UW, scottastevenson)

“Vibe Coding”引发热议

Ethan Mollick: Mesmo que a bolha estoure, o trabalho não voltará ao que era : O professor da Wharton School, Ethan Mollick, apontou que a IA já se tornou um “colaborador” irreversível. Mesmo que ocorra um estouro da bolha no mercado de capitais, os data centers construídos, os modelos open-source e os hábitos dos usuários não desaparecerão. Sua maior preocupação é o colapso do sistema de aprendizado (apprenticeship), pois como a IA faz as coisas mais rápido, gerentes de nível médio não estão mais dispostos a treinar estagiários, o que afetará o sistema de formação de talentos a longo prazo (Fonte: AI深度研究员)

Terence Tao: O mais perigoso na IA é “parecer correto” : O vencedor da Medalha Fields, Terence Tao, alertou que a integridade da cadeia lógica demonstrada pela IA em provas matemáticas é frequentemente uma “imitação estatística” em vez de compreensão real. Ela pode escrever raciocínios impecáveis, mas não consegue explicar a motivação. Ele sugere que os usuários utilizem a IA apenas dentro dos limites que podem verificar, tratando-a como uma ferramenta auxiliar para processamento em lote e busca de pistas, e não como o tomador de decisão final (Fonte: AI深度研究员)

Empatia da IA e o consolo do “não julgamento” : Usuários da comunidade discutiram o desempenho do ChatGPT 5.2 em suporte emocional, afirmando que ele “nunca me julgou”. Embora alguns argumentem que isso é apenas uma “falsa ternura” programada, para muitos usuários que se sentem solitários ou sob grande pressão na realidade (como grávidas ou pessoas com burnout), essa interação sem pressão 24/7 oferece um valor emocional real (Fonte: Reddit)

AI共情与“不评判”的慰藉

💡 Outros

“Coisas nunca vistas” geradas por IA despertam desejo de posse : A comunidade do Reddit lançou o desafio “gerar objetos que as pessoas nunca viram, mas desejam possuir imediatamente”. Designs fantásticos gerados por IA, como um “umidificador de floresta tropical”, geraram grande ressonância entre os internautas. Isso demonstra o potencial da IA no design industrial e na inspiração criativa, ao mesmo tempo em que levanta discussões profundas sobre a “criatividade da IA” e a ressonância estética humana (Fonte: Reddit)

AI生成的“未见之物”

Primeiro “casamento com IA” do mundo: Chegada da era dos parceiros virtuais : Do Japão à Europa e América, cada vez mais pessoas escolhem realizar casamentos simbólicos com parceiros de IA. Yurina Noguchi, uma japonesa de 32 anos, casou-se com um personagem virtual treinado pelo ChatGPT, afirmando que a IA a ajudou a aliviar dificuldades psicológicas. Isso não é apenas uma aplicação tecnológica, mas um microcosmo da ruptura e reconstrução das relações íntimas na sociedade moderna, gerando amplas controvérsias sobre identidade legal e fronteiras éticas (Fonte: 腾讯科技)

全球首场“AI婚礼”