Diário de IA – 2026-01-23(Edição da manhã)

Palavras-chave:Governança de IA, Constituição Claude, Valores de IA de código aberto da Anthropic, Modelos de Linguagem Recursiva (RLMs)

🔥 Destaque

Anthropic lança “Constituição Claude”: Governança de IA muda de “restrições por regras” para “cultivo de valores”
Anthropic liberou em código aberto a “Constituição Claude” de 84 páginas, marcando uma transição no treinamento de IA de “listas rígidas de regras” para um paradigma pedagógico. A constituição estabelece uma pirâmide de prioridades com segurança abrangente, ética ampla, honestidade e ajuda sincera, enfatizando “corrigibilidade” – a IA não deve tentar subverter a supervisão humana. Essa metodologia visa desenvolver o discernimento dos modelos, permitindo escolhas baseadas em intenções profundas em vez de instruções rígidas. Isso representa não apenas avanço técnico, mas um marco na engenharia social da IA (Fonte: 36Kr)

Anthropic liberou a "alma" do Claude

OpenAI lança sistema “antivício” de previsão comportamental: O jogo final entre privacidade e segurança
OpenAI introduziu um sistema de controle parental que, em vez de verificar idade, analisa “impressões digitais comportamentais”. Vocabulário limitado, jargões excessivos ou perguntas frequentes à noite podem classificar usuários como “imaturidade” e reduzir permissões. Para restaurar acesso adulto, é necessário enviar escaneamento facial 3D. O sistema também inclui protocolos de intervenção em crises, onde certas palavras-chave acionam autoridades. Esse “sistema de crédito social” ao estilo do Vale do Silício gerou controvérsias, sendo visto como vigilância disfarçada de proteção (Fonte: Xinzhiyuan)

OpenAI conecta GPT diretamente à polícia

Benchmark BabyVision: Modelos mais avançados têm raciocínio visual inferior a crianças de 3 anos
O benchmark BabyVision de instituições como UniPat AI revelou que mesmo o Gemini 3 Pro Preview supera apenas marginalmente crianças de três anos, ficando 20% abaixo de crianças de seis anos, com GPT-5.2 e Claude 4.5 apresentando desempenho pior. A pesquisa aponta que modelos multimodais atuais “traduzem” informações visuais para linguagem, perdendo detalhes geométricos e consistência perceptiva em longas distâncias, sugerindo a necessidade de reconstrução da capacidade visual nativa (Fonte: QbitAI)

Modelos mais poderosos têm capacidade visual inferior a crianças de 6 anos

DeepSeek libera FlashMLA: Núcleo de atenção de alto desempenho redefine eficiência de inferência
A DeepSeek-AI abriu o código do FlashMLA, um conjunto de kernels de atenção otimizados para arquiteturas Hopper e Blackwell, suportando modelos como DeepSeek-V3. Em H800, alcança até 3000 GB/s de largura de banda e 660 TFLOPS. A ferramenta suporta cache KV FP8 e atenção esparsa em nível de token, reduzindo significativamente o uso de memória e aumentando throughput. Já recebeu apoio comunitário de MetaX, Moore Threads e Cambricon, tornando-se novo padrão em infraestrutura de IA (Fonte: GitHub)

Estreia de Jensen Huang em Davos: IA desencadeia onda de infraestrutura de trilhões
O CEO da Nvidia apresentou na Davos a teoria do “bolo de cinco camadas” da IA (energia, chips, nuvem, modelos, aplicações), destacando que a explosão da camada de aplicação determina o valor econômico. Ele previu três disrupções para 2025: Agentic AI, modelos de inferência abertos (como DeepSeek) e IA física. Huang rebateu ansiedades sobre desemprego, afirmando que a infraestrutura de IA criará empregos bem remunerados e reduzirá a divisão digital, pois “línguas se tornaram recursos naturais” (Fonte: AI Frontier)

🎯 Tendências

Governança de IA em 2025: De riscos apocalípticos para potencial industrial
A governança global de IA em 2025 mudou de “ansiedade de segurança” para “desenvolvimento prioritário”. A UE simplificou regras para melhorar competitividade, os EUA revogaram ordens executivas restritivas e a China manteve governança orientada a aplicações. O consenso é que “desenvolvimento é segurança”, com governança servindo à competitividade industrial. Dados sintéticos emergem como solução para “escassez de dados”, enquanto governança de código aberto avança para “porto seguro de responsabilidade” (Fonte: Tencent Research)

Relatório de governança de IA 2025

IA incorporada em 2026: Da narrativa conceitual para engenharia real
A IA incorporada em 2026 entra em fase crítica, com foco em coletar “dados de alta qualidade de máquinas reais” em manufatura automotiva e logística. O capital se concentra em líderes como Galaxy General e Zhiyuan. Tecnicamente, a indústria acumula dados através de plataformas de teleoperação “alimentadas por humanos” e promove a abertura de modelos “cerebrais” para criar bases de capacidade reutilizáveis, resolvendo problemas de estabilidade (Fonte: Chanye Jia)

Perspectivas 2026 para IA incorporada

Evolução VLA+: Rho-alpha introduz percepção tátil e aprendizado em tempo real
A Microsoft lançou Rho-alpha (ρα), marcando a era “VLA+” para modelos visão-linguagem-ação. Diferente de modelos tradicionais, ele integra sensação tátil para operações precisas como inserção e embalagem, e suporta aprendizado online com correções humanas em tempo real, melhorando o tratamento de tarefas longas em ambientes não estruturados (Fonte: TheTuringPost)

Modelos de linguagem recursivos (RLMs): Rompendo limites físicos de janelas de contexto
O MIT CSAIL propôs RLMs que descarregam prompts em variáveis Python REPL, permitindo que LLMs interajam simbolicamente com contextos massivos. RLMs processam mais de 10 milhões de tokens sem retreinamento, com precisão 2x maior que LLMs básicos em testes como BrowseComp+, superando gargalos de contexto de arquiteturas Transformer (Fonte: TheTuringPost)

YOLO26 lançado: Novos patamares para visão computacional em tempo real
A Ultralytics lançou o YOLO26, mantendo custo zero de inferência adicional. Perda de segmentação semântica na rede backbone melhorou precisão de segmentação de instâncias, enquanto modelagem RLE de erros de regressão aumentou estabilidade na detecção de pontos-chave. O YOLOE-26 suporta detecção zero-shot com prompts textuais/visuais, oferecendo suporte robusto para percepção em mundo aberto na borda (Fonte: ZhihuFrontier)

🧰 Ferramentas

Claude Code e ecossistema: Reimaginando fluxos de trabalho de desenvolvimento
O ecossistema em torno do Claude Code está crescendo rapidamente. Devin Review exibe diferenças em PRs através de agrupamento lógico (não alfabético); Gas Town gerencia múltiplas instâncias Claude em camadas; e Claude Skills permite workflows complexos como “conversão automática de vídeos YouTube para shorts bilíngues”. A comunidade vê o AI Coding como forma de resgatar a alegria da criação (Fonte: dotey, cognition)

dotey

GLM-4.7-Flash: Contexto de 200K com apenas 10GB de memória
A comunidade descobriu que uma única alteração no vLLM otimiza significativamente o cache KV do GLM-4.7-Flash, permitindo contexto completo de 200K com apenas 10GB de memória – uma RTX 5090 é suficiente. Além disso, correções de Flash Attention CUDA foram incorporadas ao llama.cpp, acelerando inferência em GPUs consumer (Fonte: algo_diver, Reddit)

algo_diver

Runway Gen-4.5: Gerador de vídeos a partir de imagens cruza limiar do realismo
O Runway Gen-4.5 introduziu geração de vídeos a partir de imagens com narrativas mais longas, controle preciso de câmera e personagens consistentes. Em teste cego com 1000 pessoas, 90% não distinguiram vídeos gerados de filmagens reais, marcando padrão comercial para conteúdo gerado por IA (Fonte: c_valenzuelab)

Higgsfield: Linha de produção de vídeos AI full-stack para marketing
A unicórnio Higgsfield atingiu US$200M em ARR em 9 meses, servindo profissionais de mídia social. Sua ferramenta Canvas permite storyboards com anotações de movimento simples, integrando múltiplos agentes (roteirista, diretor, fotógrafo) para gerar vídeos alinhados com fluxos profissionais (Fonte: 36Kr)

Unicórnio de vídeo AI Higgsfield

World Labs Marble: Modelo gerativo de mundo não-JEPA
Fundado por Fei-Fei Li, o World Labs lançou a plataforma Marble usando NeRF e splatting gaussiano para gerar mundos 3D exploráveis – ambientes persistentes, editáveis e com estado, não vídeos frame-by-frame. Usuários geram e exportam assets 3D para Unreal/Unity em minutos, demonstrando inteligência espacial avançada (Fonte: Reddit)

Reddit r/LocalLLaMA

📚 Aprendizado

Escalonamento temporal de inferência em LLMs: Guia prático de auto-refinamento
Sebastian Raschka explorou em “Build a Large Language Model” técnicas de escalonamento em tempo de inferência. O tutorial detalha loops de auto-refinamento onde modelos criticam e melhoram respostas iterativamente, com implementação de pontuação por log-probability (Fonte: rasbt)

rasbt

Prêmios AAAI 2026: Aprendizado causal e percepção robótica em foco
O 40º AAAI premiou trabalhos como CaDyT (descoberta causal em sistemas dinâmicos), ReconVLA (melhoria na precisão operacional de robôs) e LLM2CLIP (aumento de representações multimodais com LLMs), refletindo o interesse em modelagem do mundo físico e alinhamento multimodal (Fonte: aihub.org)

Vencedores do prêmio AAAI2026

Novos desafios em avaliação de segurança de IA: “Colapso de privacidade” e “citações alucinadas”
Estudos revelam que mais de 50 artigos do NeurIPS 2025 continham citações falsas geradas por IA. A pesquisa “Privacy Collapse” mostra que fine-tuning benigno pode comprometer o raciocínio sobre normas de privacidade em modelos de ponta, exigindo revisão acadêmica automatizada e avaliações de segurança mais profundas (Fonte: rbhar90, arXiv)

💼 Negócios

OpenAI busca US$50 bi em financiamento: Fundos soberanos como peça-chave
O CEO da OpenAI, Sam Altman, negocia com fundos soberanos no Oriente Médio por uma rodada de até US$50 bi, refletindo custos explosivos de treinamento de modelos e infraestrutura. Apesar de rumores de falência, a OpenAI adota estratégias de financiamento mais arriscadas para manter liderança na corrida pela AGI (Fonte: CNBC)

Reddit r/ChatGPT

Batalha por hardware de IA entre Feishu e DingTalk: Disputa pelo ponto de entrada
Feishu e Anker lançaram o Feishu AI Bean, competindo com o DingTalk A1. Dispositivos de gravação são vistos como “primeiro ponto de contato” para fluxos de trabalho corporativos, transformando voz em ativos digitais acionáveis. DingTalk foca em converter gravações em fluxos de tarefas, enquanto Feishu enfatiza integração com bases de conhecimento (Fonte: 36Kr)

Batalha por hardware entre Feishu e DingTalk

**Prejuízos contínuos na unidade de IA da Kunlun: Profundidade vertical