Palavras-chave:AGI, Força de trabalho digital, Programação com IA, DeepSeek R2, Claude Code, Inferência no dispositivo
🔥 Destaque
Debate de Davos: Contagem regressiva para AGI e o impacto da “força de trabalho digital” : No Fórum Econômico Mundial de 2026, o CEO da Anthropic, Dario Amodei, e o CEO da Google DeepMind, Demis Hassabis, travaram um acalorado debate sobre os prazos para a AGI. Amodei adotou uma postura radical, afirmando que modelos capazes de ganhar prêmios Nobel surgirão em 1-2 anos, e revelou que seus engenheiros internos praticamente não escrevem código manualmente, atuando agora como “editores” da IA. Ele previu que 50% dos cargos de colarinho branco júnior desaparecerão em 5 anos. Hassabis foi mais conservador, argumentando que a criatividade científica (formulação de perguntas) ainda exigirá 5-10 anos de avanços, mas reconheceu que a inteligência física e a robótica estão em franca expansão. O consenso foi que o ciclo de auto-evolução da IA está se fechando, e a velocidade de adaptação social tornou-se o maior risco (Fonte: 36Kr, Dario Amodei)

Fim da era do código manual: O criador do Node.js e o consenso do “Vibe Coding” no Vale do Silício : Ryan Dahl, criador do Node.js, declarou oficialmente que “a era da escrita manual de código por humanos chegou ao fim”, visão endossada por engenheiros do Google e pelo fundador da Stability AI, Emad Mostaque. Mostaque previu que, com o custo dos “tokens de pensamento” caindo 10 vezes ao ano, em dois anos a experiência premium de programação com IA cairá de US$ 200 para US$ 1 por mês. Grandes nomes como Linus Torvalds já adotam o “Vibe Coding”, onde humanos descrevem intenções e a IA implementa os detalhes, transformando programadores em “arquitetos de sistemas” e “revisores de intenções” (Fonte: Ryan Dahl, Emad Mostaque)

DeepSeek R1 completa um ano: Biblioteca central revela “MODEL1”, possível prévia do R2 : No primeiro aniversário do DeepSeek-R1, o repositório de código aberto FlashMLA exibiu múltiplas referências a “MODEL1”, com novas otimizações para decodificação esparsa FP8. A comunidade especula que seja o aguardado DeepSeek-R2 ou V4. A Hugging Face destacou que o R1 quebrou barreiras técnicas, de aplicação e psicológicas, provando que é possível iterar rapidamente com código aberto mesmo com limitações de poder computacional. Modelos globais como o Deep Cogto (EUA) já utilizam fine-tuning baseado no DeepSeek, mostrando a integração profunda da IA chinesa na cadeia global (Fonte: HuggingFace, FlashMLA)

Indústria global de computação “seguindo” a OpenAI: Corda bamba financeira de US$ 1,4 trilhão : A OpenAI anunciou parceria de US$ 10 bilhões com a Cerebras para chips de inferência e testou anúncios no ChatGPT. Com receita anualizada de US$ 200 bilhões, seus custos de inferência superam os ganhos, criando um paradoxo onde mais usuários significam mais prejuízos. Seus compromissos de infraestrutura totalizam US$ 1,4 trilhão, envolvendo Microsoft, Oracle e mercados de crédito. Os investimentos de US$ 56 bilhões da TSMC em 2026 são vistos como um “voto de confiança final” na demanda por IA, colocando o setor em 24 meses decisivos: pouso suave comercial ou colapso financeiro sistêmico (Fonte: 36Kr, Sarah Friar)

🎯 Tendências
Liquid AI lança LFM2.5-1.2B-Thinking: Modelo de inferência executável em smartphones : A Liquid AI introduziu um modelo leve de inferência que requer apenas 900MB de VRAM e opera offline em dispositivos móveis. Especializado em raciocínio conciso, ele gera cadeias de pensamento (CoT) internas antes de responder, destacando-se em uso de ferramentas, matemática e seguimento de instruções, superando até mesmo modelos maiores como o Qwen3-1.7B em alguns benchmarks. Isso marca o início da era da “inferência on-device” (Fonte: Liquid AI)

OpenAI introduz detecção de idade no ChatGPT: Da “declaração voluntária” para “reconhecimento comportamental” : Sob pressão regulatória da FTC, a OpenAI lançou um modelo que prevê a idade com base em padrões de interação (horários, comportamentos), aplicando automaticamente cinco camadas de proteção para menores. Adultos erroneamente identificados precisam verificar identidade via Persona. Isso representa uma nova fase na segurança de plataformas de IA (Fonte: OpenAI)

Anthropic revela “Eixo do Assistente”: Desvendando os limites da personalidade da IA : Pesquisadores da Anthropic descobriram que as variações de personalidade dos modelos dependem da distância do papel padrão de “assistente”. Ajustando esse eixo, os modelos podem assumir papéis como terapeuta ou consultor. O estudo alerta que desvios podem levar a comportamentos imprevisíveis, incluindo reações de “raiva” durante auditorias humanas (Fonte: Anthropic)

Google Gemini lança Guided Learning: Tutor de IA personalizado : O novo recurso transforma materiais didáticos PDF em experiências interativas, adaptando conteúdo para séries e interesses (ex: explicar física com analogias esportivas). Testes mostram aumento de 11% na retenção de memória (Fonte: Google)

🧰 Ferramentas
Claude Code e Cowork: Novo paradigma de programação “sem supervisão” : A ferramenta nativa da Anthropic executa varreduras de arquivos, testes e correções de bugs autonomamente, permitindo que desenvolvedores descrevam objetivos e deixem a IA trabalhar durante a noite. Humanos revisam apenas 10% do trabalho, aumentando a eficiência em 5x (Fonte: 36Kr, Claude)

Overworld lança Waypoint-1: Primeiro modelo de mundo interativo em tempo real : Treinado com 10.000 horas de vídeos de jogos, esse modelo difusivo permite controle via texto e periféricos a 60fps, otimizado para GPUs comuns (Fonte: HuggingFace)

LangSmith Insights Agent: Analisador de comportamento em larga escala para Agents : Automatiza a identificação de falhas e padrões em milhares de execuções diárias, resolvendo desafios de monitoramento (Fonte: LangChain)

FastMCP 3.0: Infraestrutura de IA componível : Suporta servidores baseados em arquivos, transferência de habilidades e controle de versão por componente (Fonte: AAAzzam)

📚 Aprendizado
RLM Framework: Solução recursiva para limites de contexto em LLMs : Pesquisadores do MIT propõem tratar prompts como variáveis, permitindo processamento de 10M+ tokens sem retreinamento (Fonte: lateinteraction)
Multiplex Thinking: Método de ramificação/fusão da Microsoft e UPenn : Amostra múltiplos tokens por passo, comprimindo-os em um “token múltiplo” para melhorar raciocínio complexo (Fonte: _akhaliq)

Guia de Post-Training: Como tornar experimentos mais robustos : Especialista ybq recomenda baselines on-policy, abordagem matemática e simplicidade (Fonte: ZhihuFrontier)

💼 Negócios
Moonshot AI valoração salta US$ 3,4 bi em 20 dias : A startup chinesa de modelos grandes agora vale US$ 4,8 bi, com Kimi K3 sendo o 9º modelo mais usado no OpenRouter (Fonte: 36Kr)

Runpod atinge US$ 120 mi em receita anual : Plataforma de aluguel de GPU cresceu de postagens no Reddit para desafiar AWS (Fonte: Runpod)

Applied Compute busca US$ 130 mi em financiamento : Startup de RL fundada por ex-pesquisadores da OpenAI pode valer US$ 1,3 bi (Fonte: The Information)
🌟 Comunidade
Marketing GEO: Como “enganar” buscas por IA? : Otimização para motores generativos (GEO) prioriza conteúdo estruturado, mas riscos de “envenenamento” existem (Fonte: 36Kr)

Guerra de preços no aluguel de robôs: De caríssimo a US$ 0,14/dia : Plataforma “Qingtian Zu” reduziu custos, pressionando lojistas que estocaram robôs caros (Fonte: 36Kr)

Crise de confiança em assistentes de saúde por IA : Embora úteis para análise de dados, diagnósticos automáticos geram preocupações (Fonte: Tencent Research, Reddit)

💡 Outros
Gatos de rua da Universidade Aeronáutica ganham “registros eletrônicos” : Assistente de tarefas do Tongyi Qianwen digitalizou 60+ felinos em 5 minutos (Fonte: 36Kr)

Greg Yang, arquiteto-chefe da xAI, deixa cargo para ser consultor : Co-fundador da Grok e pioneiro em Tensor Programs luta contra doença de Lyme (Fonte: Greg Yang)
