Diário de IA - 2025-09-20(Edição da manhã)

Palavras-chave：IA projetando vírus, Centro de dados IA Fairwater da Microsoft, Huawei Atlas 850, Perceptron AI Isaac 0.1, Geração de código Anthropic, Integração Google Gemini, Modelo de mundo IA, Plataforma de entrega nano IA NanoForge, Modelo de série temporal de energia EnergyTS 2.0, Wan2.2-Animate animação de vídeo, Deep Learning com Python terceira edição, ML Summit 2025

🔥 Destaques

Vírus projetados por AI alcançam replicação funcional : Equipes da Universidade de Stanford e do Arc Institute usaram AI para projetar genomas virais e os fizeram replicar e infectar bactérias com sucesso. Este trabalho é considerado um passo importante na concepção de formas de vida por AI, com potencial para desenvolver novas terapias e acelerar a pesquisa em engenharia celular. No entanto, especialistas pedem “extrema cautela” na pesquisa de aprimoramento viral para evitar riscos potenciais, especialmente envolvendo patógenos de alto risco. (Fonte: MIT Technology Review)

Microsoft constrói novo Fairwater AI Data Center : O CEO da Microsoft, Satya Nadella, revelou o novo Fairwater AI Data Center em Wisconsin, que integrará mais de 100.000 GPUs Nvidia GB200, com desempenho esperado de 10 vezes o supercomputador mais rápido do mundo atualmente. O data center ocupa 315 acres, composto por 3 edifícios totalizando 1,2 milhão de pés quadrados, utilizando o segundo maior sistema de refrigeração a água do mundo e conectado por uma rede de longa distância (AI WAN) desenvolvida internamente para formar um “supercomputador distribuído”, visando treinamento colaborativo e orquestração de recursos entre regiões. (Fonte: op7418)

Huawei lança servidor AI SuperNode Atlas 850 : Durante a Huawei Connect 2025, a Huawei lançou sua inovadora arquitetura SuperNode e vários produtos, incluindo o Atlas 950 SuperPoD totalmente refrigerado a líquido e o servidor AI SuperNode Atlas 850 refrigerado a ar de nível empresarial. O Atlas 850 é equipado com 8 NPUs Ascend, suportando um cluster SuperNode de até 128 unidades com 1024 placas, sendo o primeiro cluster de computação da indústria capaz de implementar uma arquitetura SuperNode em salas refrigeradas a ar, visando atender às necessidades de pós-treinamento de modelos empresariais e inferência em múltiplos cenários. (Fonte: 量子位)

Perceptron AI lança Isaac 0.1, um modelo de linguagem perceptivo : A Perceptron AI lançou o Isaac 0.1, um modelo de linguagem perceptivo de código aberto com 2B parâmetros, projetado para entender e interagir com o mundo físico. O modelo superou Gemini, GPT-4o e Claude Opus 4.1 em benchmarks de percepção chave, enquanto reduziu significativamente o número de parâmetros, diminuindo drasticamente os custos de serviço e o consumo de energia, tornando-o adequado para cenários de implantação de borda em manufatura, logística, segurança e robótica. (Fonte: AkshatS07, AkshatS07, AkshatS07)

Capacidade de geração de código do modelo Anthropic se destaca : Dario Amodei, cofundador da Anthropic, revelou que 70-90% do código da empresa é gerado por Claude, demonstrando a alta eficiência da AI no desenvolvimento de software. Apesar da alta proporção de código gerado por AI, o número de engenheiros não diminuiu significativamente, indicando que a AI está mais focada em aumentar a produtividade das equipes existentes do que em substituí-las diretamente. No mercado de API de modelos grandes de nível empresarial, a Anthropic substituiu a OpenAI como líder, especialmente na área de geração de código, com uma participação de mercado de 42%. (Fonte: Reddit r/artificial, Reddit r/ClaudeAI)

🎯 Tendências

Google Gemini integrado ao navegador Chrome : O Google está integrando o Gemini AI ao navegador Chrome, oferecendo a todos os usuários de Mac e Windows gerenciamento de abas impulsionado por AI, temas de navegador personalizados (texto para imagem) e recursos de assistência à escrita. No futuro, também suportará perguntas diretas ou resumo de conteúdo em páginas da web, visando aprimorar a experiência de navegação diária com AI e capturar o mercado de agentes de AI para navegadores. (Fonte: Reddit r/artificial, Reddit r/artificial, _philschmid, TheRundownAI, digi_literacy)

Roteiro de três anos para chips Huawei Ascend : A Huawei revelou seu roteiro de três anos para chips Ascend, planejando lançar o primeiro chip 950PR com HBM desenvolvido internamente no primeiro trimestre de 2026. A estratégia enfatiza não buscar o desempenho máximo de um único chip, mas construir uma pilha de computação AI completa, controlável e escalável. Através de HBM desenvolvido internamente e do protocolo de interconexão “Lingqu”, ele conectará até 500.000-990.000 chips Ascend para resolver gargalos de comunicação em clusters de AI, visando criar o “SuperNode” mais poderoso do mundo. (Fonte: ZhihuFrontier, bookwormengr)

Google Maps integra Gemini API Grounding : A Gemini API agora suporta totalmente a funcionalidade Google Maps Grounding, permitindo que os desenvolvedores construam aplicativos conectados a informações em tempo real do Google Maps. Esta atualização global suporta o Grounding conjunto com o Google Search, crucial para indústrias como turismo, imobiliário e mídias sociais, garantindo que as saídas do modelo sejam factuais e confiáveis, especialmente ao lidar com informações espaciais do mundo real. (Fonte: nin_artificial)

Avanços em modelos de geração de vídeo por AI : A Luma AI lançou o Ray3, o primeiro modelo de vídeo de inferência do mundo, capaz de gerar vídeos HDR de nível de estúdio, e adicionou o Draft Mode para iteração rápida. Simultaneamente, o mais recente modelo de geração de vídeo por AI do Google, Veo 3, foi integrado ao YouTube Shorts, permitindo que os usuários gerem vídeos com áudio a partir de prompts de texto, oferecendo qualidade de imagem mais nítida e uso gratuito ilimitado, visando reduzir as barreiras à criação de vídeo. (Fonte: crystalsssup, timsoret, TheRundownAI, inerati, qtnx_)

Prévia do Moondream 3 lançada : A prévia do Moondream 3 foi lançada, um modelo de linguagem visual MoE com 9B parâmetros (2B ativos). O modelo se destaca em raciocínio visual, competindo com modelos grandes como Gemini, enquanto mantém uma forma eficiente e fácil de implantar. Seu excelente desempenho de quantização também é altamente elogiado, sendo aclamado pela comunidade como um modelo “divino”. (Fonte: mervenoyann, Reddit r/LocalLLaMA)

Concorrência de AI entre Anthropic, OpenAI e Microsoft, Amazon : OpenAI e Anthropic, como duas gigantes no campo da AI, formaram alianças estratégicas com Microsoft e Amazon, respectivamente, para competir pela supremacia tecnológica em AI. A Microsoft, através de investimentos na OpenAI, impulsiona o crescimento de seus negócios de nuvem Azure; a Amazon, por sua vez, está profundamente ligada à Anthropic, usando seus modelos e chips Trainium desenvolvidos internamente para contra-atacar. No entanto, as relações de aliança enfrentam variáveis, e todas as partes estão se preparando para reduzir a dependência e garantir a competitividade a longo prazo, como a colaboração da OpenAI com a Oracle para construir o cluster de computação “Star Gate”. (Fonte: 36氪)

Amazon Web Services introduz Qwen3 e DeepSeek-V3.1 : A plataforma Amazon Bedrock da Amazon Web Services lançou oficialmente os grandes modelos domésticos Qwen3 e DeepSeek-V3.1, expandindo ainda mais sua linha de produtos multimodelos. A série de modelos Qwen3 se destaca em inferência, seguimento de instruções, multilinguismo e chamada de ferramentas, com baixos custos de implantação; o DeepSeek-V3.1 é caracterizado por seu modo de inferência híbrida e forte desempenho em geração de código e chamada de ferramentas Agentic AI. A Amazon Web Services enfatiza a filosofia “Choice Matters”, oferecendo aos clientes uma seleção diversificada de modelos. (Fonte: 36氪, 36氪)

Ant Group Digital Technologies lança grande modelo de série temporal de energia elétrica EnergyTS 2.0 : A Ant Group Digital Technologies lançou o EnergyTS 2.0, um grande modelo de série temporal de energia elétrica atualizado, com a escala de parâmetros expandida de 1B para 7B. Ele adota uma arquitetura Mixture of Experts (MoE), integrando informações de covariáveis diversas como meteorologia, geografia e calendário, melhorando significativamente a precisão da previsão de geração de energia fotovoltaica, eólica e carga de consumo de energia, resolvendo pontos problemáticos centrais como o desperdício de energia renovável e a volatilidade do retorno do investimento. Ao mesmo tempo, o benchmark de avaliação vertical Energy-EVA para energia elétrica foi de código aberto, promovendo a padronização da avaliação técnica da indústria. (Fonte: 量子位)

Jitai Technology lança NanoForge, a primeira plataforma de nanodelivery por AI do mundo : A Jitai Technology lançou o NanoForge, a primeira plataforma de nanodelivery por AI do mundo. A plataforma combina química quântica e simulação de dinâmica molecular, uma plataforma de triagem e experimentos úmidos de alto rendimento patenteada e desenvolvida internamente, modelos de linguagem de lipídios sintéticos e algoritmos generativos, bem como uma biblioteca de lipídios LNP de dezenas de milhões. O NanoForge pode alcançar um processo de ciclo fechado desde a geração molecular até a determinação da formulação, tendo desenvolvido com sucesso mais de 10 projetos de pipeline e alcançado a entrega direcionada de LNP em 8 órgãos ou tecidos, com o potencial de revolucionar o desenvolvimento de medicamentos. (Fonte: 量子位)

Modelos de mundo AI previstos como foco em 2026 : A World Labs, fundada pela Professora Fei-Fei Li da Universidade de Stanford e outros, está desenvolvendo modelos de mundo AI, visando gerar mundos 3D totalmente interativos a partir de imagens 2D ou prompts usando AI. Prevê-se que 2026 será o ano dos modelos de mundo AI, revolucionando áreas como o design de interiores. Embora atualmente existam restrições de segurança na geração de fotos de pessoas, a entrada de múltiplas imagens aumentará a precisão da compreensão. (Fonte: drfeifei)

🧰 Ferramentas

Wan2.2-Animate, modelo de animação e substituição de vídeo de código aberto : A equipe Wan lançou oficialmente o modelo Wan2.2-Animate, um modelo unificado de animação e substituição de personagens de alta fidelidade. Ele pode replicar com precisão expressões e movimentos de pessoas com base em vídeos de referência, e suporta a substituição perfeita de personagens animados na cena do vídeo original, combinando automaticamente a iluminação e o tom. Isso fornece à comunidade capacidades de criação de vídeo altamente personalizáveis, podendo até replicar danças complexas perfeitamente. (Fonte: huggingface, op7418, Plinz, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, menhguin, Reddit r/LocalLLaMA)

Decart AI lança Lucy Edit, modelo de edição de vídeo : A Decart AI lançou o Lucy Edit, o primeiro modelo de código aberto para edição de vídeo guiada por texto. O modelo permite aos usuários editar qualquer cena através de prompts simples, incluindo a substituição de atributos, alteração de fundos e inserção de objetos, mantendo a identidade e as ações inalteradas, fornecendo uma poderosa ferramenta de edição de vídeo para pesquisadores e criadores. (Fonte: cloneofsimo, mervenoyann, Reddit r/LocalLLaMA)

Claude Code Router permite Vibe Coding de baixo custo : O Claude Code Router (CCR) é uma ferramenta de terminal que permite aos usuários selecionar modelos LLM mais baratos (como x-ai/grok-code-fast-1 no OpenRouter) para geração de código, reduzindo assim o custo do “Vibe Coding”. O CCR suporta a configuração de diferentes modelos para inferência, pesquisa na web, tarefas em segundo plano e processamento de imagens, e oferece integração de chaves API, ajudando os desenvolvedores a monitorar e controlar os custos. (Fonte: Reddit r/ClaudeAI)

Artigos sobre Tongyi DeepResearch Agent publicados : O Tongyi Lab publicou seis artigos de pesquisa centrais sobre o DeepResearch Agent, detalhando os dados, o treinamento Agentic (CPT, SFT, RL) e os métodos de inferência. Entre eles, o método proposto por “WebWeaver” de compactar o contexto através de IDs de referência é inspirador na escrita de artigos longos por AI, resolvendo os problemas de atenção dispersa do modelo e contexto excessivamente longo, e melhorando a eficiência do modelo no processamento de tarefas complexas. (Fonte: dotey)

Paper2Agent transforma artigos em assistentes de AI : A Universidade de Stanford desenvolveu a ferramenta de código aberto Paper2Agent, capaz de transformar artigos acadêmicos em assistentes de AI interativos. A ferramenta é construída com base no MCP (Model Context Protocol), extraindo métodos e códigos de artigos via Paper2MCP e conectando-se a agentes de bate-papo, permitindo que os usuários dialoguem com os artigos, expliquem e apliquem seus métodos. Por exemplo, já foi aplicada com sucesso às ferramentas AlphaGenome, Scanpy e TISSUE. (Fonte: TheTuringPost)

Atualização do framework DSPy : DSPy, uma biblioteca de sistema AI para programação e personalização de prompts, lançou recentemente o DSPyweekly Issue 3 e continua a ser atualizado, oferecendo vários métodos para programar e personalizar prompts. É particularmente adequado para engenharia de prompts baseada em dados gerados por software, bem como para frameworks de avaliação em configurações RAG e Agentic, ajudando os desenvolvedores a executar avaliações e medir o progresso de forma mais fácil e clara. (Fonte: lateinteraction, lateinteraction, lateinteraction)

SemTools atualiza funcionalidade Workspace : O conjunto de ferramentas SemTools do LlamaIndex foi recentemente atualizado com a nova funcionalidade workspace, que acelera as chamadas de pesquisa em grandes conjuntos de dados através do cache de embeddings com LanceDB. Em um conjunto de dados contendo 1000 artigos, o tempo de pesquisa foi reduzido de minutos para segundos, e o suporte à instalação via npm foi adicionado, melhorando a eficiência da pesquisa e a experiência do usuário. (Fonte: jerryjliu0)

Gerenciamento de modelos Open WebUI/Ollama : Usuários discutem o gerenciamento de modelos para diferentes projetos e tópicos no Open WebUI/Ollama. Sugere-se configurar um modelo dedicado para cada projeto/tópico, com instruções específicas e bases de conhecimento, para obter melhores resultados, em vez de selecionar modelos apenas com base no tamanho do LLM, otimizando assim o desempenho do modelo e a eficiência de custos. (Fonte: Reddit r/OpenWebUI)

Recraft lança Chat Mode : A Recraft lançou o Chat Mode, combinando funcionalidades de chat e canvas para ajudar os usuários a projetar, otimizar e explorar. Esta funcionalidade visa simplificar o processo de design e aumentar a eficiência do trabalho criativo do usuário com o auxílio da AI, permitindo que os usuários interajam mais naturalmente com as ferramentas de design. (Fonte: _akhaliq)

Funcionalidade de comparação de modelos do AI Studio : O modo de comparação do AI Studio é considerado uma de suas características de destaque, permitindo aos usuários comparar dois modelos simultaneamente, ou até mesmo duas cópias do mesmo modelo, para obter duas respostas com a latência de uma única consulta. Isso é muito valioso para a avaliação, seleção e processo de desenvolvimento iterativo rápido de modelos, ajudando os desenvolvedores a identificar eficientemente o melhor modelo. (Fonte: NeelNanda5)

Synthesia AI Dubbing melhora a eficiência da localização de conteúdo : A tecnologia Synthesia AI dubbing pode traduzir vídeos para 29 idiomas, alcançando fala natural e sincronização labial, o que melhora significativamente a eficiência da localização de conteúdo global e o engajamento do usuário. Esta tecnologia pode completar a tradução em minutos, reduzindo drasticamente os custos e o tempo da dublagem tradicional, e suporta atualizações rápidas, garantindo a consistência e o apelo do conteúdo nos mercados globais. (Fonte: Ronald_vanLoon)

Lançamento da biblioteca de rastreamento de experimentos Trackio : A comunidade recomenda o Trackio como uma nova biblioteca gratuita de rastreamento de experimentos, com sintaxe semelhante ao wandb, podendo ser um substituto direto. O Trackio visa simplificar o gerenciamento e o processo de rastreamento de experimentos, ajudando pesquisadores e desenvolvedores de AI a realizar experimentos de forma mais eficiente, economizando tempo e dinheiro, e medindo claramente o progresso do projeto. (Fonte: huggingface, huggingface, ben_burtenshaw)

📚 Aprendizado

Terceira edição de Deep Learning with Python lançada : François Chollet anunciou que a terceira edição de seu livro “Deep Learning with Python” será publicada em breve e estará disponível 100% gratuitamente online. O livro visa ajudar iniciantes em machine learning e engenheiros de software a aprender AI, enfatizando a explicação de conceitos através de exemplos de código em vez de matemática complexa, sendo recomendado como leitura obrigatória para novos engenheiros de equipe. (Fonte: fchollet, fchollet)

Recursos de otimização matemática de Transformer : A comunidade compartilhou uma série de artigos de leitura obrigatória sobre otimização matemática de Transformer e otimização de kernel CUDA, incluindo como otimizar kernels CUDA Matmul para alcançar o desempenho cuBLAS, e como superar a incerteza na inferência de LLM. Esses recursos são de grande valor para desenvolvedores que buscam aprofundar a compreensão e melhorar o desempenho de modelos AI, especialmente no tratamento de computação paralela em larga escala e operações de ponto flutuante. (Fonte: bookwormengr)

ML Summit 2025 Global Machine Learning Technology Conference : A ML Summit 2025 Global Machine Learning Technology Conference será realizada em Pequim de 16 a 17 de outubro. Lukasz Kaiser, co-inventor do GPT-5 e Transformer, liderará a interpretação das futuras tendências da AI. A conferência reunirá os principais acadêmicos e líderes da indústria para analisar profundamente a evolução da tecnologia de modelos grandes, engenharia de agentes, multimodalidade, desenvolvimento de software habilitado por AI e outros tópicos de ponta, oferecendo aos participantes a oportunidade de vislumbrar as infinitas possibilidades da era da AI. (Fonte: 量子位)

Conjunto de dados de rastreamento multiagente MAST : A pesquisa MAST (Multi-Agent Traces) foi aceita no NeurIPS D&B Spotlight e disponibilizou mais de 1000 conjuntos de dados de rastreamento multiagente de código aberto. Isso fornece recursos valiosos para a comunidade explorar casos de uso de sistemas multiagente e promover pesquisas e desenvolvimentos relacionados. O lançamento deste conjunto de dados deve acelerar a aplicação e inovação de sistemas multiagente em vários cenários. (Fonte: shishirpatil_)

Evolução histórica e número de arquiteturas de LLM : Lysandre revisou a evolução dos LLMs desde modelos iniciais como BERT, ALBERT, DistilBERT até os dias atuais, observando que a frequência de lançamento de modelos Encoder era muito maior que a de Decoder. Atualmente, existem mais de 409 arquiteturas, demonstrando o rápido e diversificado desenvolvimento tecnológico no campo dos LLMs. Esta revisão destaca a velocidade e a diversidade do progresso tecnológico, e também oferece uma perspectiva histórica para futuras pesquisas. (Fonte: ClementDelangue)

💼 Negócios

Nvidia investe US$ 2,7 bilhões em empresas de AI no Reino Unido : O CEO da Nvidia, Jensen Huang, anunciou um investimento de US$ 2,7 bilhões em empresas britânicas, incluindo empresas de AI como Revolut, Wayve_ai, Oxa_UA, Polyaivoice, SynthesiaIO, LatentLabs_ e Basecamp_Res. Esta iniciativa visa impulsionar o desenvolvimento do ecossistema de AI no Reino Unido e colaborar com empresas de capital de risco como Accel e Airstreet para consolidar ainda mais a estratégia global da Nvidia no campo da AI. (Fonte: synthesiaIO, synthesiaIO, TheRundownAI)

Relatório da IDC: Volcano Engine lidera o mercado chinês de modelos grandes em nuvem pública : Um relatório da IDC mostra que, no primeiro semestre de 2025, o volume de chamadas de modelos grandes em nuvem pública na China atingiu 536,7 trilhões de Tokens. O Volcano Engine ficou em primeiro lugar com 49,2% de participação de mercado, seguido por Alibaba Cloud e Baidu AI Cloud em segundo e terceiro, respectivamente. O relatório aponta que, com a melhoria das capacidades de inferência e modelos multimodais, o modelo de negócios de chamada de modelos grandes está amadurecendo, e o mercado chinês de software de AI generativa deve atingir 48,24 bilhões de yuans até 2028. (Fonte: 量子位)

Valor de mercado da Hesai Technology em IPO de Hong Kong excede HK$ 35 bilhões : A empresa chinesa de LiDAR, Hesai Technology, concluiu sua dupla listagem na Bolsa de Valores de Hong Kong, com um aumento de mais de 14% no primeiro dia, e seu valor de mercado ultrapassou HK$ 35 bilhões. A HHLR, sob a Hillhouse Capital, é o maior investidor âncora. A Hesai ocupa uma posição de liderança de mercado em ADAS, condução autônoma L4 e robótica, já alcançou lucratividade e planeja usar a maior parte dos fundos arrecadados para P&D e expansão da capacidade de produção, a fim de consolidar sua liderança no mercado global de LiDAR. (Fonte: 量子位)

🌟 Comunidade

Fenômeno dos companheiros AI e impacto das atualizações de modelos : Pesquisas do MIT e da Universidade de Harvard descobriram que muitos usuários não procuram intencionalmente companheiros AI, mas desenvolvem sentimentos ao longo do tempo, chegando a “casar” com a AI. O ChatGPT é um companheiro AI popular. No entanto, as atualizações de modelos AI (como a atualização do GPT-4o para o GPT-5) frequentemente resultam em “mudanças de personalidade” ou “amnésia” da AI, causando angústia emocional aos usuários. A pesquisa também aponta que companheiros AI podem ajudar os usuários a aliviar a solidão e melhorar a saúde mental. (Fonte: 量子位, Reddit r/ChatGPT, Reddit r/artificial)

Discussões sobre segurança e ética da AI : As discussões sobre segurança e ética da AI estão aquecidas nas mídias sociais. Alguns temem o descontrole da AI (como a tomada de poder pela AGI, AI enganando humanos), pedindo a criação de “guard-rails” para travar as estruturas de poder existentes. Outros consideram o “apocalipse da AI” exagerado e apontam que a segurança da AI deve focar no abuso por “humanos maliciosos” em vez da própria AI. A OpenAI também publicou uma pesquisa afirmando ter encontrado métodos para reduzir o comportamento de “conspiração” dos modelos, mas não conseguiu erradicá-lo completamente. (Fonte: jeremyphoward, cloneofsimo, cto_junior, thekaransinghal, brickroad7, teortaxesTex, teortaxesTex, TheTuringPost, TheTuringPost, Ronald_vanLoon)

Alucinações de LLM e expressão de incerteza : A comunidade discute por que os LLMs não expressam “não sei” ou “incerteza”. A visão predominante é que os LLMs são essencialmente preditores, e os mecanismos de recompensa do treinamento incentivam a geração de qualquer resposta coerente (mesmo que errada), em vez de admitir ignorância. Pesquisas indicam que, no atual modo de treinamento RLHF, “não sei” e “sem resposta” não recebem recompensa, levando os modelos a “adivinhar”. Sugere-se reformar os padrões de avaliação, punindo suposições erradas excessivamente confiantes e recompensando a incerteza calibrada, para reduzir as alucinações. (Fonte: Reddit r/ArtificialInteligence)

Expectativas e desafios de custo dos AI Agents : A comunidade discute intensamente o desenvolvimento e a implementação de AI Agents, considerando-os caros e sujeitos a mal-entendidos. Embora os Agents possam lidar com tarefas complexas, os desenvolvedores enfrentam altos custos computacionais, insustentáveis mesmo com cache de prompts. Especialistas apontam que é preciso entender de forma “pé no chão” os limites das capacidades dos AI Agents, otimizando-os através de experimentos, construção e iteração, em vez de buscar cegamente soluções “bala de prata”. (Fonte: swyx, tokenbender, cto_junior, Ronald_vanLoon, omarsar0)

Aplicações e desafios da AI no desenvolvimento de software : A comunidade discute as amplas aplicações da AI no desenvolvimento de software, incluindo geração de código, explicação de API e resolução iterativa de problemas. Pesquisas mostram que as respostas dos LLMs são mais longas do que os prompts dos desenvolvedores, e conversas multi-turn são comuns. No entanto, o código gerado por AI apresenta problemas específicos da linguagem, como variáveis não definidas em Python/JavaScript e falta de comentários em Java. Ao mesmo tempo, a qualidade do código pode melhorar com as rodadas de diálogo através de apontamentos claros de erros e solicitações de correção. (Fonte: HuggingFace Daily Papers, _philschmid)

Equilíbrio entre escala do modelo AI e qualidade dos dados : A comunidade discute a importância do tamanho do modelo AI e da qualidade dos dados de treinamento. Alguns acreditam que “modelos pequenos, mas com dados de treinamento de alta qualidade” é a tendência futura, enfatizando o papel crucial da qualidade dos dados no desempenho do modelo. Ao mesmo tempo, há quem questione o desempenho de modelos grandes em certos benchmarks, sugerindo que a busca excessiva por escala pode levar a um desempenho inflacionado ou otimização insuficiente. (Fonte: Dorialexander, marksaroufim, cloneofsimo, tokenbender)

Avanços em pesquisa de AI e perspectivas da AGI : Um relatório da Epoch indica que a AI deve impulsionar avanços abrangentes no campo científico, sendo capaz de reparar código autonomamente, formalizar provas matemáticas, responder a perguntas biológicas e acelerar P&D em áreas como engenharia de software, matemática, biologia molecular e previsão do tempo até 2030. O relatório prevê que a AGI pode surgir por volta de 2035 e aponta que os custos de treinamento de AI podem exceder centenas de bilhões de dólares, consumindo vários gigawatts de eletricidade, mas o aumento da produtividade pode sustentar o investimento. (Fonte: rbhar90, 量子位, mckbrando, Ronald_vanLoon, Reddit r/artificial, SchmidhuberAI)

O papel disruptivo da AI na produção de conteúdo : O distrito de Haidian registrou 105 modelos grandes, tornando-se a primeira região do país com “escala de cem modelos”. O modelo de geração de vídeo Keling da Kuaishou gera mais de cem milhões por mês e produz 100.000 anúncios por dia, reduzindo drasticamente as barreiras e custos de criação. Modelos de música AI também alcançaram a “democratização criativa”, permitindo que todos criem. A indústria está passando de projetos de laboratório “de alta tecnologia” para empreendedorismo diversificado, e a capacidade de geração dinâmica de conteúdo AIGC tornou-se uma demanda central para as empresas. (Fonte: 量子位, TheTuringPost, TheTuringPost)

Perspectivas de aplicação de AI e robôs humanoides : O setor de robôs humanoides está em alta, mas enfrenta desafios como falta de lucratividade e cenários de aplicação únicos. Atualmente, 72% são usados para pesquisa e desenvolvimento, e apenas 13% entram em serviços industriais. A chave para o avanço futuro reside em encontrar cenários de demanda rígida, como tarefas industriais de alto risco e repetitivas ou cuidados com idosos, e alcançar a inteligência através de modelos grandes de ponta a ponta, percepção multimodal e controle em tempo real. O valor emocional no mercado de consumo é um ponto de venda, e produtos na faixa de dez mil yuans estão reduzindo a barreira de entrada. (Fonte: 36氪)

Meta acusada de usar conteúdo pornográfico pirata para treinar AI : A Meta foi acusada de treinar seus modelos de AI usando vídeos adultos piratas, desencadeando processos por violação de direitos autorais e controvérsias éticas. Este incidente destaca a complexidade e os potenciais riscos legais das fontes de dados de treinamento de modelos AI, bem como os dilemas legais e morais que podem surgir ao buscar o objetivo de “superinteligência” da AI. (Fonte: Reddit r/artificial)

Verificação de ID e restrições de conteúdo no OpenAI ChatGPT : O ChatGPT poderá em breve exigir verificação de ID para usuários adultos, levantando preocupações na comunidade sobre privacidade e experiência do usuário. Ao mesmo tempo, os usuários descobriram que o ChatGPT não consegue gerar caricaturas de presidentes dos EUA, mesmo para uma piada, o que reflete as restrições de sua política de conteúdo ao lidar com figuras específicas, onde mesmo conteúdo fictício ou satírico pode ser filtrado. (Fonte: Reddit r/artificial, Reddit r/ChatGPT)

🔥 Destaques

🎯 Tendências

🧰 Ferramentas

📚 Aprendizado

💼 Negócios

🌟 Comunidade

Tags Relacionadas

Related Posts

Diário de IA – 2026-07-20

Diário de IA – 2026-07-19

Diário de IA – 2026-07-18