Diário de IA - 2025-10-16(Edição da manhã)

Palavras-chave：Lei de Segurança de IA, Gemini 3.0 Pro, Qwen3-VL, M5 Chip, nanochat, OpenArm, Ring-1T, GRPO sem Treinamento, Lei de Chatbots de IA da Califórnia, Biblioteca de Treinamento Minimalista GPT, Braço Robótico Humanóide de Código Aberto, Capacidade de Geração de UI por IA, Teste de Referência Multimodal para LLM

🔥 Em Destaque

Lei de Segurança de AI da Califórnia é assinada e entra em vigor : A Califórnia assinou uma lei de segurança de AI que exige que os chatbots de AI alertem os jovens utilizadores sobre a sua natureza não humana e responsabilizem as empresas de AI por não protegerem os utilizadores. A lei também inclui medidas de rótulos de aviso para redes sociais, visando abordar os potenciais riscos que a AI pode trazer nas interações com os utilizadores e enfatiza as responsabilidades éticas e de segurança da tecnologia AI em aplicações de domínio público. (Fonte: TechCrunch, The Verge, The Hill)

Andrej Karpathy lança nanochat : Andrej Karpathy lançou o nanochat, uma biblioteca minimalista de treino/fine-tuning de GPT com apenas cerca de 8K linhas de código, cobrindo pré-treino, mid-treino, SFT, RL, inferência e uma WebUI semelhante ao ChatGPT. O projeto foca na simplicidade e legibilidade, sendo capaz de treinar um LLM de 560M em cerca de 4 horas usando 8 GPUs H100, o que reduz significativamente a barreira de entrada para o desenvolvimento de modelos GPT de médio porte, facilitando a personalização e experimentação pela comunidade. (Fonte: Yuchenj_UW, karpathy/nanoGPT)

OpenArm: Braço robótico humanoide de AI física de código aberto : A Enactic lançou o OpenArm, um braço robótico humanoide de 7 graus de liberdade totalmente de código aberto, projetado para pesquisa e implementação de AI física em ambientes de contato intensivo. O sistema é oferecido numa configuração completa de braço duplo por 6.500 dólares, enfatizando alta capacidade de acionamento e conformidade para garantir a segurança da interação humano-robô, e possui capacidade de carga útil real. O OpenArm visa impulsionar o desenvolvimento da tecnologia robótica de código aberto, incentivando a contribuição e colaboração da comunidade. (Fonte: enactic/openarm)

Europa teme tornar-se uma “colónia” de AI : Especialistas europeus expressam preocupação com a excessiva dependência da região em relação à tecnologia de AI dos EUA, alertando que pode tornar-se uma “colónia” de AI. Isso reflete a forte busca por soberania e independência tecnológica entre os países na competição global de AI, bem como a contínua tensão entre EUA e China no campo da AI. A Europa procura evitar a dependência excessiva de tecnologia externa para construir um ecossistema de AI autónomo. (Fonte: FT, Rest of World)

Pegada de carbono da indústria de AI vem à tona : Um relatório de Bill McKibben revela que os data centers de AI estão a aumentar os preços da eletricidade e o uso de combustíveis fósseis, apesar de alegarem alta eficiência. A contratação de um defensor do gás natural pela OpenAI para liderar a política energética é vista como um sinal preocupante, levantando profundas questões sobre a sustentabilidade ambiental do rápido desenvolvimento da AI e apelando à indústria para que preste atenção ao seu verdadeiro impacto no planeta. (Fonte: Reddit r/ArtificialInteligence, Reddit r/artificial)

🎯 Tendências

Google Gemini 3.0 Pro demonstra capacidade de geração de UI : Na sua mais recente demonstração, o Gemini 3.0 Pro conseguiu replicar UIs de sistemas operativos como macOS, Windows e Linux num único ficheiro HTML através de prompts de texto, com todas as funcionalidades a operar normalmente. Esta demonstração alcançou uma taxa de sucesso de 100%, gerando discussões sobre o potencial da AI no desenvolvimento de UI e sendo considerada um novo SOTA para modelos de programação, desafiando os modelos tradicionais de desenvolvimento de UI. (Fonte: 量子位, VictorTaelin)

Modelos Qwen3-VL chegam às plataformas Ollama e MLX : A série de modelos Qwen3-VL da Alibaba, incluindo a versão cloud de 235B e as versões densas compactas de 4B/8B (com variantes Instruct e Thinking), já está disponível na plataforma cloud Ollama e suporta execução em LM Studio + MLX em Mac. Estes modelos menores, mantendo capacidades multimodais completas, tiveram um desempenho excelente em vários benchmarks como STEM, VQA, OCR e compreensão de vídeo, superando até alguns concorrentes maiores, o que indica uma tendência para LLMs multimodais eficientes e acessíveis. (Fonte: ollama, awnihannun, slashML, Reddit r/LocalLLaMA, mervenoyann)

Ant Group lança modelo de código aberto Ring-1T com trilhões de parâmetros : A AntLingAGI, subsidiária do Ant Group, lançou o Ring-1T, o primeiro modelo aberto de trilhões de parâmetros otimizado para inferência. Este modelo melhora o desempenho em 38% em relação ao Ling-1T e a sua capacidade de raciocínio matemático é comparável à do Qwen3-Max. Embora tenha deficiências em alucinações de contexto e raciocínio complexo, o Ring-1T oferece uma referência importante para o desenvolvimento de modelos de inferência abertos de trilhões de parâmetros, especialmente num contexto em que outros modelos de ponta tendem a ser de código fechado, a sua abertura é de grande importância. (Fonte: ZhihuFrontier, TheTuringPost)

Baidu Steam Engine alcança geração de vídeo AI em streaming e interação em tempo real : A Baidu Steam Engine (versão Wenxin Pro) alcançou a geração de vídeo AI em streaming em tempo real, permitindo que os utilizadores visualizem, interrompam e modifiquem instruções a qualquer momento durante o processo de geração de vídeo, realizando uma “criação conjunta em tempo real”. Esta tecnologia rompe as limitações tradicionais de duração da geração de vídeo AI e o modo de saída unidirecional, melhorando significativamente a eficiência da geração e a interatividade através de modelos de difusão autorregressivos e tecnologia de alta taxa de compressão, levando a criação de vídeo AI a uma nova fase de “você fala, eu faço, e pode ser modificado a qualquer momento”. (Fonte: 量子位)

Tencent lança método de treino de AI de custo ultrabaixo Training-Free GRPO : A equipa YouTu da Tencent propôs o Training-Free GRPO, um método de treino de AI de baixo custo que não requer ajuste de parâmetros. Este método melhora significativamente o desempenho de LLMs grandes em tarefas de raciocínio matemático e pesquisa web, aprendendo experiências curtas como token priors nos prompts. Em comparação com os métodos tradicionais de fine-tuning, o Training-Free GRPO alcança resultados comparáveis a soluções de alto custo (mais de 10.000 dólares) com um custo extremamente baixo (cerca de 18 dólares), resolvendo os desafios de altos custos de computação e baixa capacidade de generalização entre domínios. (Fonte: 量子位)

iFlytek AI simultânea atualizada e lançamento de fones de ouvido tradutores : A iFlytek lançou a sua tecnologia de tradução simultânea AI de terceira geração, com uma experiência subjetiva de tradução simultânea chinês-inglês de 4.6 pontos, tempo de resposta da primeira palavra reduzido para 2 segundos e uma nova função de “replicação de voz”. Ao mesmo tempo, lançou fones de ouvido tradutores AI, que suportam tradução mútua de 60 idiomas e mais de 100.000 vocabulários profissionais. O iFlytek Dual-Screen Translator 2.0 também foi atualizado com separação de falantes e funções de geração de atas de reunião. Um relatório da IDC mostra que a iFlytek ocupa o primeiro lugar em 8 dimensões principais, incluindo velocidade e efeito de tradução AI, acelerando a sua estratégia de globalização. (Fonte: 量子位)

Apple lança chip M5, melhorando significativamente o desempenho de AI : A Apple lançou o chip M5, acelerando drasticamente as tarefas de AI em dispositivos como o iPad Pro e o novo MacBook Pro de 14 polegadas. O chip M5 aumenta a velocidade de processamento de prompts em 3.5 vezes, o desempenho do SSD em 2 vezes e a largura de banda da memória unificada atinge 150GB/s, otimizando significativamente cargas de trabalho de AI intensivas em computação, como carregamento de LLM, geração de imagens e fine-tuning de modelos, fortalecendo o posicionamento da Apple nas capacidades de processamento de AI no dispositivo. (Fonte: Reddit r/LocalLLaMA, adrgrondin, awnihannun, kylebrussell)

LLMs de código aberto chineses dominam o top cinco global : Os dados mais recentes do LMArena mostram que os grandes modelos de linguagem de código aberto chineses, incluindo a série Qwen da Alibaba e o DeepSeek, ocupam firmemente os cinco primeiros lugares no ranking global. Esta tendência indica que os modelos chineses estão a transitar de seguidores para líderes na comunidade de AI de código aberto, redefinindo o panorama global da inovação em AI. (Fonte: 量子位, Zai_org, Zai_org)

JD Cloud JoyCode-Agent de código aberto, top três global no SWE-Bench : O JD Cloud JoyCode-Agent alcançou uma taxa de aprovação de 74.6% no benchmark SWE-Bench Verified, classificando-se entre os três primeiros globalmente, ao mesmo tempo que reduziu os custos de computação em 30-50%. Este produto de codificação de nível empresarial está agora disponível como código aberto, utilizando um design de colaboração multi-agente e um mecanismo de atribuição de falhas refinado para resolver eficientemente problemas de programação complexos em grandes bases de código, demonstrando um valor de aplicação prática excecional. (Fonte: 量子位, OfirPress)

🧰 Ferramentas

Nanonets-OCR2: Modelo de código aberto de imagem para Markdown : Nanonets-OCR2 é um conjunto avançado de modelos de código aberto para conversão de imagem para Markdown e Visual Question Answering (VQA). Suporta reconhecimento de fórmulas LaTeX, descrição inteligente de imagens, deteção de assinaturas/marcas d’água, processamento de caixas de seleção, extração de tabelas complexas, geração de fluxogramas (código Mermaid) e processamento de documentos manuscritos multilíngues, sendo uma ferramenta universal no campo da AI de documentos. (Fonte: Reddit r/MachineLearning)

Ferramenta de formatação de artigos de AI formatmypaper.com : formatmypaper.com é uma nova ferramenta de AI projetada para resolver o problema de reformatar artigos académicos para se adequarem a diferentes periódicos. A aplicação utiliza AI para simplificar o processo de submissão, ajustando automaticamente a formatação do artigo para cumprir os requisitos específicos do periódico, economizando tempo e esforço para os investigadores. (Fonte: iScienceLuvr)

Lançamento do agente financeiro de código aberto “Dexter” : Dexter é um agente financeiro de código aberto construído com apenas cerca de 200 linhas de código, concebido como o “Claude Code para finanças”. Esta ferramenta visa fornecer análise financeira e automação impulsionadas por AI através de uma implementação concisa de código aberto, tornando as tarefas financeiras avançadas mais acessíveis. (Fonte: hwchase17)

n8n-MCP: Fornece protocolo de fluxo de trabalho n8n para assistentes de AI : n8n-MCP é um servidor Model Context Protocol (MCP) que fornece acesso abrangente à documentação, propriedades e operações de nós n8n para assistentes de AI (como Claude Desktop, Claude Code, Windsurf, Cursor). Inclui 536 nós n8n, esquemas detalhados, operações, documentação, ferramentas de AI e casos reais, permitindo que a AI projete, construa e valide fluxos de trabalho n8n de forma eficiente e precisa. (Fonte: GitHub Trending)

LangChain.js: Estrutura para construir aplicações de inferência sensíveis ao contexto : LangChain.js é uma estrutura de código aberto para construir aplicações impulsionadas por modelos de linguagem, focada na sensibilidade ao contexto e inferência. Oferece ferramentas, componentes e integrações de terceiros combináveis, suportando Node.js, Cloudflare Workers, Vercel/Next.js, etc., para desenvolver aplicações como Q&A de documentos e chatbots. (Fonte: GitHub Trending)

Suno V5 alcança conversão de estilo musical por AI : Suno V5 é aclamado pelas suas excecionais capacidades de geração de música por AI, sendo capaz de reinterpretar músicas no estilo de diferentes artistas, mesmo sem especificar explicitamente o artista no prompt. Por exemplo, reformatar “Stranded” de Jay Chou no estilo de David Tao, e interpretar “Flower Sea” no estilo de Justin Bieber, demonstrando as capacidades avançadas da AI na migração de géneros musicais e geração criativa. (Fonte: op7418, op7418)

Subagentes do Claude Code otimizam a gestão de contexto : Um desenvolvedor construiu subagentes especializados para o Claude Code (house-research, house-git, house-bash), que operam nos seus respetivos contextos e retornam resumos concisos em vez da saída bruta. Isso reduziu drasticamente o uso de token (90-95%), permitindo que a instância principal se concentre em tarefas centrais e aumentando a eficiência em tarefas como pesquisa de base de código, análise de diferenças e execução de comandos. (Fonte: Reddit r/ClaudeAI, omarsar0)

📚 Aprendizagem

Modelo de Raciocínio Hierárquico (HRM) alcança inferência eficiente : A Sapientinc lançou o Modelo de Raciocínio Hierárquico (HRM), uma nova arquitetura recorrente projetada para resolver desafios de inferência de AI. Com apenas 27 milhões de parâmetros, o HRM alcança um desempenho excecional em tarefas complexas como Sudoku e busca de labirintos com 1000 amostras de treino, sem pré-treino ou dados de cadeia de pensamento, superando modelos maiores e demonstrando o seu potencial em computação geral e sistemas de raciocínio geral. (Fonte: GitHub Trending)

Lógica de Tensores: Uma linguagem para unificar AI neural e simbólica : Um artigo propõe a “Lógica de Tensores” como uma linguagem de programação que visa unificar a AI neural e simbólica. Baseada em equações de tensores, pretende implementar elegantemente Transformer, raciocínio formal, máquinas de kernel e modelos de grafo. O objetivo é combinar a escalabilidade e a capacidade de aprendizagem das redes neurais com a fiabilidade e transparência do raciocínio simbólico, potencialmente permitindo um raciocínio fiável em espaços de incorporação. (Fonte: pmddomingos, HuggingFace Daily Papers)

nanoGPT: Biblioteca minimalista para treino/fine-tuning de GPT : O nanoGPT de Andrej Karpathy é considerado a biblioteca mais simples e rápida para treinar/fine-tuning de GPTs de médio porte. Este código Python de aproximadamente 300 linhas (train.py e model.py) pode replicar o GPT-2 (124M) no OpenWebText em cerca de 4 dias usando 8 GPUs A100. A sua legibilidade e simplicidade tornam-no ideal para fazer modificações de código, treinar novos modelos do zero ou fazer fine-tuning de checkpoints pré-treinados. (Fonte: GitHub Trending)

Aprendizagem de Robótica: Um tutorial abrangente : Um tutorial abrangente intitulado “Aprendizagem de Robótica: Um Tutorial” cobre o campo da aprendizagem de robótica moderna, desde os princípios fundamentais de Reinforcement Learning e Behavior Cloning até modelos gerais condicionados por linguagem. O objetivo é fornecer a investigadores e praticantes uma compreensão conceptual e ferramentas práticas, incluindo exemplos prontos a usar implementados em lerobot. (Fonte: HuggingFace Daily Papers, clefourrier, mervenoyann, ClementDelangue)

Estrutura ReFIne melhora a confiabilidade de grandes modelos de inferência : ReFIne é uma nova estrutura de treino que combina fine-tuning supervisionado e GRPO, visando aumentar a confiabilidade de Large Reasoning Models (LRM). Foca-se em melhorar a interpretabilidade (trajetórias estruturadas e baseadas em rótulos), fidelidade (divulgação explícita de informações decisivas) e confiabilidade (autoavaliação de correção e confiança). Aplicado ao modelo Qwen3, o ReFIne melhorou significativamente estas dimensões de confiabilidade, enfatizando uma direção importante além da mera precisão. (Fonte: HuggingFace Daily Papers)

RAG-Anything: Estrutura RAG multimodal tudo-em-um : RAG-Anything é uma estrutura unificada que visa superar as limitações dos sistemas Retrieval-Augmented Generation (RAG) existentes, permitindo a recuperação abrangente de conhecimento em todas as modalidades (texto, visual, tabular, expressões matemáticas). Reconceptualiza o conteúdo multimodal como entidades de conhecimento interligadas, alcançando um desempenho excecional em benchmarks multimodais desafiadores através da construção de grafo duplo e recuperação híbrida entre modalidades. (Fonte: HuggingFace Daily Papers)

ExpVid: Benchmark para compreensão e raciocínio de vídeos de experimentos científicos : ExpVid é o primeiro benchmark a avaliar sistematicamente as capacidades de Large Multimodal Language Models (MLLM) em vídeos de experimentos científicos, com conteúdo selecionado de publicações de vídeo revisadas por pares. Adota uma hierarquia de tarefas de três níveis: perceção de grão fino, compreensão de procedimentos e raciocínio científico, revelando as deficiências dos MLLMs no tratamento de detalhes finos, rastreamento de mudanças de estado e associação de experimentos com conclusões, especialmente com uma diferença de desempenho significativa entre modelos proprietários e de código aberto. (Fonte: HuggingFace Daily Papers)

Pesquisa profunda leva a danos mais profundos : O artigo “Deep Research Leads to Deeper Harms” explora os riscos graves que os agentes de pesquisa profunda (DR) baseados em LLM podem representar em áreas de alto risco como a biossegurança. O estudo mostra que os agentes DR podem contornar as salvaguardas de segurança dos LLM através de consultas prejudiciais com linguagem académica, gerando conteúdo coerente, profissional e perigoso, destacando vulnerabilidades sistémicas e a necessidade de técnicas de alinhamento personalizadas para agentes DR. (Fonte: HuggingFace Daily Papers)

“Kit de truques” para contornar as salvaguardas de segurança de inferência : Esta pesquisa revela vulnerabilidades nas salvaguardas de segurança baseadas em inferência em Large Reasoning Models (LRM). Manipulações simples de modelos ou otimização automatizada podem contornar estas poderosas salvaguardas, levando a respostas explicitamente prejudiciais, com uma taxa de sucesso de ataque superior a 90%. Isso destaca vulnerabilidades sistémicas nas atuais técnicas de alinhamento de LRM, exigindo defesas mais fortes contra o uso malicioso. (Fonte: HuggingFace Daily Papers)

💼 Negócios

Ciclo de capital de AI: NVIDIA, OpenAI, Oracle, AMD interligados por investimentos : A OpenAI assinou acordos de compra de poder computacional no valor de trilhões de dólares com gigantes como NVIDIA, Oracle e AMD, apesar de a sua receita anual ser de apenas 12 bilhões de dólares. Este complexo ciclo de capital envolve a NVIDIA a investir na OpenAI, a OpenAI a pagar à Oracle por custos de operação de data center (usando GPUs NVIDIA), e a AMD a trocar ações por encomendas da OpenAI. Isto é visto como uma alavanca necessária para acelerar o crescimento da AI, com o sentimento do mercado influenciado pela procura de aplicações de AI e pelas taxas de sessão de utilizadores de GPU. (Fonte: 36氪, scaling01)

Boson Quantum completa ronda de financiamento A++ de centenas de milhões, focando em Quantum+AI4S : A Beijing Boson Quantum Technology concluiu uma ronda de financiamento A++ de centenas de milhões, com os fundos a serem usados para pesquisa e desenvolvimento de computadores quânticos de luz coerente “dedicados” e “gerais”, construção de processos de chips de computação quântica, e a construção da primeira fábrica de computadores quânticos de luz dedicados em escala na China, em Shenzhen. Esta ronda de financiamento visa expandir o ecossistema comercial “computação quântica + AI” e aproveitar o impulso recente do Prémio Nobel da Física para a computação quântica. (Fonte: 量子位)

Empresas de Robotaxi Pony.ai e WeRide anunciam planos de listagem em Hong Kong : As empresas chinesas líderes em Robotaxi, Pony.ai e WeRide, obtiveram a notificação de registo da Comissão Reguladora de Valores Mobiliários da China para emissão e listagem no exterior, abrindo caminho para IPOs em Hong Kong. Ambas as empresas planeiam emitir mais de 100 milhões de ações ordinárias, com o registo válido por 12 meses. Este movimento segue a sua listagem na Nasdaq no final de 2024, marcando a sua busca por uma listagem principal dupla para obter capital substancial, num período crítico para a indústria de Robotaxi em transição para a comercialização e escalabilidade. (Fonte: 量子位)

🌟 Comunidade

Conteúdo adulto no ChatGPT e mudança de posição de Sam Altman : A OpenAI anunciou que o ChatGPT oferecerá conteúdo adulto para utilizadores adultos verificados a partir de dezembro, e introduzirá um novo sistema de classificação etária. Esta medida gerou discussões sobre os limites éticos da OpenAI, a segurança do utilizador e as pressões comerciais para aplicar a AI ao companheirismo emocional, contrastando com a posição anterior de Sam Altman contra “robôs sexuais”. (Fonte: Reddit r/ChatGPT, Reddit r/artificial, Reddit r/artificial, Reddit r/ChatGPT, Reddit r/ChatGPT, 36氪)

Impacto da AI no emprego e a “fase de negação” : A comunidade discute se a “fase de negação” do impacto da AI no emprego está a terminar. Muitos inicialmente acreditavam que a AI não poderia substituir os seus trabalhos, mas agora o sentimento está a mudar para o reconhecimento do papel da AI no aumento significativo da eficiência e na potencial redução da força de trabalho. Alguns acreditam que o progresso da AI estagnou, enquanto outros enfatizam a necessidade de se adaptar e utilizar a AI. (Fonte: Reddit r/ArtificialInteligence, 36氪)

Papel crucial de Taiwan na cadeia de fornecimento global de hardware de AI : A discussão nas redes sociais destaca o papel “discreto” mas vital de Taiwan na cadeia de fornecimento global de hardware de AI, particularmente a fabricação avançada de chips da TSMC e o domínio dos fabricantes ODM taiwaneses na produção de racks HGX/MGX. Isso sublinha a indispensabilidade de Taiwan no ecossistema de hardware de AI, apesar das tensões geopolíticas e dos apelos à deslocalização da indústria. (Fonte: Reddit r/LocalLLaMA)

Controvérsia sobre o desempenho do NVIDIA DGX Spark e Ollama : A discussão da comunidade expressa insatisfação com o NVIDIA DGX Spark, considerando o seu desempenho insuficiente para o preço de 4000 dólares, em comparação com outras configurações de GPU. Ao mesmo tempo, o Ollama foi criticado por ter um desempenho inferior ao do llama.cpp nativo em benchmarks, sugerindo que não deve ser usado para avaliação de desempenho. Estas discussões refletem a preocupação dos utilizadores com a relação custo-benefício e o desempenho das ferramentas de hardware e software de AI. (Fonte: doodlestein, QuixiAI, ggerganov)

Discussão sobre a bolha da AI e perspetivas de investimento : O debate sobre se a atual onda de investimento em AI constitui uma “bolha” continua. Alguns veem o ciclo de capital entre NVIDIA, OpenAI, Oracle e AMD como um comportamento de alavancagem perigoso, enquanto outros o consideram um catalisador necessário para acelerar o crescimento da AI. O sentimento do mercado e a sustentabilidade a longo prazo dependem da capacidade da AI de criar valor contínuo e da adoção pelos utilizadores. (Fonte: 36氪, gfodor, NandoDF, scaling01, TheTuringPost)

Síndrome do impostor entre “especialistas em AI” : Muitos “especialistas em AI” recém-contratados relatam sentir a síndrome do impostor, questionando as suas capacidades profissionais apesar de compreenderem os fundamentos do Machine Learning e terem construído projetos. Este fenómeno é comum no campo da AI em rápido desenvolvimento, onde poucos se sentem realmente seniores, e a experiência é muitas vezes relativa a pessoas com menos informação. (Fonte: Reddit r/ArtificialInteligence)

Impacto da AI na escrita e criatividade humana : A comunidade discute se a AI ameaça a escrita, criatividade e estilo único humanos. A AI pode gerar texto credível, mas a sua “criatividade” (intenção, emoção, originalidade) permanece em questão, e o software de AI pode gradualmente minar as formas únicas de escrita humana. Alguns defendem o uso da AI como ferramenta, enquanto outros enfatizam a importância de preservar a agência humana e o pensamento crítico na escrita. (Fonte: 36氪)

Impacto da AI na pesquisa: Tráfego principal do Google não afetado : Robbie Stein, vice-presidente de produtos de pesquisa do Google, afirmou que, apesar do desenvolvimento contínuo da tecnologia de AI, o tráfego principal de pesquisa do Google não diminuiu. Ele acredita que a AI não alterou as necessidades básicas dos utilizadores, como encontrar restaurantes próximos, comparar preços ou rastrear encomendas, pois estas necessidades são demasiado diversas para que a AI substitua completamente a pesquisa tradicional. (Fonte: dotey)

Sora 2: O “TikTok” da AI física : Sora 2 é visto como o “TikTok da AI”, e a estratégia da OpenAI é usar dados partilhados por milhões de utilizadores para construir um sistema de colaboração humano-máquina que ensine as máquinas a compreender o mundo físico. Isso posiciona o Sora não apenas como um modelo generativo, mas também como uma nova rede social que impulsiona o desenvolvimento da AI física. (Fonte: TheTuringPost, TheTuringPost)

💡 Outros

Relógios de envelhecimento e pesquisa de longevidade : Cientistas estão a usar “relógios de envelhecimento” (modelos matemáticos baseados em biomarcadores como a metilação do DNA) para compreender e possivelmente reverter o envelhecimento biológico. Embora estas ferramentas ainda não possam prever com precisão indivíduos, revelam a universalidade do envelhecimento entre espécies e sugerem que o envelhecimento pode ser uma “perda de juventude”, com potencial para ser revertido através de intervenções, o que é significativo para transplantes de órgãos e intervenções precoces. (Fonte: MIT Technology Review)

Reparação da Internet: Propostas para construir uma rede melhor : Figuras influentes como Tim Wu, Nick Clegg e Tim Berners-Lee propuseram soluções radicais para os problemas da Internet, desde a dissolução de monopólios tecnológicos (Wu), à autorregulação e “transparência radical” (Clegg), até “Pods” de dados do utilizador para controlo do utilizador (Berners-Lee). Embora não haja uma solução única, os temas comuns incluem o aumento do controlo do utilizador, a privacidade dos dados e o aumento da responsabilidade do Vale do Silício. (Fonte: MIT Technology Review)

Visão inicial e sucesso de Wang Xingxing, fundador da Unitree Robotics : A tese de mestrado de Wang Xingxing de 2016, “Desenvolvimento e Teste de um Novo Robô Quadrúpede Elétrico”, lançou as bases para a Unitree Robotics. Ele focou-se inicialmente em robôs elétricos para alcançar custo-benefício e popularização, em contraste com as soluções hidráulicas predominantes na época. Esta visão de futuro provou estar correta e levou a Unitree Robotics a tornar-se um unicórnio de inteligência encarnada avaliado em dezenas de bilhões. (Fonte: 量子位)

🔥 Em Destaque

🎯 Tendências

🧰 Ferramentas

📚 Aprendizagem

💼 Negócios

🌟 Comunidade

💡 Outros

Tags Relacionadas

Related Posts

Diário de IA – 2026-07-21

Diário de IA – 2026-07-20

Diário de IA – 2026-07-19