Diário de IA – 2025-12-18(Edição da noite)

Palavras-chave:Gemini 3 Flash, GPT-5.2, Modelo de IA, SAM Audio, Robô humanoide, MiMo-V2-Flash, Modelo de grande escala da Tencent, Raciocínio multimodal, IA de edição de áudio, Capacidade de produção de robôs corporificados, Modelo de grande escala de código aberto, Modelo de grande escala de IA para saúde

🔥 Destaque

Google lança Gemini 3 Flash: O Google anunciou o Gemini 3 Flash, oferecendo inteligência de ponta a um custo extremamente baixo, com preço apenas 25% do modelo Pro. Apesar disso, supera o Gemini 3 Pro em benchmarks como MMMU-Pro e SWE-bench Verified, além de ser 3x mais rápido. Projetado para desenvolvimento iterativo, o modelo possui desempenho próximo ao Gemini 3 Pro em programação e baixa latência, com suporte a raciocínio multimodal para análise de vídeo, extração de dados e Q&A visual. Já disponível para usuários comuns no app Gemini e no modo AI do Google Search, e para desenvolvedores via API, promete integrar IA de forma mais ampla em aplicações cotidianas e sistemas comerciais. (Fonte: 36Kr, 36Kr)

Google lança "cortador de preços": Gemini 3 Flash supera Pro, custa 1/4 e é rápido como "relâmpago"

OpenAI lança série GPT-5.2: A OpenAI apresentou os modelos GPT-5.2 (Pro, Thinking e Instant) em resposta à concorrência do Gemini 3. O GPT-5.2 estabeleceu novos recordes em benchmarks como ARC-AGI-1 e ARC-AGI-2 (quebra-cabeças visuais abstratos), com ganhos notáveis em eficiência computacional (custo reduzido a 1/390 do GPT-5.1). Oferece níveis ajustáveis de raciocínio (incluindo x-high) e suporte a resumos de contexto para ampliar limites de entrada. O lançamento visa melhorar eficiência em tarefas profissionais (geração de código, planilhas, apresentações) e destacar viabilidade econômica em tarefas complexas. (Fonte: DeepLearning.AI Blog)

Resposta da OpenAI ao Gemini 3, mundos interativos da Runway, aliança Disney-OpenAI

IA resolve problema matemático aberto: O GPT-5 resolveu autonomamente um problema submetido ao benchmark IMProofBench, apresentando prova completa e correta sem intervenção humana. O avanço, uma pequena mas nova contribuição à geometria enumerativa, marca progresso significativo em raciocínio matemático complexo. O feito gerou discussões sobre o potencial da IA em pesquisa científica, sugerindo um futuro com papel mais ativo em descobertas. (Fontes: SebastienBubeck, kevinweil, gdb, OfirPress, SebastienBubeck)

IA resolve problema matemático aberto

Meta lança SAM Audio: A Meta introduziu o SAM Audio, primeiro modelo unificado de IA para isolar e editar sons em misturas complexas. Com prompts de texto, imagem ou intervalo temporal, permite extrair guitarras de músicas, filtrar ruídos de trânsito ou remover latidos de podcasts. A inovação pode revolucionar edição de áudio, simplificando processos e reduzindo barreiras técnicas, impulsionando criação de conteúdo. (Fontes: ylecun, ylecun, dotey)


🎯 Tendências

Yunpeng Tech lança produtos IA+saúde: Em parceria com Shuai Kang e Skyworth, a Yunpeng Tech lançou o “Laboratório de Cozinha Digital do Futuro” e geladeiras inteligentes com modelo de IA para saúde. O “Assistente de Saúde Xiao Yun” oferece gestão personalizada, integrando IA ao design e operação de cozinhas. O movimento reflete a expansão da IA em gestão de saúde e smart home, potencializando serviços customizados. (Fonte: 36Kr)

Lançamento de produtos IA+saúde da Yunpeng Tech

Robôs humanoides enfrentam desafios de produção: Em 2025, o setor acumulou pedidos de ¥3.5 bilhões, mas entregou menos de mil unidades, revelando gargalos. Empresas como Zhi Yuan e Ubtech lutam para escalar produção de centenas para milhares. No varejo, preços altos e aplicações limitadas restringem vendas (menos de mil unidades), com falhas expostas em maratonas de robôs. Apesar de apoio político e investimentos, o setor busca transicionar de “viabilidade técnica” para “produtos confiáveis”. (Fontes: 36Kr, 36Kr)

Negócio incômodo de robôs humanoides: pedidos superam ¥3.5 bi, entregas abaixo de mil

Transformação e desafios da Meitu: A Meitu focou em ferramentas como Meitu Xiuxiu (C2C) e Meitu Design Studio (B2B), com a plataforma RoboNeo integrando modelos de terceiros e o Miracle Vision próprio. No entanto, a retenção de usuários do RoboNeo é baixa, especialmente sob concorrência de produtos como o Google Nano Banana, gerando incertezas no mercado B2B global. Com 200 milhões de MAU, a empresa ainda tem espaço em SaaS vertical, apostando em fusão de tecnologia e produto para competir com LLMs. (Fonte: 36Kr)

Meitu: Sob o tsunami de IA, há espaço para SaaS vertical?

Xiaomi abre modelo MiMo-V2-Flash: Com 309B de parâmetros, o modelo alcança aceleração de 2.6x em inferência, liderando em código (73.4% no SWE-Bench Verified) e habilidades de Agent. Tecnologias como mecanismo de atenção híbrida (5:1) e previsão multi-camadas (MTP) melhoram eficiência e compreensão de texto longo. O modelo também se destaca em interações humanizadas, reforçando a ambição da Xiaomi em AGI para o mundo físico. (Fonte: 36Kr)

Xiaomi entra no topo de modelos abertos: código líder, QI e EQ elevados

Reestruturação de IA da Tencent: A Tencent nomeou Yao Shunyu (ex-OpenAI) como Cientista Chefe de IA, reportando diretamente ao presidente Martin Lau e liderando as divisões de AI Infra e LLM. A mudança visa fortalecer competência em computação, dados e engenharia, reposicionando a IA como estratégia central contra concorrentes como ByteDance e Alibaba. (Fontes: 36Kr, 36Kr, 36Kr)