Kata Kunci:Gemini 3 Flash, GPT-5.2, Model AI, Robot humanoid, SAM Audio, MiMo-V2-Flash, Model besar Tencent, Penalaran multimodal, Editor audio AI, Kapasitas produksi robot embodied, Model besar sumber terbuka, Model kesehatan AI
🔥 Sorotan
Google Luncurkan Gemini 3 Flash: Google merilis Gemini 3 Flash yang menawarkan kecerdasan mutakhir dengan biaya sangat rendah, hanya 25% dari harga versi Pro. Namun, model ini justru mengungguli Gemini 3 Pro dalam benchmark inti seperti MMMU-Pro dan SWE-bench Verified, dengan kecepatan 3x lebih cepat. Dirancang untuk pengembangan iteratif, Gemini 3 Flash memiliki performa pemrograman mendekati Gemini 3 Pro dengan latensi rendah, mendukung reasoning multimodal untuk analisis video, ekstraksi data, dan visual Q&A. Model ini sudah tersedia untuk pengguna umum di aplikasi Gemini dan mode AI Google Search, sementara developer bisa mengintegrasikannya via API, membuka peluang embedding AI yang lebih luas di aplikasi sehari-hari dan sistem bisnis. (Sumber: 36Kr, 36Kr)

OpenAI Rilis Seri Model GPT-5.2: OpenAI meluncurkan seri model GPT-5.2 (Pro, Thinking, Instant) untuk bersaing dengan Gemini 3 dari Google. GPT-5.2 mencetak rekor baru dalam benchmark teka-teki visual abstrak seperti ARC-AGI-1 dan ARC-AGI-2, dengan efisiensi komputasi yang meningkat signifikan (biaya turun hingga 1/390 dari GPT-5.1). Model ini menawarkan tingkat reasoning yang bisa disesuaikan (termasuk x-high) dan dukungan ringkasan konteks untuk memperluas batas input. Peluncuran ini bertujuan meningkatkan efisiensi tugas profesional seperti generasi kode, pembuatan spreadsheet/presentasi, serta meningkatkan kelayakan ekonomi untuk tugas reasoning kompleks. (Sumber: DeepLearning.AI Blog)

Model AI Pecahkan Masalah Matematika Terbuka: GPT-5 berhasil memecahkan masalah matematika terbuka di benchmark IMProofBench secara mandiri—tanpa intervensi manusia—dengan bukti yang lengkap dan benar. Ini merupakan kontribusi kecil namun baru dalam geometri enumeratif, menandai kemajuan signifikan dalam kemampuan reasoning matematika kompleks. Pencapaian ini memicu diskusi tentang potensi AI dalam penelitian matematika dan perannya di bidang ilmiah lainnya. (Sumber: SebastienBubeck, kevinweil, gdb, OfirPress, SebastienBubeck)

Meta Perkenalkan SAM Audio: Meta meluncurkan SAM Audio, model AI terpadu pertama yang memungkinkan isolasi dan editing suara dari campuran audio kompleks. Dengan prompt teks, visual, atau rentang waktu, model ini bisa memisahkan gitar dari lagu, menyaring noise lalu lintas, atau menghilangkan gonggongan anjing dari podcast—seperti “Photoshop untuk audio”. Inovasi ini berpotensi merevolusi alur kerja editing audio, membuatnya semudah mengedit teks/gambar, sekaligus menurunkan hambatan pengetahuan teknis untuk produksi konten audio. (Sumber: ylecun, ylecun, dotey)
🎯 Tren
Yunpeng Tech Luncurkan Produk AI+Kesehatan: Kolaborasi Yunpeng Tech dengan Shuaikang dan Skyworth menghasilkan produk AI+kesehatan seperti “Lab Dapur Masa Depan Digital” dan kulkas pintar dengan model AI “Asisten Kesehatan Xiao Yun”. Model ini mengoptimalkan desain/operasional dapur dan menawarkan manajemen kesehatan personal, menandai perluasan AI di perangkat rumah tangga untuk layanan kesehatan sehari-hari. (Sumber: 36Kr)

Industri Robot Humanoid Hadapi Kendala Produksi: Industri robot humanoid pada 2025 menghadapi kenyataan pahit—nilai pesanan >¥3.5 miliar tapi pengiriman <1.000 unit, menyoroti ketimpangan permintaan dan kapasitas produksi. Perusahaan seperti Zhiyuan dan Ubtech kesulitan menaikkan produksi dari ratusan ke ribuan unit, sementara pasar konsumen terbentur harga tinggi dan kegunaan terbatas. Meski didukung kebijakan dan modal, industri ini masih dalam fase transisi dari “proof-of-concept” ke produk komersial yang andal. (Sumber: 36Kr, 36Kr)

Transformasi AI Meitu dan Tantangannya: Meitu fokus kembali ke produk tools seperti Meitu Xiuxiu dan Meiyan Camera, serta alat produktivitas B2B (Meitu Design Studio, Kaipai). Platform AI Agent-nya, RoboNeo, mengintegrasikan model pihak ketiga dan Miracle Vision buatannya untuk menggabungkan generasi AI dengan penyempurnaan manual. Namun, retensi pengguna RoboNeo rendah, terutama di pasar B2B global yang semakin kompetitif. Dengan basis 200 juta MAU, Meitu masih berpeluang di ceruk SaaS vertikal melalui inovasi produk. (Sumber: 36Kr)

Xiaomi Buka Sumber Model MiMo-V2-Flash: Xiaomi merilis model open-source MiMo-V2-Flash (309B parameter) dengan akselerasi reasoning 2.6x, mencetak skor 73.4% di SWE-Bench Verified—ungguli DeepSeek-V3.2 dan Kimi-K2 Thinking. Model ini menggunakan mekanisme hybrid attention 5:1, MTP (Multi-layer Token Prediction), dan MOPD (Multi-teacher Online Policy Distillation) untuk efisiensi dan pemahaman teks panjang. Kemampuannya dalam pemrograman dan interaksi manusiawi memperkuat ambisi Xiaomi menuju “AGI dunia fisik”. (Sumber: 36Kr)

Restrukturisasi Tim AI Tencent: Tencent mengangkat mantan peneliti OpenAI, Yao Shunyu, sebagai Chief AI Scientist di kantor CEO/presiden, bertanggung jawab langsung ke presiden Martin Lau dan memimpin departemen AI Infra & LLM. Langkah ini memperkuat posisi strategis AI di Tencent untuk bersaing dengan ByteDance dan Alibaba di bidang model dasar dan aplikasi AI. (Sumber: 36Kr, 36Kr, 36Kr)