Kata Kunci:Model AI, Mengemudi mandiri, Multimodal, GLM-4.7, Alpamayo, Qwen3-VL
🔥 Fokus
Zhipu AI resmi melantai di HKEX, memulai era IPO model besar : Pada 8 Januari 2026, Zhipu AI resmi terdaftar di HKEX, menjadi saham model besar pertama di dunia, dengan MiniMax menyusul di belakangnya. Tang Jie mengungkapkan dalam surat internal bahwa setelah perilisan model unggulan GLM-4.7, pendapatan tahunan MaaS (ARR) tumbuh 25 kali lipat dalam 10 bulan, melampaui 500 juta RMB. Peristiwa ini menandai transisi model besar China dari “mengejar teknologi” menjadi “loop tertutup komersial”. IPO ini akan membuka jalur bagi model domestik ke pasar global dan mendapatkan penilaian nilai internasional yang lebih adil (Sumber: Zai_org)

Stanford merilis SleepFM: Memprediksi lebih dari 100 risiko kesehatan melalui satu malam tidur : Peneliti Universitas Stanford meluncurkan model AI multimodal SleepFM, yang dilatih berdasarkan lebih dari 585.000 jam data tidur. Dengan menganalisis gelombang otak (EEG), detak jantung, dan laju pernapasan, model ini dapat memprediksi risiko lebih dari 130 penyakit, termasuk demensia, penyakit jantung, dan kanker tertentu, dari rekaman satu malam. Terobosan ini menunjukkan potensi besar AI dalam bidang kedokteran preventif, mengubah perangkat pemantauan tidur menjadi alat diagnostik yang kuat (Sumber: Reddit)

NVIDIA open-source Alpamayo: Model autonomous driving pertama dengan kemampuan penalaran : NVIDIA telah meng-open-source-kan Alpamayo, model autonomous driving pertama yang berbasis penalaran Chain of Thought (CoT). Berbeda dengan sistem tradisional yang hanya mengandalkan reaksi, Alpamayo dapat berpikir logis seperti pengemudi manusia dalam skenario kompleks atau langka. Dikombinasikan dengan “AI Factory” dari arsitektur Vera Rubin, NVIDIA mendorong AI dari ranah digital murni ke Physical AI, mencakup alat simulasi dan modul edge computing, serta membentuk kembali standar autonomous driving tingkat industri (Sumber: TheTuringPost)

LMArena meraih pendanaan $150 juta, evaluasi AI menjadi infrastruktur inti : Arena model AI ternama, LMArena, menyelesaikan pendanaan sebesar $150 juta dengan valuasi $1,7 miliar. Pendanaan besar ini menunjukkan bahwa di tengah kemunculan model yang terus-menerus, sistem evaluasi yang objektif dan tepercaya bukan lagi sekadar alat bantu, melainkan infrastruktur inti dari ekosistem AI. Kapitalisasi kemampuan evaluasi ini menandakan industri beralih dari “ekspansi buta” ke “berbasis kualitas”, sekaligus memicu diskusi luas di komunitas mengenai valuasinya yang tinggi (Sumber: nearcyan)

🎯 Tren
AI21 Labs merilis seri Jamba 2: Arsitektur hybrid SSM-Transformer untuk level enterprise : AI21 meluncurkan Jamba2 3B dan Jamba2 Mini (total parameter 52B, 12B aktif). Seri ini mengadopsi arsitektur hybrid SSM-Transformer dengan konteks super panjang 256K, dan menunjukkan performa luar biasa pada benchmark instruksi seperti IFEval. Keunggulan utamanya terletak pada throughput tinggi dan efisiensi memori, sangat cocok untuk memproses dokumen panjang dan workflow Agent tingkat enterprise yang membutuhkan keandalan tinggi (Sumber: Reddit)

Alibaba open-source model retrieval multimodal Qwen3-VL: Mendorong SOTA pemahaman lintas moda : Alibaba merilis model Qwen3-VL-Embedding dan Reranker, yang mendukung input moda campuran seperti teks, gambar, dan video. Model ini unggul dalam multimodal RAG, visual QA, dan pencarian lintas bahasa, mendukung lebih dari 30 bahasa. Arsitektur retrieval dua tahap ini (generasi vektor + scoring halus) secara signifikan meningkatkan akurasi pencarian konten visual yang kompleks, memberikan dukungan dasar yang kuat untuk aplikasi AI multimodal (Sumber: Alibaba_Qwen)

NVIDIA merilis Nemotron Speech ASR: Open-source pengenalan suara dengan latensi ultra-rendah : NVIDIA merilis model Nemotron Speech ASR yang dirancang khusus untuk Voice Agent, mencapai waktu penyelesaian transkripsi 24ms dan latensi interaksi suara end-to-end di bawah 500ms. Model ini sepenuhnya open-source, termasuk bobot, kode, dan data pelatihan. Jensen Huang menekankan di CES bahwa model open-source akan sepenuhnya mengejar model closed-source tahun ini, dan NVIDIA mendorong proses ini dengan merilis alat dasar berkinerja tinggi (Sumber: NerdyRodent)
DeepSeek memperbarui paper R1: Dari 22 halaman diperluas secara signifikan menjadi 86 halaman : DeepSeek memperbarui paper model R1 yang monumental, menambahkan banyak informasi mendalam tentang detail pelatihan dan desain arsitektur. Meskipun sebagian konten telah diungkapkan dalam paper Nature sebelumnya, pembaruan ini semakin memperkuat kepemimpinan teknis DeepSeek di komunitas open-source. Komunitas memperhatikan stabilitas daftar penulisnya serta pengalaman optimasi berkelanjutan pada arsitektur MLA (Sumber: teortaxesTex)

Google membawa Gmail ke era Gemini 3: Menghadirkan asisten inbox proaktif : Google mengumumkan integrasi penuh Gemini 3 ke dalam Gmail, mengubahnya dari alat email sederhana menjadi asisten inbox yang proaktif. Fitur baru mencakup pengelolaan jadwal hidup yang cerdas, ringkasan otomatis rantai email yang kompleks, dan pengingat proaktif berdasarkan konteks. Ini menandai model besar yang tertanam dalam workflow produktivitas dari bentuk “kotak dialog”, mewujudkan manajemen data pribadi yang cerdas (Sumber: GoogleDeepMind)
🧰 Alat
VideoRAG/Vimo: Aplikasi desktop open-source yang mendukung dialog video durasi sangat panjang : Tim HKUDS dari Universitas Hong Kong merilis VideoRAG dan versi desktopnya, Vimo, yang mendukung dialog dengan video berdurasi hingga ratusan jam. Alat ini menggunakan pengindeksan pengetahuan berbasis grafis dan pengkodean konteks hierarkis untuk mengambil adegan video secara akurat dan menjawab pertanyaan. Ini memecahkan masalah tekanan memori video dan diskontinuitas pemahaman pada model multimodal tradisional saat memproses video panjang, dan dapat dijalankan pada satu kartu RTX 3090 (Sumber: GitHub)

memU: Infrastruktur memori hierarkis untuk AI Agent : NevaMind-AI meng-open-source-kan memU, sebuah sistem memori yang dirancang untuk LLM dan Agent. Sistem ini meniru file system, mengorganisir data mentah, item memori diskrit, dan kategori agregat ke dalam tiga lapisan, mendukung retrieval vektor RAG dan retrieval semantik LLM. Sistem ini secara otomatis mengekstrak preferensi, keterampilan, dan fakta dari percakapan, mewujudkan evolusi mandiri memori, dan secara signifikan meningkatkan kontinuitas Agent dalam menangani tugas jangka panjang (Sumber: GitHub)

Maid: Aplikasi open-source untuk menjalankan model AI secara offline di ponsel : Maid adalah aplikasi open-source yang mendukung pengoperasian LLM secara lokal di perangkat seluler, sangat cocok untuk skenario tanpa internet atau dengan persyaratan privasi yang sangat tinggi. Aplikasi ini menyederhanakan proses deployment model di ponsel, memungkinkan pengguna untuk langsung mengunduh model dengan berbagai ukuran untuk berdialog. Ini menyediakan solusi seluler dengan hambatan rendah untuk edge computing dan popularitas AI (Sumber: Reddit)
Integrasi mendalam Claude Code dengan Replit: Paradigma baru pemrograman Agent berbasis cloud : Pengembang berbagi pengalaman praktis menggabungkan Claude Code dengan Replit, menekankan keunggulan editor cloud dalam mengatasi masalah konfigurasi lingkungan. Dengan menjalankan Claude Code di dalam Replit, pengembangan dapat dilakukan dengan mengontrol beberapa Agent secara paralel dari ponsel. Mode “generate and go-live” ini mengubah logika pengiriman perangkat lunak, memungkinkan pengembang non-profesional untuk membangun aplikasi kompleks dengan cepat (Sumber: amasad)
📚 Pembelajaran
MAGMA: Arsitektur memori jangka panjang Agent berbasis struktur multi-graph : Menanggapi masalah keterikatan informasi dalam penalaran jangka panjang pada RAG tradisional, penelitian baru mengusulkan arsitektur MAGMA. Arsitektur ini menyimpan memori dalam empat grafis ortogonal: semantik, temporal, kausal, dan entitas, serta melakukan pengambilan melalui penelusuran grafis yang dipandu oleh strategi. Metode ini memisahkan representasi memori dari logika pengambilan, secara signifikan meningkatkan akurasi Agent saat menangani hubungan kausal dan urutan peristiwa yang kompleks (Sumber: dair_ai)

Agentic Rubrics: Metode validasi SWE Agent tanpa eksekusi kode : Validasi adalah kunci dari Reinforcement Learning. Peneliti mengusulkan “Agentic Rubrics”, di mana Expert Agent menghasilkan checklist spesifik untuk codebase melalui interaksi, dan langsung memberikan skor pada patch kandidat tanpa perlu pengaturan lingkungan yang kompleks dan eksekusi kode. Dalam pengujian SWE-Bench, metode ini secara signifikan meningkatkan efisiensi dan akurasi validasi, memberikan sinyal umpan balik yang lebih ringan untuk pelatihan Agent skala besar (Sumber: arXiv)
Klear: Arsitektur terpadu untuk pembuatan audio-visual bersama : Untuk mengatasi masalah ketidaksinkronan audio-visual dan penyelarasan bibir yang buruk, Klear memperkenalkan desain single-tower dan blok DiT terpadu, dikombinasikan dengan strategi pelatihan masker moda acak. Dengan membangun dataset audio-visual skala besar dengan anotasi padat, Klear mencapai kualitas generasi yang sangat tinggi sambil menjaga konsistensi semantik, dengan performa yang sebanding dengan Veo 3 dari Google, memberikan jalur baru untuk sintesis multimodal (Sumber: arXiv)
Entropy-Adaptive Fine-Tuning (EAFT): Mengatasi catastrophic forgetting dalam SFT : Paper ini menunjukkan bahwa Supervised Fine-Tuning (SFT) sering menyebabkan “konflik kepercayaan” karena memaksa model menyesuaikan diri dengan pengawasan eksternal. EAFT menggunakan entropi tingkat token sebagai mekanisme gating untuk membedakan antara ketidakpastian epistemik dan konflik pengetahuan, memungkinkan model untuk mempelajari sampel yang tidak pasti sambil menekan pembaruan gradien dari data yang berkonflik. Eksperimen membuktikan bahwa metode ini secara efektif memitigasi degradasi kemampuan umum sambil mempertahankan performa tugas downstream (Sumber: arXiv)
Atlas: Orkestrasi model heterogen dan alat untuk penalaran kompleks lintas domain : Seiring dengan diversifikasi LLM dan alat, memilih kombinasi terbaik menjadi tantangan. Atlas mengusulkan kerangka kerja jalur ganda: routing bebas pelatihan berbasis clustering untuk penyelarasan dalam domain, dan routing multi-langkah berbasis Reinforcement Learning untuk generalisasi di luar distribusi. Kerangka kerja ini melampaui GPT-4o dalam 15 benchmark, menunjukkan kemampuan kuat dalam menyelesaikan masalah kompleks melalui orkestrasi alat multimodal khusus (Sumber: arXiv)
💼 Bisnis
Manus diakuisisi oleh Meta, ARR melampaui $125 juta dalam 8 bulan : Startup Task Execution Agent, Manus, mengungkapkan bahwa ARR-nya telah mencapai $125 juta menjelang akuisisi oleh Meta senilai $2 miliar. Produk ini mencapai angka seratus juta hanya dalam 8 bulan setelah peluncuran, dengan pertumbuhan bulanan (MoM) lebih dari 20%. Ini mencerminkan perubahan logika bisnis AI: pengguna tidak lagi membayar untuk “kemampuan”, melainkan untuk “hasil” dan “penyelesaian tugas” (Sumber: 36氪)

Boltz menyelesaikan pendanaan seed round $28 juta dan menjalin kemitraan dengan Pfizer : Startup AI bioteknologi Boltz mengumumkan pendirian Boltz PBC dan meraih pendanaan $28 juta, sekaligus meluncurkan platform Boltz Lab. Platform ini mencakup Agent khusus untuk desain molekul kecil dan protein, serta menandatangani perjanjian kerja sama multitahun dengan raksasa farmasi Pfizer. Ini menandai percepatan komersialisasi AI Agent di bidang ilmiah yang ketat seperti pengembangan obat (Sumber: sarahcat21)
Infrastruktur komputasi China memasuki “Era Sepuluh Ribu P”, proyek bernilai ratusan juta melampaui 222 pada tahun 2025 : Pembangunan pusat komputasi cerdas domestik terus memanas, dengan operator menjadi kekuatan utama. Pada tahun 2025, terdapat lebih dari 222 proyek pemenang tender dengan nilai di atas 100 juta RMB, dan klaster sepuluh ribu kartu menjadi standar. Tren menunjukkan bahwa permintaan daya komputasi inferensi meningkat pesat, teknologi pendingin cair berubah dari opsional menjadi wajib, dan industri sedang memecahkan masalah tingkat pemanfaatan melalui model “pembangunan berbasis aplikasi” (Sumber: 36氪)

🌟 Komunitas
PHK 75% di Tailwind memicu diskusi hangat: AI menyebabkan penurunan traffic dokumentasi dan pendapatan : Framework CSS ternama, Tailwind, terpaksa melakukan PHK setelah traffic situs resminya turun 40% dan pendapatan produk berbayar merosot tajam akibat AI Agent yang secara luas mengambil data dokumentasinya. Hal ini memicu kekhawatiran mendalam di komunitas tentang “parasitisme AI” pada ekosistem open-source: ketika AI langsung memberikan jawaban, bagaimana model bisnis proyek open-source dapat bertahan? (Sumber: aiamblichus)

Konteks 1 juta token adalah jebakan? Komunitas mendiskusikan efek “Lost in the Middle” : Pengujian pengembang menemukan bahwa meskipun model mengklaim mendukung jutaan konteks, tingkat recall di bagian tengah menurun secara signifikan saat memproses data di atas 100.000 token. Komunitas menyarankan strategi “dua langkah”: pengindeksan untuk lokasi terlebih dahulu, baru kemudian input yang ditargetkan. Ini menunjukkan bahwa kebersihan data dan strategi retrieval lebih penting daripada sekadar mengejar jendela konteks yang panjang (Sumber: Reddit)
Vibe Coding menjadi tren pengembangan baru: Dari menulis kode menjadi “mengatur vibe” : Komunitas mendiskusikan “Vibe Coding”, yaitu penggunaan bahasa alami dan Agent untuk pengembangan non-deterministik. Pendukung percaya ini menurunkan hambatan masuk, sementara penentang khawatir akan menghasilkan banyak “sampah kode” yang tidak dapat dipelihara. Institusi seperti Datawhale telah merilis tutorial sistematis terkait untuk membantu pengembang beralih dari Demo ke pengembangan program AI-native (Sumber: dotey)

Batas pendampingan AI: Kekhawatiran etika atas outsourcing nilai emosional : Seiring dengan pasar AI pendamping yang melampaui 100 miliar, masyarakat mulai meninjau potensi risikonya. Interaksi “rendah konflik, kontrol tinggi” yang diberikan AI dapat melemahkan kemampuan manusia dalam menangani hubungan nyata, bahkan memicu “ikatan delusi bersama”. Para ahli menyerukan agar AI berfungsi sebagai pelengkap emosional, bukan pengganti hubungan manusia (Sumber: 36氪)
💡 Lainnya
Petani China menggunakan radar AESA untuk mengendalikan babi hutan : Dengan teknologi radar phased array yang menjadi murah dan tersedia secara sipil di China, petani mulai menggunakan radar AESA bersama drone untuk mendeteksi gangguan babi hutan. Kasus ini menunjukkan pemandangan unik di mana teknologi militer canggih digunakan untuk mengatasi masalah sipil, serta mencerminkan keunggulan kapasitas produksi China di bidang semikonduktor GaN (Sumber: teortaxesTex)

Fisik chip “cokelat” Cerebras terungkap: Ketebalan yang mengejutkan : Pengembang memamerkan foto fisik chip AI seukuran wafer dari Cerebras, di mana volume besar dan ketebalannya yang luar biasa menarik perhatian. Sebagai chip tunggal terbesar di dunia, ia mewakili eksplorasi batas fisik perangkat keras komputasi dalam mengejar performa ekstrem (Sumber: dylan522p)

Seluruh tim perlindungan data Debian mengundurkan diri, kepatuhan GDPR menghadapi tantangan : Tim perlindungan data Debian yang telah berdiri selama 7 tahun mengundurkan diri secara kolektif karena keterbatasan energi, dan saat ini tidak ada yang mengambil alih. Hal ini mengungkap kerentanan komunitas open-source dalam menghadapi regulasi privasi yang ketat (seperti GDPR). Hilangnya “fondasi tak terlihat” ini dapat berdampak pada seluruh rantai ekosistem Linux (Sumber: 36氪)