Berita AI – 2025-12-31(Edisi pagi)

Kata Kunci:Agen Kecerdasan Buatan, Akuisisi Meta, NVIDIA, Agen Umum Manus, Model 4D-RGPT, Pelatihan Saat Pengujian TTT

🔥 Fokus

Meta mengakuisisi startup AI agent Manus AI senilai miliaran dolar: Meta mengumumkan akuisisi Manus, sebuah perusahaan AI agent general-purpose yang baru berdiri sembilan bulan. Manus menjadi viral sebagai “AI agent general-purpose pertama di dunia”. Tanpa memiliki model sendiri, Manus berhasil mencapai pertumbuhan ARR yang mengejutkan sebesar $100 juta dalam 8 bulan berkat kemampuan engineering yang luar biasa dan pemahaman mendalam terhadap kebutuhan pengguna. Akuisisi ini dipandang sebagai strategi “membeli waktu” bagi Meta di lapisan aplikasi AI, yang bertujuan untuk menutupi kelemahannya dalam kemampuan eksekusi tugas kompleks secara otonom. Manus akan tetap beroperasi secara independen, dan pendirinya, Xiao Hong, akan menjabat sebagai Vice President di Meta. Ini menandai pergeseran fokus kompetisi AI dari skala parameter model ke kemampuan eksekusi skala besar dalam skenario nyata (Sumber: Reuters, X)

Meta收购Manus

Stanford University merilis teknologi baru End-to-End Test-Time Training (TTT): Tim peneliti mengusulkan metode “End-to-End Test-Time Training” yang bertujuan untuk mengaburkan batas antara training dan inference. Teknologi ini memungkinkan model untuk terus belajar melalui konteks yang diberikan selama fase inference, menggunakan target next-token prediction untuk mengompresi konteks masif ke dalam weight. Terobosan ini secara efektif mengatasi hambatan efisiensi dalam pemrosesan teks panjang, memberikan kemungkinan penalaran kompleks dalam lingkungan konteks super panjang untuk teknologi AI agent dan robotika, serta merupakan langkah penting menuju Continual Learning (Sumber: Stanford, X)

TTT技术图示

NVIDIA merilis 4D-RGPT: Meningkatkan persepsi AI terhadap perubahan ruang-waktu: Menanggapi tantangan AI dalam memahami struktur 3D dan perubahan waktu, NVIDIA meluncurkan model multimodal besar khusus bernama 4D-RGPT. Model ini secara signifikan mengungguli model baseline dalam pengujian 3D/4D dengan mempersepsikan informasi 4D (ruang + waktu). Selain itu, NVIDIA memperkenalkan metode pelatihan “Perception 4D Distillation (P4D)” yang mampu mentransfer pengetahuan dari model pakar yang kuat ke model ringan tanpa menambah biaya inference, secara signifikan meningkatkan pemahaman robot dalam lingkungan dinamis (Sumber: X)

4D-RGPT技术展示

🎯 Tren

Beranda YouTube dipenuhi “AI Slop” yang memicu kekhawatiran: Laporan terbaru menunjukkan bahwa lebih dari 20% video yang direkomendasikan YouTube kepada pengguna baru diidentifikasi sebagai “AI Slop” (konten sampah AI). Konten ini biasanya terdiri dari suara buatan AI, visual yang aneh, dan skrip berulang, yang dirancang untuk mengeksploitasi celah algoritma demi mendapatkan traffic. Beberapa channel meraup jutaan dolar setiap tahun melalui produksi otomatis berkualitas rendah ini. Hal ini mencerminkan dampak negatif dari teknologi AI di bidang pembuatan konten, memaksa platform untuk meninjau kembali keseimbangan antara mekanisme rekomendasi algoritma dan kualitas konten (Sumber: TheRundownAI, Reddit)

AI垃圾内容分析

DeepSeek diam-diam meluncurkan fitur voice-to-text: DeepSeek secara diam-diam memperbarui fitur input suara di aplikasinya. Pengujian menunjukkan bahwa fitur ini sangat kuat dalam mengenali input bahasa campuran (code-switching) dan memiliki kecepatan respons yang sangat cepat, mampu menangani peralihan atau transkripsi antar bahasa yang berbeda secara akurat. Ini menunjukkan bahwa DeepSeek terus memperluas kemampuan interaksi multimodal untuk meningkatkan efisiensi input dan pengalaman pengguna seluler (Sumber: X)

DeepSeek语音功能截图

Meta meluncurkan pelatihan AI Co-Scientist dengan “Reward Models”: Meta Superintelligence Lab merilis makalah yang memperkenalkan metode ekstraksi otomatis tujuan penelitian dan metrik penilaian (Rubric) dari literatur ilmiah skala besar, menggunakan Reinforcement Learning (RL) untuk melatih AI dalam menghasilkan rencana penelitian. Studi menemukan bahwa bahkan di bidang yang tidak memungkinkan umpan balik eksperimen fisik (seperti kedokteran), kesenjangan “generation-verification” ini dapat secara signifikan meningkatkan kualitas rencana yang dihasilkan AI. Pakar manusia lebih menyukai rencana yang dihasilkan oleh model yang telah di-fine-tune dalam 70% kasus, menunjukkan potensi besar AI dalam mempercepat penemuan ilmiah (Sumber: HuggingFace, X)

AI科学家训练流程

Alibaba merilis pembaruan model video Wan2.6: Versi Wan2.6 meningkatkan konsistensi karakter dan dukungan skrip storyboard bahasa alami. Versi baru ini mendukung pembuatan video HD 1080p berdurasi 15 detik, serta sinkronisasi audio-visual dan adegan dialog multi-karakter yang stabil. Keunggulan utamanya terletak pada konsistensi gambar tingkat komersial, memastikan karakter, gaya, dan elemen visual tetap seragam dalam narasi multi-shot, memenuhi kebutuhan kreasi profesional (Sumber: X)

🧰 Alat

Qwen Code v0.6.0 resmi dirilis: Pembaruan ini memperkenalkan fitur eksperimental “Skills” untuk memperluas kemampuan model, dan melakukan optimasi mendalam pada plugin VS Code, termasuk output panggilan alat bash yang dapat diklik. Selain itu, versi baru menambahkan perintah /compress dan /summary, serta mendukung akses multi-vendor seperti Gemini dan Anthropic. Versi ini secara signifikan meningkatkan kompatibilitas Windows dan stabilitas pengujian, menjadikannya alat yang kuat bagi pengembang untuk pemrograman berbantuan AI (Sumber: GitHub)

LLMRouter: Library routing LLM terpadu pertama yang open-source: Library ini mengintegrasikan lebih dari 16 algoritma routing SOTA, yang dirancang untuk secara otomatis memilih model yang paling sesuai berdasarkan kompleksitas kueri (misalnya, merutekan pertanyaan sederhana ke model murah, dan pertanyaan kompleks ke model kuat). Pengembang mengklaim ini dapat menghemat biaya inference sebesar 30-50% tanpa mengorbankan kualitas. Library ini mencakup berbagai mode routing seperti single-turn, multi-turn, agentic, dan personalisasi, serta menyediakan toolchain benchmarking yang lengkap (Sumber: X)

OpenEnv: Meta dan Hugging Face bekerja sama membangun standar lingkungan AI agent: OpenEnv bertujuan untuk memberikan spesifikasi seragam bagi lingkungan AI agent, mewujudkan prinsip “build once, run anywhere”. Ini mendukung penggunaan konfigurasi lingkungan yang sama selama fase training (menggunakan TRL, Unsloth, dll.) dan inference, serta menyertakan dukungan bawaan untuk alat MCP (Model Context Protocol). Peluncuran standar ini akan sangat menyederhanakan proses pengembangan dan penyebaran AI agent, serta mendorong interoperabilitas ekosistem (Sumber: X)

OpenEnv展示

Situs web resmi vLLM resmi diluncurkan: Sebagai salah satu framework inference LLM paling populer saat ini, vLLM meluncurkan situs web independen. Situs ini menyediakan pemilih instalasi interaktif (untuk berbagai lingkungan GPU/CPU), kalender acara komunitas, serta dokumentasi dan panduan konfigurasi terpusat. Langkah ini bertujuan untuk memisahkan logika proyek dari kode, sehingga repositori GitHub dapat lebih fokus pada pengembangan inti, sekaligus meningkatkan pengalaman on-boarding bagi pengguna komunitas (Sumber: vllm.ai, X)

vLLM官网截图

📚 Pembelajaran

Tutorial II “Physics of Language Models” dirilis: Zeyuan Allen-Zhu merilis tutorial terbaru dalam seri ini, yang berfokus pada mengapa hasil eksperimen skala besar sering kali mengandung noise, dan bagaimana menghilangkan gangguan tersebut pada tingkat desain. Tutorial ini menjelaskan secara mendalam cara merancang tugas pre-training sintetik yang murni, dan membuktikan bahwa model skala 100M (seperti GPT2-small) terkadang dapat mengungkapkan kebenaran arsitektur lebih andal daripada model 8B (Sumber: X)

教程封面

Daftar 6 pola desain utama Agentic AI: Ringkasan diskusi komunitas mengenai enam pola inti pengembangan AI agent saat ini, termasuk planning, reflection, tool use, kolaborasi multi-agent, dan lainnya. Pola-pola ini memberikan panduan metodologi untuk membangun aplikasi AI yang kompleks dan tangguh, membantu pengembang melampaui logika chatbot sederhana untuk membangun sistem yang benar-benar memiliki kemampuan penyelesaian tugas (Sumber: X)

设计模式图示

Makna geometris One-Hot Encoding dalam tugas klasifikasi: LearnOpenCV berbagi tentang bagaimana metode pengkodean memengaruhi pembelajaran model dalam tugas klasifikasi. Dibandingkan dengan label numerik sederhana (yang mungkin menyebabkan model salah mengira adanya hubungan jarak antar kategori), One-Hot Encoding memastikan semua kategori berjarak sama dalam ruang geometris, sehingga memberikan sinyal error yang adil dan meningkatkan efektivitas pelatihan (Sumber: X)

💼 Bisnis

UBTECH berencana mengakuisisi saham pengendali Fenglong senilai 1,665 miliar RMB untuk membangun platform pembiayaan “A+H”: Pemimpin robot humanoid UBTECH mengumumkan rencana untuk memperoleh kendali atas perusahaan publik A-share Fenglong melalui transfer perjanjian dan penawaran tender. Langkah ini dimaksudkan untuk membuka saluran pembiayaan RMB dan memanfaatkan akumulasi Fenglong di bidang manufaktur presisi guna membangun fondasi rantai pasokan bagi produksi massal robot humanoid. Meskipun UBTECH saat ini masih mengalami kerugian besar, pertaruhan besar ini menunjukkan ambisinya untuk mengamankan kepastian menjelang komersialisasi (Sumber: 36氪)

SoftBank menyelesaikan komitmen suntikan dana $40 miliar ke OpenAI: SoftBank membayar $22 miliar terakhir minggu lalu, menyelesaikan total investasi $40 miliar di OpenAI, dengan kepemilikan saham sekarang melebihi 10%. Selain itu, SoftBank setuju untuk mengakuisisi perusahaan investasi pusat data DigitalBridge senilai $4 miliar, menunjukkan ekspansi agresif Masayoshi Son di bidang infrastruktur AI (Sumber: X, CNBC)

软银投资动态

Zhipu AI (Z.ai) akan melakukan IPO di Hong Kong pada 8 Januari 2026: Zhipu AI mengumumkan akan resmi melantai di bursa awal tahun depan, menjadi perusahaan AI pertama di dunia dengan model AGI sebagai bisnis inti yang melakukan IPO. IPO ini menandai masuknya perusahaan model besar domestik ke periode panen modal, di mana kemajuan komersialisasi dan iterasi teknologi model seri GLM-nya akan menghadapi pengujian langsung dari pasar sekunder (Sumber: X)

智谱AI上市海报

🌟 Komunitas

“Vibe Coding” memicu diskusi hangat di kalangan pengembang: Komunitas mendiskusikan “Vibe Coding”, di mana pengembang tidak lagi menulis kode secara manual, melainkan membangun aplikasi dengan cepat melalui dialog dengan AI (seperti menggunakan Claude Code, Cursor). Pendukung percaya ini sangat meningkatkan kreativitas, bahkan memungkinkan non-profesional untuk meluncurkan produk kompleks dalam hitungan jam; sementara kritikus khawatir ini dapat menyebabkan pengabaian logika dasar, berpendapat bahwa keahlian engineering yang mendalam tetap sangat diperlukan saat menangani edge cases (Sumber: X, Reddit)

AI “sengaja dibuat lebih buruk” untuk mendapatkan kepercayaan manusia: Diskusi media sosial menunjukkan bahwa generasi baru model AI image generation (seperti Nano Banana) mulai sengaja meniru cacat fotografi ponsel, seperti over-sharpening, noise, dan pencahayaan yang datar. “Ketidaksempurnaan” ini justru membuat gambar terlihat lebih seperti jepretan manusia asli, sehingga menghindari “Uncanny Valley effect”. Strategi ini juga terlihat pada chatbot, di mana AI belajar untuk ragu-ragu dan berempati, membangun koneksi emosional yang lebih dalam dengan menunjukkan “kerentanan” buatan (Sumber: 36氪)

AI拟真策略分析

Bill Ackman mengusulkan penutupan celah pajak “pinjaman untuk menghindari pajak”: Miliarder Ackman mengusulkan agar pinjaman dengan jaminan saham dikenakan pajak sebagai “penjualan yang dianggap terjadi”. Saat ini, orang kaya memperoleh likuiditas melalui pinjaman alih-alih menjual saham, sehingga menghindari pajak capital gain. Proposal tersebut telah memicu diskusi luas tentang keadilan kekayaan dan risiko keuangan sistemik, dan dianggap sebagai reformasi yang lebih elegan dan mudah dioperasikan daripada pajak kekayaan (Sumber: X)

💡 Lainnya

Finlandia mengubah panas limbah pusat data menjadi pemanas kota: Sebuah proyek inovatif di Finlandia menunjukkan bagaimana panas yang dihasilkan oleh pusat data dapat didaur ulang dan digunakan untuk memanaskan seluruh blok pemukiman. Ini memberikan model pembangunan berkelanjutan untuk mengatasi masalah konsumsi energi yang disebabkan oleh pertumbuhan permintaan komputasi AI, mewujudkan sinergi antara infrastruktur teknologi dan sistem energi perkotaan (Sumber: X)

Gigi hasil laboratorium mungkin menjadi alternatif penambalan gigi: Penelitian teknologi kesehatan terbaru menunjukkan bahwa jaringan gigi yang ditumbuhkan di laboratorium mungkin dapat menggantikan tambalan gigi tradisional di masa depan. Selain itu, alat pacu jantung mini yang dapat disuntikkan dan dapat larut setelah menjalankan fungsinya juga telah muncul, menunjukkan hasil mutakhir dari kombinasi bioteknologi dan teknologi miniaturisasi (Sumber: X)