Berita AI – 2026-02-10

Kata Kunci:Agen Kecerdasan Buatan, Model Sumber Terbuka, Transformasi SaaS, Informasi Palsu OpenClaw, GPT-5.3-Codex, Perang Pikiran Iklan AI

🔥 Fokus

Runtuhnya “Mitos” OpenClaw dan Moltbook: OpenClaw (sebelumnya Moltbot), AI Agent open-source yang viral di awal 2026, beserta jejaring sosial turunannya, Moltbook, mengalami pembalikan reputasi. Meskipun GitHub Stars-nya menembus 170.000 dan dijuluki sebagai “iPhone Moment” bagi AI, MIT Technology Review mengonfirmasi bahwa banyak postingan “AI Awakening” di Moltbook adalah rekayasa manusia. Fenomena ini pada dasarnya adalah jebakan phishing dan pemasaran yang dibungkus dengan gimmick AI. Insiden ini mengungkap kegamangan komunitas AI dalam mengejar narasi “otonomi”, serta memperingatkan para developer untuk waspada terhadap kekosongan keamanan dan etika akibat hype berlebihan pada “Agent Engineering” (Sumber: pmddomingos)

Konfirmasi Informasi Palsu Moltbook

Pembantaian Industri Perangkat Lunak: Model SaaS Terhantam Agent: Seiring dengan perilisan plugin Claude Cowork oleh Anthropic dan dorongan kuat OpenAI pada Codex, nilai pasar saham software global menguap hampir satu triliun dolar baru-baru ini. Inti dari kepanikan pasar adalah: ketika AI Agent mampu melakukan tugas kompleks seperti riset, akuntansi, dan kepatuhan secara mandiri lintas sistem, logika “seat fee” yang diandalkan SaaS tradisional runtuh total. Goldman Sachs telah mulai menggunakan Claude untuk mengotomatisasi posisi akuntansi, menandai pergeseran nilai software dari “menyediakan alat” menjadi “memberikan hasil”. “SaaSpocalypse” ini memprediksi bahwa software tradisional harus bertransformasi menjadi platform Agent-native, atau berisiko menjadi gudang data tanpa jiwa (Sumber: 新智元)

Pergeseran Fokus Pasar SaaS

Seedance 2.0 Dirilis: Kompresi Ekstrem Workflow Dunia Fisik: ByteDance merilis model video besar Seedance 2.0, menunjukkan kontrol luar biasa dan pemahaman hukum fisika. Model ini tidak hanya mencapai narasi multi-shot yang koheren dan sinkronisasi bibir dalam 8 bahasa, tetapi juga mewujudkan konsistensi persepsi melalui pembuatan audio-visual terpadu. Pengujian oleh kreator seperti影视飓风 menunjukkan bahwa AI kini mampu mereplikasi logika pergerakan kamera yang kompleks dengan sempurna. Ini berarti workflow linier tradisional seperti penyutradaraan, pengambilan gambar, editing, dan scoring sedang dikompresi ke dalam satu model tunggal. “GPT-3.5 Moment” untuk industri video telah tiba, di mana produksi setingkat film oleh satu orang menjadi kenyataan (Sumber: 硬AI)

Kontrol Kamera Seedance 2.0

Iklan AI Menginvasi Super Bowl: Perang Perebutan Mindshare Dimulai: Selama Super Bowl LX, iklan AI mendominasi separuh durasi iklan. Anthropic menggunakan poin penjualan “tanpa iklan” untuk menyindir OpenAI, sementara OpenAI melalui Codex menekankan posisi sebagai pemberi kuasa (enabler) dengan slogan “Anda bisa membangun segalanya”. Google melanjutkan narasi hangatnya, sedangkan Amazon menggunakan humor gelap untuk meredakan teori ancaman AI. Ini menandai bahwa industri AI telah berpindah dari kompetisi teknis murni ke tahap perebutan mindshare publik. Tema iklan bergeser dari “Tech Show” menjadi “Lifestyle” dan “Etika & Kepercayaan”, mencerminkan upaya raksasa teknologi untuk meredakan kecemasan publik tentang AI yang merebut lapangan kerja dan melanggar privasi (Sumber: 寻空)

Persaingan Iklan AI di Super Bowl

🎯 Tren

GPT-5.3-Codex Dirilis: Dari Asisten Pemrograman ke Karyawan Serba Bisa: OpenAI meluncurkan GPT-5.3-Codex dengan peningkatan kecepatan reasoning sebesar 25%, mendekati level manusia dalam pengujian kontrol OSWorld. Model ini tidak lagi terbatas pada penulisan kode, tetapi mampu menangani pekerjaan pengetahuan umum secara end-to-end seperti pembuatan PPT dan analisis keuangan. OpenAI juga merilis protokol standar App Server untuk menyatukan logika interaksi Agent di semua interface. Ini menandai evolusi Codex menjadi “Digital Employee” yang mampu mengendalikan semua otoritas komputer (Sumber: 硅基星芒)

Demo Kemampuan GPT-5.3-Codex

Model Misterius Pony Alpha Muncul: Diduga Uji Coba GLM-5: Model stealth bernama Pony Alpha muncul di OpenRouter, mengunggulkan context window 200K dan kemampuan front-end One-shot yang sangat kuat. Pengujian menunjukkan level pembuatan SVG dan replikasi game 3D-nya setara dengan Opus 4.6. Berbagai bukti (seperti pemicu Tokenizer yang tidak biasa dan balasan System Prompt) mengarah pada dugaan bahwa model ini adalah GLM-5 dari Zhipu AI yang akan segera dirilis. Persaingan model besar domestik di bidang pemrograman tingkat tinggi dan Engineering Agent telah memasuki fase sengit lebih awal (Sumber: 智东西)

Uji Coba Pembuatan Halaman Web Pony Alpha

Claude Meluncurkan Fast Mode: Harga 6 Kali Lipat untuk Efisiensi 2,5 Kali Lipat: Anthropic merilis Claude Opus 4.6 Fast mode, meningkatkan kecepatan sebesar 2,5 kali lipat, namun dengan harga API yang melonjak hingga $150 per juta Token. Meskipun dikritik netizen sebagai “Hermès-nya dunia Token”, bagi engineer yang perlu memperbaiki insiden online secara mendesak, premi “kecepatan adalah kecerdasan” ini memiliki nilai komersial yang sangat tinggi. Ini mencerminkan pergeseran fokus kompetisi industri AI dari “apa yang bisa dilakukan AI” menjadi “seberapa cepat AI bisa melakukannya” (Sumber: 新智元)

Aktivasi Claude Fast Mode

Olimpiade Musim Dingin 2026 Memperkenalkan Juri AI: Pertarungan Keadilan vs. Artistik: Komite Olimpiade Internasional berencana menggunakan AI secara mendalam untuk membantu penilaian di Olimpiade Musim Dingin Milano-Cortina 2026, terutama untuk identifikasi jumlah putaran Figure Skating dan pengukuran ketinggian lompatan Ski. Studi menunjukkan bahwa meskipun AI dapat menghilangkan batasan dan bias sensorik manusia, AI mungkin menghukum cacat yang tidak terlihat oleh mata manusia karena terlalu presisi, serta sulit mengukur ekspresi artistik dan emosi. Ini bukan hanya tantangan teknis, tetapi juga rekonstruksi budaya terhadap nilai esensial olahraga (Sumber: aihub)

Konsep Penilaian AI Olimpiade Musim Dingin

Hardware OpenAI Dinamai Dime: Spesies Audio Baru Karya Jony Ive: Menurut bocoran, earphone AI pertama OpenAI akan dinamai “Dime”, yang dirancang untuk mengeksekusi perintah lintas ekosistem secara langsung melalui suara. Karena keterbatasan biaya chip 2nm, peluncuran perdana mungkin berupa versi audio murni. Sam Altman percaya layar smartphone terlalu kecil dan terlalu banyak gangguan, masa depan AI ada di perangkat terminal. Selain itu, sebuah “AI Pen” dengan kemampuan persepsi lingkungan dan proyeksi juga sedang dikembangkan untuk mengisi celah interaksi dalam skenario fokus mendalam (Sumber: APPSO)

Konsep Hardware OpenAI

🧰 Alat

Monty: Interpreter Python Super Cepat untuk AI Agent: Pydantic merilis Monty, sebuah interpreter Python minimalis dan aman yang ditulis dalam Rust. Alat ini dirancang khusus bagi Agent untuk menjalankan kode yang dihasilkan LLM, dengan waktu startup hanya beberapa mikrodetik, menyelesaikan masalah latensi tinggi pada container sandboxing. Monty mengontrol akses sistem file dan jaringan secara ketat melalui pemanggilan fungsi eksternal dan mendukung serialisasi snapshot, memungkinkan status eksekusi Agent bermigrasi mulus antar proses (Sumber: GitHub)

Status Proyek Monty

QMD: Search Engine Knowledge Base CLI yang Lokal dan Cerdas: QMD (Query Markup Documents) adalah alat pencarian lokal yang dirancang untuk workflow Agent. Alat ini menggabungkan pencarian teks lengkap BM25, pencarian semantik vektor, dan LLM re-ranking, serta mendukung protokol MCP. Melalui ekspansi query dan strategi integrasi location-aware, QMD dapat mengekstrak konteks secara akurat dari tumpukan catatan Markdown dan codebase, menjadikannya infrastruktur inti untuk membangun Agent lokal dengan “memori jangka panjang” (Sumber: GitHub)

Verity: Alternatif Perplexity Lokal di AI PC: Verity adalah mesin pencari dan tanya jawab lokal yang dioptimalkan untuk AI PC seperti Intel Core Ultra. Alat ini menggunakan OpenVINO untuk mempercepat inferensi NPU dan mendukung search engine SearXNG yang sepenuhnya self-hosted. Dengan tetap menjaga privasi, Verity memberikan jawaban berdasarkan fakta yang jelas, menandai pergeseran asisten AI pribadi dari pengambilan data cloud ke eksekusi on-device (Sumber: Reddit)

Demo Interface Verity

Tandem: Ruang Kolaborasi AI Lokal Ringan Berbasis Rust: Tandem menggunakan arsitektur Rust+Tauri, menghindari ketergantungan Python yang berat. Alat ini mengintegrasikan sqlite-vec untuk menyimpan vector embeddings secara lokal, sangat cocok untuk model lokal seperti Ollama. Sistem “Packs” uniknya memungkinkan pengguna menginstal Prompt dan skill layaknya plugin, menyediakan workstation pengembangan AI lokal berperforma tinggi tanpa biaya listrik cloud bagi developer (Sumber: Reddit)

📚 Pembelajaran

MoPPS: Tim Tsinghua Mengusulkan Framework Pelatihan Reinforcement Learning yang Efisien: Tim Profesor Ji Xiangyang dari Universitas Tsinghua memimpin pengembangan framework MoPPS, yang secara dinamis memprediksi tingkat kesulitan soal melalui model Bayesian ringan. Dalam pelatihan RL, framework ini dapat menyaring soal “Golden” yang menantang namun dapat dicapai, meningkatkan kecepatan pelatihan sebesar 1,8 kali lipat sekaligus mengurangi biaya inferensi sebesar 78%. Hasil ini telah diterima oleh KDD 2026, memberikan jalur baru untuk mengatasi biaya tinggi dalam pelatihan kemampuan reasoning model besar (Sumber: 量子位)

Perbandingan Kurva Pelatihan MoPPS

InftyThink+: Mewujudkan Iterative Reasoning dengan Horizon Tak Terbatas: Makalah terbaru mengusulkan framework InftyThink+, yang menyelesaikan masalah “Lost in the Middle” dan ledakan memori video dalam rantai reasoning panjang melalui kontrol mandiri model terhadap batas iterasi dan ringkasan eksplisit. Eksperimen menunjukkan bahwa pada skala Qwen-1.5B, metode ini meningkatkan akurasi AIME24 sebesar 21% dan secara signifikan mengurangi latensi inferensi, membuktikan bahwa model kecil pun dapat memiliki kemampuan logika jangka panjang yang kuat melalui ringkasan strategis (Sumber: HuggingFace)

TinyLoRA: Hanya Butuh 13 Parameter untuk Mengajarkan Reasoning pada Model: Riset dari tim Meta FAIR menunjukkan bahwa sinyal reasoning AI mungkin lebih jarang (sparse) daripada yang dibayangkan. Melalui metode TinyLoRA, peneliti hanya melakukan fine-tuning pada 13 parameter (26 byte) untuk membuat Qwen2.5-7B mencapai akurasi 91% pada tugas GSM8K. Ini mengisyaratkan bahwa kemampuan reasoning mungkin sudah ada dalam model pre-trained, dan peran RL adalah untuk “membangunkan” alih-alih “menyuntikkan” pengetahuan (Sumber: omarsar0)

Perbandingan Skala Parameter TinyLoRA

Panduan Otoritatif Pengujian Agent LangChain: LangChain merilis “LLM Application Testing Definition Guide”, yang secara sistematis merangkum metode pengujian dari prototipe hingga siklus hidup produksi. Konten mencakup cara membangun dataset, mendefinisikan metrik evaluasi, serta menggunakan LangSmith untuk pengujian regresi otomatis. Di tengah meningkatnya ketidakterdugaan perilaku Agent, panduan ini memberikan spesifikasi engineering yang diperlukan untuk implementasi AI tingkat perusahaan (Sumber: LangChain)

Cover Panduan Pengujian LangChain

💼 Bisnis

Meta Menginvestasikan $14,3 Miliar di Scale AI: Melalui transaksi besar ini, Mark Zuckerberg tidak hanya mengunci pasokan jangka panjang pelabelan data berkualitas tinggi, tetapi juga merekrut co-founder Scale AI, Alexandr Wang, beserta tim intinya. Strategi “Acquire-hire” ini mencerminkan ambisi raksasa Silicon Valley terhadap talenta AI papan atas, di mana loyalitas menjadi langka di hadapan biaya transfer yang fantastis (Sumber: ylecun)

Google Membayar $2,4 Miliar untuk Lisensi Windsurf: Google memperoleh lisensi teknologi inti Windsurf senilai $2,4 miliar dan mengintegrasikan tim pengembangnya ke dalam DeepMind. Langkah ini dipandang sebagai balasan kuat terhadap ekspansi OpenAI. Meskipun langkah ini memicu kontroversi karena opsi saham karyawan Windsurf yang tersisa hampir menjadi nol, hal ini membuktikan bahwa dalam perlombaan AI, nilai “transfer” arsitek inti jauh melampaui nilai perusahaan itu sendiri (Sumber: 新智元)

NVIDIA Mengunci Teknologi Inferensi Groq Senilai $20 Miliar: Untuk menghadapi lonjakan permintaan daya komputasi di sisi inferensi, NVIDIA mencapai kesepakatan lisensi besar dengan Groq, mengambil alih teknologi akselerasi inferensi inti beserta pendirinya, Jonathan Ross. Ini menandai pergeseran medan perang utama komputasi AI dari pre-training ke efisiensi inferensi, di mana NVIDIA terus memperkuat dominasinya sebagai “penjual sekop” melalui akuisisi (Sumber: 智东西)

🌟 Komunitas

Karpathy Mengumumkan Berakhirnya Era Vibe Coding: Co-founder OpenAI, Andrej Karpathy, berpendapat bahwa dengan lompatan kemampuan model, “Vibe Coding” yang sederhana telah menjadi masa lalu, dan kini kita memasuki era “Agent Engineering”. Manusia tidak lagi menghabiskan 99% waktu untuk menulis kode, melainkan berperan sebagai “Agent Coordinator” dan “Final Reviewer”. Komunitas berdiskusi: ambang batas programmer telah bergeser dari penguasaan sintaksis ke desain arsitektur sistem dan presisi instruksi (Sumber: 新智元)

Terapi AI: Tanpa Sengaja Menyelesaikan Kebutuhan “Daily Emotional Maintenance”: Komunitas Reddit ramai mendiskusikan aplikasi AI di bidang kesehatan mental. Pengguna menemukan bahwa AI bukan pengganti terapi mendalam, melainkan pengisi celah “higiene emosional harian”—menangani frustrasi instan dan mencegah kecemasan menumpuk. Meskipun ada kontroversi mengenai “ketergantungan emosional”, model “sikat gigi emosional” yang murah dan berfrekuensi tinggi ini menjadi aspek nyata bagaimana AI mengubah hubungan sosial (Sumber: Reddit)

Diskusi Pemeliharaan Emosi AI

Budaya Hive Anthropic: Matinya Ego dan Ledakan Inovasi: Veteran Google, Steve Yegge, setelah melakukan riset mendalam di Anthropic, menyatakan bahwa rahasia efisiensi mereka yang 1000 kali lipat melampaui Google terletak pada formula emas “beban kerja jauh melampaui jumlah orang”. Di Anthropic, tidak ada hambatan departemen, setiap orang adalah “lebah pekerja yang bahagia”. “Hive Mind” ini memungkinkan produk berubah dari ide menjadi rilis hanya dalam 10 hari. Rebranding “budaya elit” ini menjadi standar baru bagi startup AI (Sumber: 新智元)

Mode Kolaborasi Internal Anthropic

Krisis Privasi Plugin AI: Lebih dari Setengah Mencuri Data Secara Diam-diam: Laporan terbaru menunjukkan bahwa lebih dari 50% plugin AI di Chrome Store melakukan pengumpulan Personally Identifiable Information (PII) pengguna. Karena tekanan “kelangkaan data”, developer menggunakan izin skrip untuk mengambil input pengguna secara real-time. Komunitas menyerukan: sambil menikmati kemudahan terjemahan dan ringkasan AI, batas privasi dasar seperti lokasi geografis dan daftar kontak harus dijaga dengan ketat (Sumber: 36氪)

Risiko Kebocoran Privasi Plugin AI

💡 Lainnya

New York Mengusulkan Penangguhan Pembangunan Data Center Baru: AI Menabrak Tembok Fisik: Legislator negara bagian New York mengusulkan moratorium tiga tahun untuk pembangunan data center baru, dengan alasan lonjakan infrastruktur AI menyebabkan ketegangan energi dan kenaikan tarif listrik. Ini mencerminkan narasi AI yang bergeser dari “software memakan dunia” menjadi “hardware terhambat jaringan listrik”. Jika hambatan fisik tidak dapat diatasi, belanja modal ratusan miliar dolar berisiko tidak dapat diimplementasikan (Sumber: 36氪)

Krisis Konsumsi Energi Data Center

Pakar Performa Brendan Gregg Bergabung dengan OpenAI: Brendan Gregg, penulis buku “Systems Performance” yang dijuluki “Dewa Performa” di kalangan teknis, secara resmi mengumumkan bergabung dengan OpenAI untuk bertanggung jawab atas optimasi performa ChatGPT. Ia menyatakan bahwa tuning cloud computing tradisional tidak lagi mampu menangani tekanan supercluster GPU, dan ia akan menggunakan teknologi seperti eBPF untuk mengatasi hambatan tersembunyi dalam pelatihan model besar. Ini menandai bahwa kompetisi AI telah memasuki tahap engineering ekstrem (Sumber: 36氪)

Flame Graph Ikonik Brendan Gregg