Berita AI – 2026-02-06

Kata Kunci:Model AI, Agen Cerdas, Model Bahasa Besar, GPT-5.3-Codex, Claude Opus 4.6, Pemodelan Dunia

🔥 Fokus

Pertempuran Sengit Model OpenAI vs Anthropic: GPT-5.3-Codex Melawan Opus 4.6 : Pada 6 Februari 2026, Silicon Valley menyaksikan persaingan AI paling sengit dalam sejarah. OpenAI merilis GPT-5.3-Codex dengan fokus utama “AI building AI”, yang mendekati level manusia dalam pengujian penggunaan komputer seperti OSWorld, serta menekankan optimisasi integrasi hardware dan software pada sistem NVIDIA GB200. Tak lama kemudian, Anthropic meluncurkan Claude Opus 4.6, yang dengan 1M context window dan mekanisme “Adaptive Thinking”, memimpin jauh dalam pekerjaan pengetahuan bernilai tinggi (GDPval-AA) seperti keuangan dan hukum. Duel ini menandai evolusi AI dari sekadar “chatbox” menjadi “Autonomous Execution System”, di mana model tidak lagi hanya menjawab pertanyaan, tetapi mulai mengambil alih workflow end-to-end yang kompleks (Sumber: sama, Anthropic)

OpenAI与Anthropic模型遭遇战

“Kiamat SaaS” Tiba: Plugin Agent Memicu Gempa Valuasi Triliunan Dolar di Industri Software : Peluncuran 11 plugin Claude Cowork oleh Anthropic (mencakup keuangan, hukum, penjualan, dll.) langsung memicu kepanikan Wall Street terhadap industri SaaS tradisional. Pasar menyadari bahwa ketika AI dapat langsung memberikan hasil seperti “peninjauan kontrak” atau “analisis keuangan”, model bisnis tradisional yang menarik biaya per kursi dan menjual UI akan kehilangan nilainya. Akibatnya, saham raksasa seperti Salesforce dan Thomson Reuters anjlok secara kolektif, dengan valuasi industri software global menguap hampir satu triliun dolar dalam seminggu. “SaaSpocalypse” ini menandai transformasi paksa industri software dari “menjual alat” menjadi “menjual hasil”, di mana AI Agent sedang membentuk kembali distribusi kekuasaan ekonomi digital (Sumber: 36氪, 王智远)

SaaS末日降临

Paradigma World Modeling Dimulai: Li Fei-fei dan NVIDIA Bahas Frontier Baru AI : Head of Robotics NVIDIA, Jim Fan, dan pendiri World Labs, Li Fei-fei, secara bersamaan mendefinisikan “World Modeling” sebagai paradigma AI generasi berikutnya setelah “Next-token prediction”. Li Fei-fei mengungkapkan produk Spatial Intelligence pertamanya, Marble, yang dapat mengubah instruksi multimodal menjadi dunia 3D interaktif dengan konsistensi fisik. Jim Fan berpendapat bahwa 2026 akan menjadi tahun pertama bagi World Models skala besar untuk meletakkan fondasi bagi robotika. Pergeseran ini berarti AI akan keluar dari layar digital dan mencapai lompatan dari “Language Intelligence” ke “Embodied Intelligence” melalui pemahaman struktur geometris dan hukum kausalitas dunia fisik tiga dimensi (Sumber: 36氪, Jim Fan)

世界建模范式开启

Peluncuran OpenAI Frontier: Platform Manajemen Rekan Kerja AI Tingkat Perusahaan Hadir : OpenAI secara resmi meluncurkan platform Frontier, yang bertujuan untuk menyelesaikan masalah “AI Silos” di dalam perusahaan. Platform ini tidak lagi hanya menyediakan model, tetapi membangun sistem yang mirip dengan HR versi AI, mendukung perusahaan untuk membangun, menerapkan, dan mengelola ratusan hingga ribuan “AI Colleagues”. Frontier memungkinkan Agent untuk berbagi konteks bisnis, belajar melalui umpan balik, dan memiliki batasan izin serta keamanan yang ketat. Perlu dicatat bahwa platform ini mengadopsi standar terbuka, bahkan mendukung manajemen Agent pihak ketiga dari Anthropic atau Google, menunjukkan ambisi OpenAI untuk menjadi sistem operasi dasar tingkat perusahaan di era AI (Sumber: OpenAI)

OpenAI Frontier发布

🎯 Tren

Era Linear Attention Tiba: Alibaba Rilis Qwen3-Coder-Next : Qwen3-Coder-Next yang diluncurkan Alibaba menggunakan arsitektur Linear Attention Gated DeltaNet, di mana 75% komputasi berjalan di jalur linear. Dibandingkan dengan kompleksitas O(n²) dari Attention tradisional, Linear Attention mencapai kompleksitas O(n), yang tidak hanya menghemat daya komputasi dan VRAM saat menangani context window super panjang seperti 256K, tetapi juga meningkatkan throughput decoding secara signifikan. Ini menandai bahwa 2026 mungkin menjadi tahun pertama bagi Linear Attention, dengan perusahaan seperti DeepSeek dan Kimi juga aktif bertaruh pada teknologi ini untuk mengoptimalkan efisiensi inferensi teks panjang (Sumber: karminski3)

Qwen3-Coder-Next

Kuaishou Kling 3.0 Dirilis: Video AI Memasuki Era Realisme 100% : Kling 3.0 resmi diluncurkan dengan fitur utama teknologi “Custom Multi-Shot”, mendukung pembuatan video berkualitas tinggi hingga 15 detik. Versi baru ini mencapai lompatan besar dalam konsistensi karakter, efek suara asli, dan detail visual, yang oleh para kreator disebut sebagai “Hollywood Terminator”. Melalui satu gambar saja, pengguna dapat menghasilkan urutan pembukaan tingkat film, yang sangat menurunkan ambang batas dan biaya produksi film profesional (Sumber: Kling_ai)

Model “Avocado” Meta Terungkap: Efisiensi Komputasi Meningkat 100 Kali Lipat : Generasi baru base model dengan kode nama “Avocado” yang dikembangkan oleh Meta Superintelligence Lab telah menyelesaikan pre-training. Memo menunjukkan bahwa tanpa fine-tuning, performa pengetahuan dan visual model ini sudah setara dengan model terkemuka, dengan efisiensi tugas teks 10 kali lebih tinggi dari generasi sebelumnya, dan 100 kali lebih tinggi dibandingkan versi yang belum dirilis. Meta mencoba mencari ROI yang lebih baik dalam investasi AI senilai $135 miliar pada tahun 2026 melalui efisiensi pelatihan yang ekstrem (Sumber: 36氪)

Intern-S1-Pro Dirilis: Model MoE 1T Parameter Domestik Tantang Gemini : Shanghai AI Lab merilis Intern-S1-Pro, sebuah model penalaran ilmiah multimodal open-source dengan skala 1T parameter. Model ini menggunakan arsitektur 512 pakar (22B aktif), memperkenalkan Fourier Position Encoding (FoPE) dan teknologi STE routing, dengan performa kuat pada tugas AI4Science, mewakili terobosan terbaru model open-source domestik dalam bidang sparsitas ekstrem dan penalaran ilmiah (Sumber: teortaxesTex)

Intern-S1-Pro

🧰 Alat

Claude Code Luncurkan Fitur “Agent Teams” : Fitur eksperimental terbaru Claude Code memungkinkan pengguna untuk menjalankan “Agent Teams”, di mana satu Leader Agent memecah tugas dan menjadwalkan beberapa Teammate Agent untuk bekerja secara paralel. Dalam pengujian internal Anthropic, tim AI ini secara mandiri menulis 100.000 baris kode untuk C compiler dalam dua minggu dan berhasil mengompilasi Linux kernel. Ini menandai lompatan besar pemrograman AI dari “asisten tunggal” ke mode “kolaborasi tim” (Sumber: Anthropic)

Claude Code智能体团队

Perplexity Luncurkan “Model Council” : Pengguna langganan Perplexity Max kini dapat menjalankan tiga model teratas secara bersamaan untuk membandingkan output. Fitur ini bertujuan untuk memberikan jawaban yang lebih akurat dan berkeyakinan tinggi melalui validasi silang multi-model, mengurangi risiko halusinasi dari satu model saja. Protokol “tidak resmi” ini telah menjadi workflow standar di internal Perplexity untuk mengurangi context switching (Sumber: Perplexity)

Nanobot: AI Assistant Open-Source Minimalis Penantang OpenClaw : Data Science Lab dari University of Hong Kong merilis Nanobot secara open-source dengan hanya 4.000 baris kode. Dibandingkan dengan OpenClaw yang memiliki basis kode besar dan kontroversi keamanan, Nanobot mengimplementasikan dukungan multi-LLM, pencarian web, memori persisten, dan akses multi-saluran (Telegram/Feishu) dengan arsitektur minimalis. Ini menyediakan sampel pembelajaran Agent yang lebih transparan dan mudah dikembangkan bagi para developer (Sumber: dotey)

Nanobot

LangSmith Luncurkan Insights Agent: Review Otomatis Perilaku Agent : LangChain memperkenalkan Insights Agent berbasis AI untuk LangSmith, yang mampu menyisir jejak operasional (Traces) Agent secara otomatis. Alat ini dapat menganalisis bagaimana pengguna menggunakan Agent, mengidentifikasi di mana Agent melakukan kesalahan, dan memberikan saran optimisasi. Ini menyelesaikan masalah “black box setelah rilis” bagi pengembang Agent, mengubah debugging dari “melihat kode” menjadi “melihat logika penalaran” (Sumber: LangChain)

📚 Pembelajaran

Nature Laporkan Model OpenScholar: Atasi AI Hallucination dengan “Retrieval + Self-check” : Model dengan 8B parameter, OpenScholar, yang dikembangkan oleh University of Washington dan Ai2, masuk dalam jurnal utama Nature. Model ini tidak lagi bergantung pada hafalan, melainkan melalui database eksternal berisi 45 juta makalah penelitian ilmiah, menjalankan proses ketat “Retrieval-Rerank-Generate-Self-check”. Dalam tugas tinjauan ilmiah, performanya melampaui model flagship dengan parameter jauh lebih besar, membuktikan bahwa “knowledge base eksternal” yang dipanggil secara presisi lebih andal daripada memori black box (Sumber: 新智元)

OpenScholar

TinyLoRA: Hanya dengan 13 Parameter Membuat Model Belajar Menalar : Sebuah tesis doktoral terbaru menunjukkan metode fine-tuning bernama TinyLoRA. Dengan menggabungkan TinyLoRA dan Reinforcement Learning, peneliti hanya menggunakan 13 parameter yang dapat dilatih untuk meningkatkan skor model Qwen skala 7B pada benchmark matematika GSM8K dari 76% menjadi 91%. Ini menantang persepsi tradisional bahwa “fine-tuning membutuhkan banyak parameter”, menunjukkan efisiensi parameter yang sangat tinggi dalam kemampuan penalaran model (Sumber: BlackHC)

TinyLoRA

Paper Interaktif Eric Jang “Thinking Like a Rock” : Pakar robotika Eric Jang merilis paper interaktif mendalam tentang model berpikir, otomatisasi penelitian, dan arah masa depannya. Artikel tersebut mengeksplorasi bagaimana AI berevolusi dari alat pasif menjadi subjek penelitian ilmiah yang aktif mengeksplorasi ketika sumber daya komputasi sangat melimpah, dan memprediksi bahwa “sistem kerja 007” akan menjadi norma di era AI, memicu diskusi hangat di komunitas tentang jalur evolusi AGI (Sumber: _sholtodouglas)

💼 Bisnis

ElevenLabs Selesaikan Pendanaan Seri D Senilai $500 Juta, Valuasi Capai $11 Miliar : Raksasa audio AI asal Inggris, ElevenLabs, mengumumkan putaran pendanaan baru yang dipimpin oleh Sequoia, dengan valuasi melonjak lebih dari 50 miliar RMB dalam satu tahun. CEO mengungkapkan bahwa perusahaan sedang mempertimbangkan IPO dan akan mengalihkan fokus strategis dari sekadar model audio ke “Conversational Agents”, yang bertujuan untuk membentuk kembali interaksi manusia-komputer melalui integrasi software dan hardware (Sumber: 智东西)

ElevenLabs融资

ClickHouse Raih Pendanaan $400 Juta, Valuasi Tembus $15 Miliar : Database open-source “kuda hitam”, ClickHouse, mengumumkan pendanaan baru, dengan kecepatan kueri 260 kali lebih cepat dari MySQL. Sebagai infrastruktur kunci di balik GPT-4o dan Claude 4, ClickHouse menjadi pilihan utama bagi raksasa seperti ByteDance, Alibaba, dan Tesla dalam banjir data AI berkat kemampuan analisis real-time yang ekstrem (Sumber: 智东西)

ClickHouse

StepFun Raih Pendanaan Seri B+ Senilai 5 Miliar Yuan, Qi Yin Menjabat Sebagai Chairman : Pendiri Megvii, Qi Yin, secara resmi memimpin StepFun (阶跃星辰), menandai kompetisi model besar memasuki babak kedua di mana “talenta lebih penting daripada uang”. Qi Yin akan mendorong integrasi mendalam antara model besar multimodal dengan strategi “AI + Kendaraan”, menutupi kelemahan StepFun dalam narasi komersialisasi dan efisiensi organisasi (Sumber: 市象)

🌟 Komunitas

Karpathy Nyatakan Berakhirnya “Vibe Coding”, Mulai Era “Agentic Engineering” : Tokoh AI Karpathy memposting bahwa Vibe Coding setahun lalu lebih bersifat hobi, sementara sekarang menggunakan Agent untuk pemrograman telah menjadi pengaturan default profesional. Ia mengusulkan konsep “Agentic Engineering”, menekankan bahwa developer harus beralih dari “menulis kode” menjadi “mendesain dan mengelola arsitektur”, di mana 99% kode akan diambil alih oleh AI, dan nilai inti manusia terletak pada intuisi serta pengawasan sebagai arsitek (Sumber: 新智元)

Karpathy观点

Mitos “AI Social Network” Moltbook Hancur: Diduga Memiliki Masalah Keamanan Serius : Moltbook, yang pernah mengklaim memiliki 1,5 juta pengguna terdaftar AI, terungkap memiliki kesalahan konfigurasi database yang menyebabkan kebocoran API keys pengguna dalam jumlah besar. Lembaga keamanan menunjukkan bahwa apa yang disebut “jutaan pasukan AI” sebagian besar adalah akun palsu yang dihasilkan oleh skrip. Insiden ini memicu refleksi mendalam di komunitas mengenai pemasaran berlebihan dan celah keamanan pada proyek AI Agent (Sumber: 壹番YIFAN)

Platform Rent-a-Human Populer: AI Mulai Mempekerjakan Manusia : Platform RentAHuman.ai menarik 40.000 pendaftar setelah diluncurkan. Di sini, AI Agent bertindak sebagai pemberi kerja yang merilis tugas seperti verifikasi offline, kurir, dll., sementara manusia menawarkan “penyewaan tubuh” dengan harga tertentu untuk menyelesaikan pekerjaan di dunia fisik yang tidak dapat dijangkau oleh AI. Mode “Human-as-a-Service (HaaS)” ini memicu diskusi sengit tentang hubungan kolaborasi manusia-mesin di masa depan (Sumber: 极客公园)

Rent-a-Human

💡 Lainnya

Produsen Otomotif Kolektif Bertransformasi ke “Embodied Intelligence”: Jia Yueting Rilis Empat Robot : FF milik Jia Yueting merilis empat seri robot termasuk Futurist dan Master, dengan harga mulai dari 17.000 RMB, mengklaim telah mendapatkan 1.211 pesanan. Pada saat yang sama, produsen mobil seperti Li Auto, XPeng, dan Xiaomi juga mengalihkan fokus narasi mereka ke AI dan robotika, mencoba beralih dari logika manufaktur tradisional ke valuasi perusahaan teknologi AI (Sumber: 超电实验室, 螺旋实验室)

Wawancara Elon Musk: Data Center Luar Angkasa Adalah Solusi Akhir untuk Hambatan Energi : Dalam wawancara dengan Dwarkesh, Musk berpendapat bahwa kecepatan ekspansi listrik di bumi tidak dapat mengimbangi permintaan AI, sementara luar angkasa memiliki energi surya tanpa batas dan tanpa batasan regulasi. Ia berencana memindahkan pusat komputasi ke orbit melalui peluncuran Starship skala besar, dan mengungkapkan sedang membangun “Optimus Academy” untuk melatih jutaan pasukan robot melalui simulasi closed-loop (Sumber: dwarkesh_sp)

CATL Rilis Baterai 5C Ultra-charging: Terisi Penuh dalam 12 Menit dengan Umur 1,5 Juta Mil : Generasi baru baterai yang diluncurkan CATL tetap dapat mempertahankan umur yang sangat panjang bahkan di bawah suhu ekstrem, dengan performa jauh melampaui rata-rata industri. Ini dianggap sebagai terobosan besar dalam teknologi penyimpanan dan pengisian energi di tengah permintaan listrik AI, yang diharapkan dapat mempercepat transformasi cerdas sistem energi transportasi (Sumber: kimmonismus)