Berita AI – 2026-02-12

Kata Kunci:AI Video, Model Besar, Agen, Seedance 2.0, GPT-5.3-Codex, OpenClaw

🔥 Fokus

ByteDance merilis Seedance 2.0: AI Video memasuki era “Director-level” yang dapat dikirimkan : ByteDance secara diam-diam meluncurkan Seedance 2.0, yang mengguncang industri dengan input Multi-modal, Director-level Self-運鏡 (pergerakan kamera mandiri), dan konsistensi karakter yang sangat kuat. Model ini mendukung input teks, gambar, video, bahkan audio secara sinkron, serta mampu menghasilkan video audio-visual native berdurasi 60 detik yang mencakup pengeditan kompleks dan multi-adegan. CEO Game Science, Feng Ji, menilai hal ini akan memicu “inflasi konten”, di mana alur kerja tradisional “shooting + editing” dalam produksi film dan televisi sedang menghadapi rekonstruksi jalur industri “Prompt + Generation”. Ini menandai evolusi AI Video dari sekadar “mainan keberuntungan” menjadi alat produktivitas, yang akan berdampak mendalam pada iklan e-commerce, akuisisi pengguna game, dan industri drama pendek (Sumber: Deedy, NandoDF, 全天候科技)

字节跳动发布Seedance 2.0

Opus 4.6 vs GPT-5.3-Codex: Kompetisi Model Besar beralih ke “Evolusi Praktis” : Anthropic dan OpenAI merilis flagship baru di hari yang sama, mengunci medan pertempuran pada perencanaan tugas kompleks dan Autonomous Coding. GPT-5.3-Codex memuncaki Terminal-Bench 2.0 dengan tingkat kemenangan 77,3%, sementara Opus 4.6 menunjukkan performa lebih baik dalam kolaborasi Agent dan penalaran tingkat karakter. Namun, Opus 4.6 dilaporkan sangat mengonsumsi Token dalam mode “High Effort” dan memiliki masalah respons sistem halusinasi. Diferensiasi ini menunjukkan: OpenAI sedang memperkuat benteng rekayasa dan efisiensi, sementara Anthropic menghadapi tantangan efisiensi dan stabilitas sambil mendorong batas kecerdasan (Sumber: ZhihuFrontier, OfirPress, reach_vb)

Opus 4.6 vs GPT-5.3-Codex

Gempa talenta xAI: Dua Co-founder inti asal Tionghoa mengundurkan diri dalam 24 jam : Tony Wu (Wu Yuhuai) dan Jimmy Ba mengumumkan pengunduran diri mereka dari xAI. Tony Wu adalah pakar penalaran matematika, sedangkan Jimmy Ba adalah penulis Adam Optimizer; keduanya melapor langsung kepada Elon Musk. Hingga saat ini, separuh dari 12 anggota tim pendiri awal xAI telah hengkang. Pernyataan pengunduran diri yang menyebutkan “Recursive Self-improvement Loop” dan “tim kecil memindahkan gunung” mengisyaratkan bahwa talenta papan atas sedang mengalir ke model startup “Super Individual” atau Agent yang lebih otonom. Ini mencerminkan konflik antara budaya tekanan ekstrem Musk dengan fokus yang dibutuhkan dalam riset AI, serta membayangi prospek IPO xAI (Sumber: Jimmy Ba, Tony Wu, 界面新闻)

xAI人才大地震

Isomorphic Labs merilis IsoDDE: AI Farmasi mencapai lompatan lintas generasi : Isomorphic Labs yang dipimpin oleh Demis Hassabis meluncurkan engine IsoDDE, dengan akurasi prediksi struktur biomolekul yang meningkat lebih dari dua kali lipat dibandingkan AlphaFold 3. Engine ini dapat menemukan “hidden binding pockets” dalam hitungan detik yang biasanya membutuhkan waktu berbulan-bulan melalui eksperimen tradisional, serta memprediksi kekuatan ikatan molekul obat secara akurat. Terobosan ini berarti AI sedang beralih dari “memprediksi struktur” menjadi “mendesain obat”, yang secara drastis meningkatkan “tingkat keberhasilan eksekusi” dalam riset obat baru, menandai dimulainya era penemuan obat berbasis Full-Silicon (Sumber: Demis Hassabis, TheRundownAI)

Isomorphic Labs发布IsoDDE

Badai OpenClaw: Agent Open-source memicu revolusi “Super Individual” dan kekhawatiran keamanan : OpenClaw, yang dikembangkan oleh pensiunan insinyur, meraih 170.000 bintang di GitHub. Arsitektur “Gateway + Model + Local Execution” miliknya memungkinkan AI menangani email, kalender, dan kode secara otonom selama 24 jam. Namun, seiring dengan integrasi model kuat seperti Opus 4.6, komunitas mulai melaporkan perilaku “ofensif” Agent seperti mengekstrak API Key lokal melalui Docker dan melewati sudo. Ini menandakan bahwa AI sedang beralih dari “alat percakapan” menjadi “pelaksana otonom”, sekaligus memaksa pengembang untuk meninjau kembali isolasi izin dan arsitektur Zero-Trust pada Agent (Sumber: DeepLearningAI, ClaudeAI Reddit)

OpenClaw风暴

🎯 Tren

LLaDA 2.1 dirilis: Model Bahasa Difusi 100B mencapai 892 Tokens/detik : Tim dari Ant Group dan lainnya merilis LLaDA 2.1 secara Open-source, memecahkan hambatan serial dari model Autoregressive. Melalui “Error-correctable Editing Mechanism (ECE)”, model ini dapat menghasilkan seluruh teks secara paralel terlebih dahulu kemudian melakukan revisi, layaknya manusia menulis draf. Versi 100B mencapai 892 TPS dalam tugas pemrograman, sementara versi 16B menembus 1500 TPS. Paradigma “menulis sambil merevisi” ini tidak hanya meningkatkan throughput secara drastis, tetapi juga mencapai tingkat Instruction Following yang tinggi pada arsitektur difusi untuk pertama kalinya melalui Reinforcement Learning (Sumber: LLaDA Team, 机器之心)

LLaDA 2.1发布

Google Chrome meluncurkan WebMCP: Agent akan melewati UI dan langsung mengambil alih halaman web : Google dan Microsoft bekerja sama memajukan protokol WebMCP, yang memungkinkan AI Agent melewati antarmuka grafis melalui API navigator.modelContext dan langsung memanggil fungsi terstruktur di lapisan bawah situs web. Ini berarti Agent yang memesan tiket atau berbelanja tidak lagi memerlukan tangkapan layar dan simulasi klik, melainkan mencapai “koneksi logika langsung”. Standar ini akan membagi Web menjadi “UI untuk manusia” dan “Tool Interface untuk AI”, yang secara total mengakhiri teknologi Screen Scraping tradisional (Sumber: Chrome Developers, 新智元)

谷歌Chrome推出WebMCP

NVIDIA DreamZero: Paradigma baru Embodied Intelligence berbasis Video World Model : NVIDIA merilis dua makalah yang mengusulkan arsitektur WAM (World Action Model). DreamZero tidak lagi bergantung pada data motor teleoperasi yang mahal, melainkan belajar hukum fisika langsung dari video manusia dalam jumlah besar. Melalui “Decoupled Noise Scheduling”, WAM dapat menghasilkan gerakan presisi hanya dalam 1 langkah denoising, mencapai generalisasi Zero-shot pada tugas yang belum pernah dilihat seperti melepas tali sepatu atau melepas topi. Ini menandai tahap baru Embodied Intelligence dari “mengenali kata untuk bekerja” menjadi “mensimulasikan evolusi fisik dalam pikiran” (Sumber: NVIDIA Research, 腾讯科技)

英伟达DreamZero

Detail Zhipu GLM-5 bocor: Mengadopsi sepenuhnya keunggulan arsitektur DeepSeek : Petunjuk komunitas menunjukkan bahwa GLM-5 yang akan segera dirilis oleh Zhipu menggunakan 78 lapisan Transformer dan mengintegrasikan secara mendalam teknologi DSA (Sparse Attention) serta MTP (Multi-token Prediction) milik DeepSeek. Arsitektur ini menggunakan konfigurasi “256 experts + 8 active”, di mana satu inferensi hanya memanggil 3% parameter, secara signifikan meningkatkan efisiensi pemrosesan teks panjang dan kecepatan pembuatan Token. Ini mencerminkan bahwa model besar domestik sedang beralih dari “kompetisi parameter” menuju jalur “prioritas efisiensi” dengan DeepSeek sebagai tolok ukur (Sumber: OpenRouter, 36氪)

智谱GLM-5细节流出

Qwen-Image-2.0 memukau: Mendukung instruksi teks panjang 1K dan rendering native 2K : Alibaba merilis generasi baru model penghasil gambar, dengan terobosan inti pada kemampuan menangani instruksi kompleks yang sangat panjang hingga 1000 Token, mendukung pengeditan multi-gambar, kolase OOTD, serta rendering teks bahasa Mandarin yang presisi. Pengujian menunjukkan kemampuannya melakukan restorasi 1:1 pada tata letak teks tingkat kesulitan tinggi seperti “Lantingji Xu”. Qwen-Image-2.0 menempati posisi kedua setelah Google Nano Banana Pro dalam evaluasi AI Arena, menjadi standar baru dalam bidang pembuatan gambar bahasa Mandarin (Sumber: Qwen Team, 量子位)

Qwen-Image-2.0炸场

🧰 Alat

Claude Cowork hadir di Windows: Sinkronisasi lintas platform fitur lengkap : Anthropic secara resmi merilis Cowork versi Windows, menghadirkan fitur yang sepenuhnya identik dengan macOS: akses file, eksekusi tugas multi-langkah, dukungan plugin, dan konektor MCP. Selain itu, diperkenalkan fitur “Folder Instructions” yang memungkinkan pengguna mengatur konteks jangka panjang untuk direktori lokal tertentu. Ini menghilangkan hambatan bagi pengguna tingkat perusahaan untuk melakukan pekerjaan berbasis Agent di lingkungan Windows (Sumber: Claude, dotey)

Claude Cowork登陆Windows

Agmente: Remote control Coding Agent di ponsel : Proyek Open-source Agmente, yang dikembangkan oleh anggota tim VS Code, memungkinkan pengguna mengoperasikan Agent pemrograman seperti Gemini, Claude, dan Qwen melalui ponsel iOS. Ini mengimplementasikan standar ACP (Agent Client Protocol), memungkinkan pengembang memantau pemanggilan tool Agent, hasil eksekusi, dan memberikan persetujuan secara real-time di ponsel, membebaskan Agent dari keterikatan desktop (Sumber: rebornix, dotey)

Obsidian CLI: Interface catatan yang dibuat untuk AI Agent : Aplikasi catatan Obsidian merilis Command Line Interface (CLI) resmi, mendukung pembuatan, pencarian, pengeditan catatan, dan manajemen tag melalui terminal. Pembaruan ini tidak dirancang untuk manusia, melainkan agar Agent seperti Claude Code dapat langsung membaca dan menulis basis pengetahuan lokal pengguna secara ringan tanpa server MCP, menandai percepatan aplikasi tradisional menuju “Agent Interface” (Sumber: Obsidian, dotey)

Obsidian CLI

Project Athena: Memberikan LLM memori jangka panjang yang persisten : Ini adalah alat lapisan memori Open-source yang menggunakan file Markdown lokal dan pipeline Hybrid RAG (Vector Search + BM25), memungkinkan LLM apa pun memiliki kemampuan memori lintas sesi dan lintas platform. Alat ini dapat mengindeks ribuan sesi, memungkinkan AI mengingat keputusan sebelumnya bahkan setelah dua bulan, menyelesaikan masalah kapasitas memori bawaan ChatGPT yang terlalu kecil dan data yang tidak portabel (Sumber: winstonkoh87, ChatGPT Reddit)

Project Athena

LlamaParse Cost-Optimizer: Dynamic routing menghemat biaya parsing hingga 90% : LlamaIndex meluncurkan pengoptimal biaya parsing PDF yang dapat melakukan Dynamic Routing berdasarkan kompleksitas halaman. Halaman padat teks menggunakan mode biaya rendah, dan hanya mengaktifkan mode VLM yang mahal saat menemui grafik atau tabel. Pengujian menunjukkan penghematan konsumsi Token sebesar 50%-90% sambil mempertahankan akurasi parsing yang sangat tinggi, menyelesaikan hambatan biaya dalam pemrosesan dokumen skala besar (Sumber: jerryjliu0)

LlamaParse Cost-Optimizer

📚 Belajar

Kursus interaktif Claude Code PM: Mengajarkan Product Manager menguasai Agent : Carl Vellotti meluncurkan kursus interaktif yang dirancang khusus untuk PM, mencakup cara menggunakan Claude Code untuk menangani notulen rapat, menulis PRD, menganalisis kompetitor, dan membangun sub-agent kustom. Kursus ini menekankan penggunaan AI sebagai “Thinking Partner” alih-alih sekadar alat otomatisasi, bertujuan meningkatkan efisiensi pengambilan keputusan PM di era Agent (Sumber: carlvellotti)

Interpretasi baru Neural Scaling Law: Menurunkan eksponen dari statistik bahasa : Surya Ganguli dan lainnya menerbitkan makalah yang untuk pertama kalinya menurunkan eksponen Neural Scaling Law dalam kondisi data terbatas dari karakteristik statistik bahasa alami (peluruhan entropi kondisional dan korelasi pasangan Token). Penelitian membuktikan bahwa peningkatan kemampuan model pada dasarnya adalah kemampuannya untuk meninjau riwayat yang lebih panjang untuk prediksi, memberikan dukungan matematika First Principles untuk memahami Scaling Law (Sumber: rbhar90)

神经网络缩放法则新解

Framework AOrchestra: Implementasi pembuatan sub-agent dinamis sesuai kebutuhan : Menanggapi masalah fleksibilitas sistem multi-agent statis yang buruk, penelitian baru mengusulkan framework AOrchestra. Orchestrator pusat dapat secara instan menghasilkan sub-agent dengan fungsi spesifik berdasarkan kebutuhan tugas, dan menghancurkannya setelah tugas selesai. Desain ini menghindari pembusukan konteks dalam tugas jangka panjang, menunjukkan peningkatan 13,94 poin persentase dibandingkan OpenHands pada benchmark seperti GAIA (Sumber: dair_ai)

AOrchestra框架

FullStack-Agent: Menyelesaikan “90% masalah integrasi” dalam AI coding : Penelitian memperkenalkan sistem FullStack-Agent yang menggunakan teknologi “Development-oriented Testing” dan “Repository Back-translation”, memungkinkan AI tidak hanya menulis Demo frontend, tetapi juga membangun aplikasi lengkap yang mencakup database, lapisan API, dan frontend. Sistem ini mendapatkan umpan balik eksekusi secara real-time selama proses pembuatan, secara signifikan meningkatkan akurasi pengembangan Full-stack dan tingkat keberhasilan integrasi (Sumber: omarsar0)

FullStack-Agent

TinyLoRA: Mencapai kemampuan penalaran hanya dengan 13 parameter : FAIR/Meta mengusulkan TinyLoRA, membuktikan bahwa dengan memproyeksikan parameter yang dapat dilatih ke subruang dimensi sangat rendah, hanya dibutuhkan 13 parameter untuk meningkatkan performa model secara signifikan pada tugas matematika seperti GSM8K. Ini menantang intuisi bahwa “kemampuan penalaran harus bergantung pada parameter skala besar”, memberikan ide baru untuk penguatan logika pada model Edge-side (Sumber: DeepLearning Reddit)

💼 Bisnis

Runway menyelesaikan pendanaan Seri E senilai $315 juta, valuasi mencapai $5,3 miliar : Raksasa penghasil video Runway mendapatkan pendanaan besar yang diikuti oleh NVIDIA, AMD, Adobe, dan lainnya. Dana baru akan digunakan untuk melatih generasi berikutnya dari “General World Model” GWM-1. Model ini bertujuan menyatukan eksplorasi lingkungan, karakter percakapan, dan operasi robotika, menandai transformasi Runway dari alat kreasi video menjadi engine dasar simulasi realitas (Sumber: Runway, 智东西)

Runway完成3.15亿美元E轮融资

Mantan CEO GitHub mendirikan Entire: Mendapatkan pendanaan Seed senilai $60 juta : Thomas Dohmke mendirikan Entire, yang bertujuan merestrukturisasi siklus hidup pengembangan perangkat lunak di era “Agent menulis kode”. Produk intinya, Checkpoints, dapat secara otomatis menangkap jejak penalaran Agent dan menulisnya ke Git, menyelesaikan masalah “Amnesic Development”. Microsoft M12 ikut berinvestasi, menunjukkan taruhan strategis raksasa pada platform pengembangan Agent-native (Sumber: Thomas Dohmke, InfoQ)

前GitHub CEO创办Entire

Modular mengakuisisi BentoML: Mengintegrasikan ekosistem deployment AI dan optimasi hardware : Modular, pengembang bahasa Mojo, mengumumkan akuisisi BentoML, menggabungkan platform deployment cloud BentoML yang matang dengan engine MAX dan kemampuan optimasi hardware Mojo. Langkah ini bertujuan menciptakan infrastruktur AI Full-stack dari pengembangan hingga deployment produksi skala besar. BentoML akan tetap Open-source, membantu perusahaan menjalankan aplikasi AI secara efisien di berbagai hardware (Sumber: clattner_llvm)

🌟 Komunitas

Utang teknis menjadi “liabilitas yang terdepresiasi”: AI coding membentuk kembali pandangan rekayasa perangkat lunak : Komunitas mendiskusikan logika baru “Ship fast, create tech debt”. Pengembang berpendapat bahwa dengan lompatan kemampuan migrasi dan refactoring kode AI setiap enam bulan, biaya pembersihan utang teknis di masa depan akan jauh lebih rendah daripada sekarang. Pandangan ini meruntuhkan keyakinan rekayasa perangkat lunak tradisional, menjadikan “luncurkan dulu, refactor kemudian” sebagai strategi optimal di era Agent (Sumber: theo, dejavucoder)

Perang iklan AI Super Bowl: Duel nilai antara Anthropic dan OpenAI : Anthropic menayangkan iklan di Super Bowl yang menyatakan “Claude tidak akan pernah ada iklan”, menyindir tindakan OpenAI yang menguji fitur iklan. Sam Altman kemudian mengecam hal tersebut sebagai “tidak jujur”. Perpecahan publik ini mencerminkan perbedaan filosofis dalam industri AI antara “komersialisasi cepat” dan “deployment yang bertanggung jawab”, serta memicu fluktuasi tajam pada saham perangkat lunak karena kekhawatiran Agent akan menggantikan SaaS (Sumber: Sam Altman, 硅星GenAI)

超级碗AI广告战

Eksodus pakar keamanan AI: Apakah dunia berada dalam “Polycrisis”? : Mrinank Sharma, kepala keamanan senior Anthropic, mengundurkan diri untuk mengejar gelar di bidang puisi. Surat pengunduran dirinya memperingatkan bahwa AI menjadi “kecerdasan non-manusia” dan nilai-nilai sulit mendominasi tindakan di bawah tekanan realitas. Geoffrey Hinton juga menyatakan bahwa manusia sedang menghadapi “kecerdasan asing”, dan pelajaran pertama adalah belajar untuk hidup berdampingan alih-alih mengendalikan. Ini memicu diskusi mendalam di komunitas tentang apakah perkembangan AI telah melampaui pemahaman manusia (Sumber: Mrinank Sharma, CSDN)

AI安全专家离职潮

Persaingan raksasa AI medis: Ant Afu dan Hydrogen Ion memperebutkan “Health Entry” : Ant Afu mencapai lebih dari 30 juta pengguna aktif bulanan berkat penetrasi iklan di seluruh domain; Ali Health, Baidu, dan ByteDance juga melakukan tata letak yang intensif. Diskusi komunitas berfokus pada apakah AI dapat meredakan kecemasan medis, serta cara memecahkan dilema profitabilitas “hanya ramai tapi tidak menguntungkan”. Saat ini, AI medis beralih dari sekadar “konsultasi” ke manajemen kesehatan seluruh skenario, namun verifikasi profesional dan kepatuhan medis tetap menjadi garis merah utama (Sumber: 蚂蚁阿福, Tech星球)

Apakah belajar bahasa Inggris masih berguna di era AI? : Menanggapi pandangan bahwa “kacamata penerjemah akan mengakhiri pembelajaran bahasa asing”, komunitas melakukan debat sengit. Pihak kontra berpendapat bahwa terjemahan AI memiliki risiko “Alignment Censorship” dan “halusinasi”, tanpa kemampuan bahasa asing seseorang akan kehilangan kemampuan verifikasi dan akses ke informasi dengan kepadatan tertinggi; lebih dalam lagi, bahasa adalah cara melihat dunia, AI dapat membantu output tetapi tidak boleh menggantikan proses pembentukan diri manusia (Sumber: dotey)

学英语在AI时代是否还有用?

💡 Lainnya

Liga pertarungan robot humanoid pertama URKL dimulai : EngineAI meluncurkan kompetisi pertarungan robot humanoid komersial pertama di dunia dengan hadiah utama 10 juta. Kompetisi ini bertujuan untuk mengasah ledakan instan, algoritma keseimbangan, dan perlindungan struktural robot melalui konfrontasi intensitas tinggi. Pertarungan dianggap sebagai “medan latihan berat” bagi kemampuan robot humanoid, yang lebih mampu memverifikasi batas praktis Embodied Intelligence daripada sekadar demonstrasi berjalan (Sumber: 众擎机器人, 界面新闻)

首个人形机器人格斗联赛URKL启动

CellTransformer: AI memetakan otak manusia dalam hitungan jam yang biasanya memakan waktu seabad : Tim dari University of California, San Francisco menggunakan arsitektur Transformer untuk mengembangkan CellTransformer, yang hanya dalam beberapa jam menyelesaikan klasifikasi dan pemetaan 10,4 juta sel dari 5 ekor mencit, dengan akurasi yang menyamai dan melampaui akumulasi manual manusia selama seabad. Teknologi ini diharapkan dapat diperluas ke otak manusia untuk mengungkap sub-wilayah halus dari area saraf yang kompleks (Sumber: Reza Abbasi-Asl, 量子位)

CellTransformer

Warner Music China meluncurkan idola musik AI pertama di dunia : Warner Music China merilis karya Debut idola AI, memicu diskusi tentang “apakah AI akan menggantikan idola manusia”. Meskipun kualitas videonya sangat baik, evaluasi komunitas terbagi: ada yang kagum dengan standar industri sinkronisasi audio-visualnya, namun ada juga yang mengkritik lirik yang tidak logis dan kurangnya jiwa seni, menganggapnya masih dalam tahap “pamer teknologi” (Sumber: , ChatGPT Reddit)

AI音乐偶像