Berita AI - 2026-01-24(Edisi pagi)

Kata Kunci：AI, Claude Code, OpenAI, Kolaborasi Multi-Agent, Penetapan Harga Berbasis Hasil, Komersialisasi vLLM

🔥 Fokus

Pembaruan Besar Claude Code: Task Resmi Gantikan Todo, Membuka Era Kolaborasi Multi-Agent : Claude Code dari Anthropic mendapatkan pembaruan inti dengan diperkenalkannya fitur “Tasks” yang dirancang khusus untuk proyek engineering kompleks jangka panjang, menggantikan sepenuhnya alat Todo lama. Perubahan ini didukung oleh kemampuan memori konteks dan otonomi kuat dari Opus 4.5, membuatnya tidak lagi bergantung pada alat pencatatan sederhana. Tasks mendukung penyiaran status tugas secara real-time antar multi-Agent dan sesi, serta memperkenalkan manajemen “dependency relationship”, dengan data yang disimpan secara native di sistem file lokal (~/.claude/tasks). Ini menandai evolusi AI dari sekadar alat bantu koding menjadi “insinyur digital” yang mampu mengelola proyek besar dengan kemampuan kolaborasi otonom, secara signifikan meningkatkan batas otomatisasi dalam rekayasa perangkat lunak kompleks. (Sumber: dotey, yoheinakajima, dejavucoder)

Perubahan Dramatis Model Bisnis OpenAI: Rencana “Outcome-Based Pricing” Guncang Industri : CFO OpenAI Sarah Friar baru-baru ini mengisyaratkan peralihan ke “Outcome-Based Pricing”, yaitu penetapan harga berdasarkan nilai yang diciptakan AI (seperti penemuan obat, keuntungan bisnis) alih-alih sekadar perhitungan Token. Sinyal ini memicu penolakan keras komunitas terhadap “royalti versi AI”, yang dianggap sebagai “pajak atas output pabrik”. Sementara itu, Sam Altman mengungkapkan bisnis API mereka dalam sebulan terakhir mengalami peningkatan ARR (Annual Recurring Revenue) sebesar $10 miliar, menunjukkan ketergantungan tinggi pasar enterprise pada model closed-source. Perubahan logika penetapan harga ini dapat mendorong lebih banyak perusahaan beralih ke deployment lokal untuk menghindari risiko pembagian keuntungan potensial. (Sumber: Reddit, nickaturley)

Tim Inti vLLM Dirikan Inferact: Terobosan Komersialisasi Mesin Inferensi Open Source : Anggota pendiri proyek vLLM secara resmi mengumumkan pendirian startup Inferact, yang bertujuan mengkomersialkan mesin inferensi open source paling populer di dunia ini. Misi Inferact adalah mengoptimalkan efisiensi inferensi untuk lebih menekan biaya penggunaan AI. Meski ada kekhawatiran komunitas tentang “perusakan open source”, langkah ini juga menandakan persaingan di sisi inferensi telah memasuki fase matang, dengan kehadiran tim inti yang akan mempercepat terobosan performa dan stabilitas vLLM dalam skenario enterprise. (Sumber: QuixiAI)

Pergeseran Paradigma Pelatihan AI: Dari Sekadar Menumpuk Komputasi ke Kurasi Data yang Halus : Peneliti dari OpenAI, Thinking Machines, dan Amazon mendorong pemikiran ulang tentang cara melatih LLM, dengan fokus pada peningkatan efisiensi pemanfaatan data dan kualitas kurasi. Startup DatologyAI berada di pusat gelombang ini, bertujuan mengatasi keterbatasan inti dalam inferensi dan keandalan untuk mengatasi masalah data sparse dan noise dalam pelatihan model saat ini. Tren ini menunjukkan bahwa babak kedua kompetisi AI tidak lagi sekadar perlombaan komputasi, melainkan pertarungan intelektual tentang siapa yang bisa mengekstrak “sinyal berkualitas tinggi” dari data masif secara lebih efisien. (Sumber: code_star)

🎯 Tren

World Labs Fei-Fei Li Mencari Pendanaan dengan Valuasi $50 Miliar : Startup kecerdasan spasial World Labs berencana mengumpulkan $500 juta dengan target valuasi mencapai $50 miliar. Tim Li Fei-Fei fokus pada penelitian “world model”, yang bertujuan memberi AI kemampuan memahami ruang fisik 3D seperti manusia. Di tengah kebuntuan pertumbuhan LLM, kecerdasan spasial dipandang sebagai jalur kunci menuju AGI, menarik suntikan modal terus-menerus dari investor top. (Sumber: Dorialexander)

Sakana AI Jalin Kemitraan Strategis dengan Google : Unicorn AI Jepang Sakana AI mengumumkan kemitraan mendalam dengan Google, selain mendapatkan investasi tambahan, juga akan menggabungkan infrastruktur Google dengan teknologi “AI Scientist” dan Agent Sakana untuk mempercepat terobosan penemuan ilmiah. Kemitraan ini secara khusus menekankan penyediaan solusi di bidang seperti keuangan dan pemerintah yang memiliki persyaratan sangat tinggi terhadap kedaulatan data, menunjukkan ambisi Google dalam tata letak ekosistem AI regional. (Sumber: hardmaru)

Biaya Inferensi Anthropic Melebihi Anggaran 23% Memicu Spekulasi Teknis : Kabar bocor menunjukkan biaya inferensi Anthropic di server Google dan Amazon 23% lebih tinggi dari perkiraan. Analis industri berpendapat ini mungkin mengindikasikan strategi kuantisasi (Quantization) mereka gagal mencapai target pengurangan biaya, atau konsumsi aktual model dalam pemrosesan konteks panjang jauh melampaui tujuan desain model. Ini mencerminkan bahwa bahkan vendor AI top pun masih menghadapi tantangan besar dalam menyeimbangkan kinerja model dengan biaya operasi komersial. (Sumber: code_star)

Gelombang Pergi Peneliti AI Samsung Ungkap Dilema Budaya Perusahaan : Peneliti ternama Alexia Jolicoeur-Martineau mengumumkan meninggalkan Samsung, menyatakan hidupnya menjadi “neraka” karena masalah manajemen meskipun telah menciptakan nilai komersial besar. Peristiwa ini memicu diskusi hangat di komunitas, mengungkap ketidaksesuaian serius antara budaya manajemen kuno perusahaan teknologi tradisional dengan mekanisme insentif inovatif dalam menarik dan mempertahankan talenta AI top. (Sumber: cloneofsimo, QuixiAI)

🧰 Alat

Plano 0.4.3: Perkenalkan Filter Chain untuk Optimalkan Alur Kerja Agent : Rilis terbaru Plano memperkenalkan “Filter Chains”, memungkinkan developer menangkap langkah alur kerja yang dapat digunakan kembali di bidang data tanpa mengulang logika dalam kode aplikasi. Fitur ini mendukung pemeriksaan prompt, modifikasi permintaan, atau penghentian dini alur jika gagal mematuhi compliance. Selain itu, fitur autentikasi passthrough baru mendukung layanan proxy seperti OpenRouter, sangat memudahkan manajemen API dalam skenario multi-tenant. (Sumber: Reddit)

File Brain: Mesin Pencari Semantik Lokal Open Source : Ini adalah alat desktop yang berjalan 100% lokal, menggabungkan OCR dengan model embedding multibahasa. Ia dapat mengindeks otomatis PDF, gambar, dan dokumen Office, mendukung pencarian dengan bahasa alami (seperti “cari tiket pesawat tahun lalu”), bahkan jika nama file acak pun dapat menemukan konten dengan tepat. Alat ini mengatasi masalah ketidakmampuan pencocokan kata kunci tradisional dalam memahami konten hasil scan atau screenshot, dengan perlindungan privasi pengguna penuh. (Sumber: Reddit)

Todoist Ramble: Manajemen Tugas Berbasis Suara : Fitur Ramble dari Todoist memungkinkan pengguna mendeskripsikan tugas melalui suara, lalu AI akan menguraikannya secara otomatis dan mengorganisir ke dalam daftar prioritas. Diskusi komunitas menunjukkan bahwa dengan menggabungkan alat seperti Whisper dan n8n dapat mereplikasi alur serupa, tetapi integrasi native Todoist dan dukungan server MCP memberinya keunggulan signifikan dalam kemudahan penggunaan, menjadi contoh klasik pengoptimalan produktivitas pribadi oleh AI. (Sumber: Reddit)

Step3-VL-10B: Model Visual Kuat yang Mendukung Pemecahan Masalah Geometri : Model visual Step3-VL-10B kini mendukung chatllm.cpp, dan menunjukkan kinerja luar biasa dalam tugas penalaran visual kompleks seperti pemecahan masalah geometri, dengan performa yang sebanding dengan model Qwen skala 200B. Potensinya dalam berjalan di perangkat edge memberikan pilihan baru untuk aplikasi visual AI lokal. (Sumber: Reddit)

📚 Pembelajaran

SAMTok: Tokenisasi Mask Memberikan Kemampuan Level Pixel pada MLLM : Makalah mengusulkan tokenizer mask diskret SAMTok yang dapat mengubah mask area apa pun menjadi dua Token khusus. Dengan memperlakukan mask sebagai Token bahasa, model multimodal dasar (seperti QwenVL) dapat mempelajari kemampuan level pixel tanpa modifikasi arsitektur. Setelah pelatihan pada 209 juta mask beragam, model ini mencapai level SOTA dalam tugas seperti deskripsi area dan segmentasi referensi, menyediakan paradigma sederhana untuk penskalaan tugas level pixel MLLM. (Sumber: HuggingFace)

HERMES: KV Cache sebagai Memori Hierarkis untuk Pemahaman Video : Penelitian ini mengusulkan arsitektur tanpa pelatihan HERMES yang memperlakukan KV Cache sebagai kerangka memori hierarkis yang mengemas informasi video dalam granularitas berbeda. Dalam proses inferensi, ia dapat menggunakan kembali KV Cache yang kompak, mempertahankan akurasi tinggi dengan mengurangi 68% Token video, dengan TTFT (Time To First Token) 10 kali lebih cepat dari SOTA saat ini, mengatasi masalah memori dan latensi dalam pemahaman video streaming. (Sumber: HuggingFace)

DLCM: Menuju Model Konsep Besar Dinamis untuk Penalaran Semantik Adaptif : Penelitian ini menantang mode komputasi level Token tradisional LLM, mengusulkan pengenalan granularitas “konsep” yang dapat dipelajari antara Token dan kalimat. Model DLCM dapat mengalokasikan sumber daya komputasi secara adaptif berdasarkan kepadatan informasi, meniru penalaran konsep logis manusia. Eksperimen menunjukkan bahwa dengan biaya penalaran yang sama, arsitektur ini menunjukkan peningkatan performa signifikan dalam pengujian benchmark intensif penalaran. (Sumber: GeZhang86038849)

Tinjauan Agentic Reasoning: Evolusi dari “Berpikir” ke “Bertindak” : Tinjauan bersama oleh Meta dan Google DeepMind dkk secara sistematis mengeksplorasi bagaimana penalaran LLM beralih dari pemikiran murni (CoT) ke tindakan dalam lingkungan nyata. Meliputi topik inti seperti single-agent, kolaborasi multi-agent, umpan balik lingkungan, dan memori jangka panjang, serta menunjukkan tantangan kunci Agent saat ini dalam perencanaan jarak jauh dan konstruksi world model. (Sumber: TheTuringPost)

💼 Bisnis

Bisnis API OpenAI Tumbuh $10 Miliar ARR dalam Sebulan : Sam Altman mengungkapkan bahwa meskipun publik lebih memperhatikan ChatGPT, bisnis API mereka dalam sebulan terakhir menambah lebih dari $10 miliar ARR, menunjukkan ketergantungan tinggi developer dan enterprise pada infrastruktur OpenAI. (Sumber: nickaturley)

🌟 Komunitas

Diskusi Besar Gelembung AI: Kesenjangan antara Valuasi dan Realitas : Komunitas hangat memperdebatkan apakah valuasi tinggi startup seperti Thinking Machines menandakan gelembung AI. Elon Musk meramalkan 2026 sebagai tahun singularitas, tetapi dalam kenyataannya AI masih menunjukkan “IQ doktor matematika dengan akal sehat magang”. Shane Gu mencatat bahwa valuasi telah menjadi indikator paling andal untuk mengukur gelembung, sementara pasokan energi dan chip tetap menjadi hambatan fisik yang tidak bisa diabaikan dalam perjalanan menuju AGI. (Sumber: shaneguML, Yuchenj_UW)

Kesadaran Deployment Lokal Bangkit: Menghadapi Risiko “Pembagian” API Cloud : Menanggapi rencana potensial outcome-based pricing OpenAI, komunitas LocalLLaMA memicu gelombang “menimbun GPU”. Pengguna berpendapat bahwa bergantung pada API cloud seperti bergantung pada jaringan listrik, meskipun nyaman tetapi kurang kontrol; sementara deployment lokal seperti memasang panel surya, meskipun investasi awal besar tetapi memastikan keuntungan proyek tidak dipaksa dibagi oleh pemasok model. Kesadaran “AI berdaulat” ini dengan cepat menyebar di kalangan developer. (Sumber: Reddit)

Akun Peneliti Kimi Diretas Peringatan : Komunitas mengungkapkan akun X peneliti Kimi Crystal diretas dan digunakan untuk mengirim pesan pribadi penipuan. Peristiwa ini mengingatkan praktisi AI bahwa di tengah fokus pada terobosan teknologi, perlindungan keamanan akun pribadi dan data sensitif harus diperkuat untuk menghindari menjadi target serangan. (Sumber: [Kimi

🔥 Fokus

🎯 Tren

🧰 Alat

📚 Pembelajaran

💼 Bisnis

🌟 Komunitas

Tag Terkait

Related Posts

Berita AI – 2026-07-21

Berita AI – 2026-07-20

Berita AI – 2026-07-19