Kata Kunci:Infrastruktur AI, AI Berdaulat, Agen, Model Kue Lima Lapis, Arsitektur Engram, Kompresor Kognitif Agen
🔥 Fokus
NVIDIA Jensen Huang di Forum Davos: Teori “Lima Lapis Kue” Infrastruktur AI : CEO NVIDIA Jensen Huang mempresentasikan model “Lima Lapis Kue” industri AI di Forum Davos 2026: energi, chip, layanan cloud, model, dan aplikasi. Dia menyatakan bahwa investasi triliunan dolar saat ini hanyalah awal, dan gelombang infrastruktur bernilai puluhan triliun dolar akan datang. Huang menekankan bahwa AI harus dianggap sebagai infrastruktur nasional (AI berdaulat), dan menggunakan contoh peningkatan jumlah dokter radiologi untuk berargumen bahwa AI mengotomatisasi “tugas” bukan menggantikan “tujuan”, menciptakan permintaan baru melalui peningkatan efisiensi. Perspektif ini menawarkan sudut pandang baru dalam menghadapi kecemasan pengangguran akibat AI, bahwa AI adalah penguat produktivitas, bukan lawan manusia (Sumber: NVIDIA)

Anthropic Rilis “Konstitusi Claude”: Mendefinisikan Kepribadian dan Nilai Independen AI : Anthropic secara resmi merilis konstitusi baru Claude, yang merinci visi perilaku dan nilai intinya. Dokumen ini tidak hanya menjadi panduan pelatihan, tetapi juga berusaha membentuk Claude sebagai “entitas dunia” baru yang berbeda dari konsep fiksi ilmiah sebelumnya. Konstitusi menekankan independensi Claude di luar data pelatihan, bahkan mencakup kewajiban Anthropic terhadap AI. Komunitas bereaksi kuat, menganggap ini menandai transisi AI dari alat menjadi entitas dengan “kepribadian digital”, sekaligus memicu diskusi mendalam tentang menyeimbangkan kendala dan otonomi AI (Sumber: Anthropic)

DeepSeek Luncurkan Arsitektur Engram: Terobosan Komputasi dengan Mengganti HBM menggunakan DRAM : Laporan Morgan Stanley sangat menghargai makalah terbaru DeepSeek yang mengusulkan modul Engram. Arsitektur ini memisahkan penyimpanan pola statis dan inferensi dinamis melalui mekanisme “memori bersyarat”, memungkinkan model memindahkan banyak pengetahuan ke memori sistem (DRAM) yang lebih murah dan hanya mencari saat diperlukan. Terobosan ini efektif mengurangi hambatan memori bandwidth tinggi (HBM) yang mahal, membuktikan bahwa inovasi algoritma dapat mencapai “lebih dengan sedikit” dalam lingkungan komputasi terbatas. Morgan Stanley memprediksi bahwa DeepSeek V4 dengan arsitektur ini dapat berjalan di kartu grafis konsumen (seperti RTX 5090), mengubah aturan ekspansi AI (Sumber: Morgan Stanley)

Rahasia Proyek “Macrohard” xAI Terungkap: Komputer Mobil Tesla Bisa Jadi Basis Jutaan Agent : Mantan insinyur xAI Sulaiman Ghori membocorkan detail proyek internal bernama “Macrohard” dalam podcast. Proyek ini bertujuan membangun “simulator manusia”, mensimulasikan operasi keyboard dan mouse manusia dengan kecepatan 8x untuk mengotomatisasi pekerjaan kantor. Yang paling mengejutkan adalah rencana xAI menggunakan jutaan komputer mobil Tesla yang menganggur (platform HW4) untuk menempatkan Agent ini, menghindari siklus pembangunan pusat data tradisional melalui jaringan terdistribusi. Ghori kemudian dipecat karena pelanggaran, tetapi budaya “ruang perang” dan jadwal agresif yang diungkapkannya telah memicu penilaian ulang industri terhadap potensi kompetitif xAI (Sumber: The Information)

Google Gandeng Shopify Masuk AI E-commerce: Beralih dari Pintu Pencarian ke Lingkaran Transaksi Tertutup : Google mengumumkan peluncuran Perjanjian Komersial Universal (UCP), bekerja sama dengan Shopify, Walmart, dan raksasa lainnya untuk menjadikan Gemini sebagai pintu belanja lengkap. Pengguna dapat menyelesaikan seluruh proses mulai dari perbandingan harga, parameter, hingga pembayaran instan dalam kotak dialog, tanpa perlu beralih ke aplikasi. Gemini bahkan dapat menelepon toko offline untuk memastikan stok. Langkah ini dianggap sebagai serangan balik terhadap fitur “pembayaran instan” ChatGPT, menandai pergeseran paradigma dari model iklan pencarian ke “bisnis agen cerdas”, di mana vendor model besar menjadi kekuatan baru yang membentuk kembali lanskap ritel global (Sumber: Google)

🎯 Tren
Rencana Peningkatan Siri “Campos” dan Perangkat Keras AI Apple Bocor : Menurut bocoran, Apple diam-diam mengembangkan perangkat AI yang dapat dikenakan berbentuk mirip AirTag (AI Pin), dilengkapi dengan banyak kamera dan sensor, dijadwalkan rilis pada 2027. Sementara itu, Siri baru dengan kode nama “Campos” akan debut September ini, terintegrasi dengan model Google Gemini 3, memiliki kemampuan “persepsi layar” untuk langsung mengoperasikan file dan aplikasi di layar. Langkah Apple ini bertujuan melawan OpenAI dan Meta di bidang AI sisi perangkat melalui keunggulan integrasi perangkat lunak dan keras, dengan target produksi perangkat keras pertama mencapai 20 juta unit (Sumber: The Information)

Microsoft Rilis VibeVoice-ASR: Memproses Audio Panjang Satu Jam Sekaligus : Microsoft membuka model pengenalan suara VibeVoice-ASR skala 9B di Hugging Face. Model ini menghilangkan praktik tradisional memotong audio, mendukung pemrosesan audio 60 menit sekaligus dalam jendela token 64K, efektif menghindari kehilangan konteks global dan kebingungan pelacakan pembicara. Pengujian menunjukkan kinerja stabil dalam latar belakang kompleks (seperti mengenali suara manusia dalam musik) dan teks panjang (seperti membaca novel), dengan akurasi rata-rata 91,9%, mendukung konfigurasi kata kunci untuk mengoreksi pengenalan nama khusus (Sumber: Microsoft)

Meta Luncurkan Kerangka Dr. Zero: Evolusi Mandiri Agent Tanpa Data : Lab Kecerdasan Super Meta mengusulkan kerangka Dr. Zero, memungkinkan agen cerdas berevolusi secara efisien tanpa data berlabel. Kerangka ini menggunakan mekanisme kolaborasi “proposer-solver”, memanfaatkan mesin pencari untuk aktif mengeksplorasi dan menghasilkan masalah kompleks. Teknologi inti HRPO (Hierarchical Relative Policy Optimization) mengelompokkan masalah serupa untuk membangun benchmark, menghindari pengambilan sampel bersarang yang mahal, mengungguli baseline sepenuhnya diawasi sebesar 14,1% dalam tugas tanya jawab kompleks, memberikan jalan baru untuk mengatasi masalah kekurangan data pelatihan AI (Sumber: Meta)

Industri Beralih ke Evaluasi Tugas Jangka Panjang: Beberapa Benchmark Skenario Nyata Dirilis : Fokus evaluasi AI beralih dari matematika/kode ke tugas jangka panjang. APEX-Agents yang baru dirilis menguji kemampuan kolaborasi profesional Agent di Google Workspace; DSAEval mencakup 641 masalah ilmu data nyata. Pengujian menunjukkan GPT-5.2 unggul dalam efisiensi, sedangkan Claude-Sonnet-4.5 terkuat dalam kinerja keseluruhan. Munculnya benchmark ini mencerminkan konsensus industri: yang membatasi perkembangan Agent bukan lagi kemampuan penalaran, tetapi kemampuan mempertahankan konsistensi logika dan kontrol memori dalam siklus panjang (Sumber: Mercor, DSAEval)
Kompresor Kognitif Agent (ACC): Kontrol Memori Terinspirasi Biologi : Peneliti mengusulkan Agent Cognitive Compressor, bertujuan menyelesaikan masalah “pembusukan konteks” Agent dalam percakapan multi-putaran. ACC tidak hanya memutar ulang percakapan sejarah, tetapi mempertahankan “status kognitif terkompresi” dengan kendala arsitektur, hanya menyimpan variabel kunci seperti tujuan, entitas, dan hubungan. Eksperimen menunjukkan ACC mencapai tingkat halusinasi dan drift hampir nol dalam alur kerja kompleks lebih dari 50 putaran, jauh lebih baik daripada mode peningkatan pengambilan tradisional (RAG) (Sumber: DAIR.AI)

🧰 Alat
Prefect Horizon: Platform Hosting dan Tata Kelola Server MCP : Menanggapi popularitas Model Context Protocol (MCP), Prefect meluncurkan platform Horizon. Ini mengatasi titik sakit penyebaran server MCP tingkat perusahaan, menyediakan hosting berbasis peran (RBAC), log audit, dan fungsi penemuan alat. Horizon memungkinkan perusahaan mengekspos data dan alur kerja pribadi dengan aman ke AI Agent, mengangkat MCP dari protokol sederhana menjadi platform produktivitas yang dapat dikelola dalam skala besar (Sumber: Prefect)

CopilotKit + LangChain: Solusi Pembangunan Frontend untuk Agen Dalam : CopilotKit sekarang mendukung arsitektur Deep Agents yang diusulkan LangChain, memungkinkan pengembang membangun UI interaktif untuk Agent dengan kemampuan perencanaan hanya dengan beberapa baris kode. Alat ini mendukung output streaming, penyesuaian Skills, dan pengaturan sub-agen, mengatasi hambatan UI/UX yang dihadapi pengembang dalam membangun aplikasi Agent kompleks, memungkinkan Agent “perencanaan pertama” (seperti Manus, aplikasi Claude Code) dengan cepat diubah menjadi produk akhir (Sumber: CopilotKit)

Devin Review: Alat AI yang Merevolusi Pengalaman Tinjauan Kode : Cognition meluncurkan Devin Review, bertujuan mengatasi hambatan tinjauan manusia setelah AI menghasilkan banyak kode. Alat ini tidak hanya mencari bug, tetapi membantu manusia memahami logika PR yang kompleks dengan cepat melalui antarmuka yang didesain ulang. Ini mendukung penggunaan langsung di tautan GitHub dengan mengganti domain, dalam pengujian dapat menemukan kesalahan terkait di luar Diff. Logika intinya adalah: kode yang dihasilkan AI harus ditinjau oleh alat bantu AI yang lebih efisien, bukan membuat programmer terjebak dalam “sampah kode” (Sumber: Cognition)

Optimasi Lokal GLM-4.7 Flash: Konteks 200K Berjalan pada Satu Kartu : Komunitas memperbaiki dukungan cache KV vLLM untuk GLM-4.7-Flash dengan satu baris kode, mengaktifkan mekanisme MLA (Multi-head Latent Attention). Ini mengurangi penggunaan memori konteks 200K model 30B dari 180GB menjadi 10GB. Sekarang, satu RTX 5090 (32GB VRAM) dapat menjalankan model dengan kemampuan inferensi top ini dengan kecepatan penuh, menandai dimulainya era Agen Lokal berkinerja tinggi (Sumber: Zai_org)

📚 Pembelajaran
Kursus Praktis Gemini CLI: Membangun Alur Kerja Otomatisasi Multi-Langkah : DeepLearning.AI bekerja sama dengan Google meluncurkan kursus singkat gratis, mengajarkan pengembang menggunakan Gemini CLI untuk membangun agen sumber terbuka. Kursus mencakup seluruh alur dari operasi file lokal, integrasi alat pengembangan hingga panggilan layanan cloud, dengan fokus menunjukkan bagaimana menggunakan Agent untuk otomatisasi kode, pembuatan dasbor, dan perencanaan tugas kompleks. Cocok untuk pengembang yang ingin beralih dari sekadar memanggil API ke membangun alat produktivitas nyata (Sumber: DeepLearningAI)
Optimizer Hyperball: Percepatan Pelatihan 33% melalui Normalisasi : Peneliti Stanford mengusulkan pembungkus optimizer Hyperball. Metode ini mempertahankan norma bobot dan pembaruan konstan, memungkinkan kontrol langsung langkah efektif, menggantikan peluruhan bobot tradisional. Eksperimen membuktikan Hyperball dapat memberikan percepatan pelatihan 33% di atas optimizer seperti Muon, dan memiliki kemampuan transfer hyperparameter yang lebih kuat, menyediakan kerangka matematika yang lebih stabil untuk pelatihan model skala besar (Sumber: Kaiyue Wen)

NVIDIA Motive: Metode Atribusi untuk Generasi Video : Peneliti NVIDIA meluncurkan Motive, metode atribusi data berbasis gradien yang berpusat pada gerakan. Dengan mengisolasi dinamika waktu dari penampilan statis, Motive dapat mengidentifikasi video mana dalam set pelatihan yang memiliki dampak positif atau negatif pada gerakan yang dihasilkan. Ini memiliki nilai penelitian penting untuk mengoptimalkan kualitas pelatihan model generasi video dan memahami penyebab degradasi gerakan (Sumber: NVIDIA Research)
InT (Pelatihan Intervensi): Menyelesaikan Masalah Alokasi Kredit dalam Penalaran : Makalah mengusulkan metode Intervention Training, mengoptimalkan inisialisasi pembelajaran penguatan dengan memungkinkan model menemukan kesalahan pertama dalam jalur penalarannya sendiri dan memberikan saran intervensi satu langkah. Dibandingkan dengan RL standar yang hanya menghargai jawaban akhir, InT dapat mengoreksi langkah perantara dengan tepat. Pada benchmark IMO-AnswerBench, metode ini meningkatkan akurasi model 4B sebesar 14%, bahkan melampaui model skala 20B (Sumber: HuggingFace)
💼 Bisnis
OpenAI Berencana Mengumpulkan $50 Miliar dengan Valuasi $830 Miliar : Kabar menyebutkan Sam Altman baru-baru ini bertemu investor di UAE untuk mendiskusikan putaran pendanaan besar baru. Target pendanaan mencapai $50 miliar, dengan valuasi antara $750 miliar hingga $830 miliar. Dana ini terutama akan digunakan untuk mendukung pengeluaran komputasi OpenAI yang diproyeksikan mencapai $2 triliun sebelum 2030. Sementara itu, OpenAI menghadapi gugatan ganti rugi besar