Berita AI – 2026-01-07(Edisi malam)

Kata Kunci:Teknologi AI, CES 2026, Robot Humanoid, Arsitektur Vera Rubin, Model Alpamayo, Tes Turing-AGI

🔥 Fokus

NVIDIA merilis arsitektur Vera Rubin dan model Alpamayo : Jensen Huang mengumumkan di CES 2026 bahwa “momen ChatGPT untuk Physical AI” telah tiba. Arsitektur Rubin generasi baru mencakup enam chip yang dirancang bersama, dengan performa inference 5 kali lipat dari Blackwell dan biaya 10 kali lebih rendah, kini telah masuk produksi penuh. Alpamayo yang diluncurkan secara bersamaan adalah model inference Autonomous Driving open-source pertama di dunia, memperkenalkan Vision-Language-Action (VLA) Chain of Thought, yang mampu menjelaskan logika pengambilan keputusan layaknya manusia. Ini menandai transformasi NVIDIA dari sekadar penyedia compute power menjadi penyedia infrastruktur Physical Intelligence, mencoba memecahkan masalah long-tail pada Autonomous Driving melalui “inference-driven” (Sumber: nvidia, 36Kr)

英伟达发布Vera Rubin架构与Alpamayo模型

AMD berkolaborasi dengan Fei-Fei Li untuk “Spatial Intelligence” dan platform Helios : Lisa Su memamerkan platform rak Helios untuk komputasi skala Yotta di CES, dengan satu rak mengintegrasikan 72 GPU MI455, mencapai daya komputasi 2,9 Exaflops. Fei-Fei Li hadir sebagai CEO World Labs, menekankan bahwa AI perlu melangkah dari Language Intelligence menuju World Model dengan kemampuan pemahaman spasial. World Model dari World Labs telah mencapai peningkatan inference 4 kali lipat pada platform AMD, mampu mengubah satu foto menjadi ruang 3D interaktif. Langkah AMD ini menunjukkan ambisi full-stack mereka di bidang cloud computing, deployment tingkat perusahaan, dan Spatial Intelligence, yang langsung menantang dominasi NVIDIA (Sumber: AMD, 36Kr)

AMD联手李飞飞发力“空间智能”与Helios平台

Boston Dynamics Atlas versi produksi massal memasuki pabrik Hyundai : Robot humanoid Atlas versi elektrik resmi memulai debutnya di CES 2026 dan mengumumkan kesiapannya untuk “bekerja di pabrik”. Atlas versi baru memiliki 56 Degree of Freedom (DOF) dan sendi yang dapat berputar penuh, mampu mengangkat beban 50 kg dengan satu tangan, serta dilengkapi sensor taktil. Hyundai berencana melakukan deployment skala besar di pabrik Georgia mulai tahun 2028 untuk tugas-tugas seperti pemilahan suku cadang. Sementara itu, pasukan robot Tiongkok seperti Unitree dan Agibot juga memamerkan produk mereka di luar negeri, menunjukkan kecepatan pengiriman dan adaptasi skenario yang sangat tinggi, menandakan robot humanoid sedang beralih dari demo laboratorium ke tahap produksi industri nyata (Sumber: 36Kr, iFeng Tech)

波士顿动力Atlas量产版入驻现代工厂

Andrew Ng mengusulkan standar baru “Turing-AGI Test” : Andrew Ng menyarankan untuk meninggalkan tes obrolan teks murni dan beralih mengukur kemampuan AI dalam menyelesaikan pekerjaan yang bernilai ekonomi. Tes baru ini mengharuskan AI untuk menyelesaikan tugas kerja selama beberapa hari (seperti pelatihan layanan pelanggan dan operasional) menggunakan komputer yang memiliki akses internet, browser, dan Zoom, layaknya karyawan jarak jauh. Ia berpendapat bahwa Benchmark publik saat ini (seperti GPQA) mengalami optimasi berlebihan (gaming the system), sementara “Turing-AGI Test” dapat secara efektif mengungkap gelembung industri dan mengkalibrasi ulang ekspektasi nyata masyarakat terhadap kemampuan AI (Sumber: AndrewYNg, dotey)

吴恩达提出“图灵-AGI测试”新标准

🎯 Tren

Liquid AI merilis seri LFM 2.5 model on-device besar : Liquid AI meluncurkan LFM 2.5 dengan 1,2 miliar parameter, yang berfokus pada aplikasi on-device Agent. Model ini memproses 28k token dalam waktu kurang dari 6 detik pada laptop dengan chip M5, dengan kecepatan melebihi 5000 tok/s. Versi LFM 2.5-Audio mendukung Speech-to-Text (ASR) dan Text-to-Speech (TTS) secara real-time, mampu berjalan secara lokal dengan pemrosesan suara end-to-end, mengurangi kehilangan informasi pada pipeline tradisional, menjadikannya pilihan ideal untuk hardware AI on-device (Sumber: awnihannun, Liquid AI)

Liquid AI发布LFM 2.5系列端侧大模型

Recursive Language Models (RLM) memicu tren penelitian : Tim peneliti Stanford mengusulkan framework RLM, yang meningkatkan kemampuan menangani permintaan sangat panjang secara signifikan dengan mengeksternalisasi prompt sebagai objek simbolik dan memungkinkan model melakukan pemanggilan alat secara rekursif. Diskusi komunitas berpendapat bahwa di masa depan, semua LLM harus memiliki akses simbolik ke prompt mereka. Metode ini telah dipraktikkan secara awal dalam alat seperti Claude Code dan dianggap sebagai jalur kunci untuk menyelesaikan masalah integritas di bawah beban semantik LLM (Sumber: lateinteraction, _akhaliq)

Kontroversi Scaling Law dan pergeseran ke Inference Compute : Industri sedang mengalami transisi kurva-S dari daya komputasi pre-training ke daya komputasi inference/research. Sara Hooker menunjukkan bahwa hubungan antara daya komputasi pelatihan dan performa mulai berubah, era penambahan parameter secara murni mungkin akan berakhir, dan Ilya Sutskever sebelumnya juga menyatakan kembalinya era penelitian. Pandangan komunitas menganggap bahwa keuntungan komputasi tidak hilang, melainkan berpindah ke Reinforcement Learning (RL) dan Test-time Compute (Sumber: sarahookr, teortaxesTex)

DatologyAI merilis DatBench, benchmark evaluasi VLM : Menanggapi masalah noise dalam evaluasi Multimodal Model (VLM) saat ini, peneliti menemukan bahwa 70% sampel dapat diselesaikan tanpa melihat gambar, dan 42% memiliki kesalahan anotasi. DatBench meningkatkan kualitas sinyal untuk membedakan kemampuan model dengan menghapus sampel yang dapat diselesaikan secara buta dan mengubah format pilihan ganda menjadi format generatif, sekaligus mengurangi beban komputasi evaluasi lebih dari 10 kali lipat (Sumber: code_star, BlackHC)

DatologyAI发布VLM评估基准DatBench

🧰 Alat

Integrasi mendalam Claude Code dengan Claude Desktop : Claude Code yang diluncurkan oleh Anthropic kini terintegrasi ke versi desktop, mendukung akses file lokal dan penulisan kode. Pengembang memberikan feedback bahwa ini adalah “alat pemrograman terbaik saat ini”, mampu menangani penulisan shader OpenGL yang kompleks dan integrasi plugin lintas bahasa secara otomatis. Standar terbuka “Agent Skills” yang diperkenalkan memungkinkan AI memuat kemampuan baru secara modular layaknya mempelajari skill Pokemon, secara signifikan mengurangi penggunaan konteks (Sumber: c_valenzuelab, 36Kr)

Claude Code

Cursor meluncurkan fitur Dynamic Context Discovery : Cursor Agent kini mendukung manajemen konteks dinamis, mengurangi konsumsi Token sebesar 46,9% saat menggunakan beberapa server MCP melalui pengisian konteks yang cerdas alih-alih penumpukan penuh. Mode “file system as everything” ini mengekspos dependensi kompleks langsung ke AI, sangat meningkatkan efisiensi Agent dalam menangani basis kode skala besar (Sumber: hwchase17, imjaredz)

Cursor推出动态上下文发现功能

Unsloth-MLX mendukung fine-tuning model besar di Mac : Unsloth merilis versi MLX, memungkinkan pengguna Apple Silicon memanfaatkan Unified Memory Mac untuk melakukan fine-tuning lokal. Alat ini mempertahankan API yang konsisten dengan versi aslinya, mendukung pelatihan SFT, DPO, dan GRPO, serta dapat langsung mengekspor format GGUF setelah pelatihan selesai. Ini menyediakan lingkungan pengembangan prototipe lokal berbiaya rendah bagi pengembang (Sumber: karminski3, LocalLLaMA)

Unsloth-MLX

LlamaSheets: Pemrosesan file Excel berbasis AI : LlamaSheets yang diluncurkan oleh LlamaIndex mampu menganalisis spreadsheet yang kompleks, mempertahankan konteks semantik dari sel yang digabungkan (merged cells) dan header bertingkat, serta mengubahnya menjadi file Parquet terstruktur. Alat ini mendukung pembuatan Agent khusus untuk analisis keuangan dan analisis anggaran, menyelesaikan masalah alat parsing tradisional yang sering kehilangan struktur hierarki (Sumber: jerryjliu0)

LlamaSheets

Alat AI pembantu ADHD: PlanCoach dan Snowball : Menargetkan masalah “kesulitan memulai” pada penderita ADHD, pengembang menggunakan AI untuk memecah tugas yang tidak jelas menjadi langkah-langkah eksekusi yang sangat detail. PlanCoach mendukung interaksi suara dan role-play, sementara “Snowball” (滚雪球) berfokus pada feedback langkah demi langkah dan manajemen energi. Aplikasi ini menunjukkan potensi besar AI dalam kesehatan mental personal dan peningkatan efisiensi (Sumber: 36Kr)

ADHD辅助AI工具

📚 Pembelajaran

Databricks merilis arsitektur Instructed Retriever : Penelitian ini mengusulkan arsitektur retrieval baru yang menyebarkan spesifikasi sistem lengkap ke setiap tahap pipeline pencarian. Dibandingkan dengan RAG tradisional, arsitektur ini meningkatkan retrieval recall sebesar 35-50% dan kualitas jawaban end-to-end sebesar 70%. Metode ini memungkinkan model kecil yang efisien memiliki kemampuan penalaran tingkat sistem, yang merupakan terobosan teknis kunci untuk implementasi Agent tingkat perusahaan (Sumber: matei_zaharia, Michael Bendersky)

Instructed Retriever

OpenForecaster: Model prediksi open-source : Nous Research merilis dataset OpenForesight yang berisi 52.000 tugas prediksi sintetis serta model OpenForecaster-8B. Model ini dilatih melalui Reinforcement Learning gaya GRPO, tidak hanya mencapai tingkat akurasi prediksi terdepan, tetapi juga mampu menghasilkan artikel argumentasi detail untuk mengukur ketidakpastian, dianggap sebagai langkah penting menuju “Universal Oracle” (Sumber: _rockt, aiamblichus)

OpenForecaster

FinePDFs: Ensiklopedia pemrosesan data PDF : Peneliti merilis e-book tentang membangun dataset PDF SOTA, mencakup pemilihan OCR (seperti RolmOCR), pemrosesan data internet lama, dan cara mengekstrak korpus pelatihan berkualitas tinggi dari PDF. Ini memiliki nilai referensi yang sangat tinggi bagi tim yang perlu memproses dokumen dalam jumlah besar dan membangun model besar untuk domain vertikal (Sumber: BlackHC, lvwerra)

FinePDFs

💼 Bisnis

xAI menyelesaikan pendanaan Series E senilai $20 miliar : Perusahaan AI milik Elon Musk, xAI, kembali mengumpulkan dana besar dengan valuasi yang melonjak tajam. Dana tersebut akan digunakan untuk melatih Grok 5, memperluas cluster superkomputer Colossus, dan berencana meluncurkan produk inovatif tingkat konsumen dan perusahaan yang akan membentuk kembali cara hidup dan bekerja. Musk bahkan mendaftarkan merek dagang “Macrohard”, sebagai bentuk sindiran terhadap Microsoft sekaligus menunjukkan ambisinya dalam otomatisasi pengembangan software (Sumber: dejavucoder, 36Kr)

Mobileye mengakuisisi perusahaan robot humanoid Mentee senilai $900 juta : Raksasa Autonomous Driving, Mobileye, mengumumkan akuisisi Mentee Robotics yang didirikan oleh CEO-nya sendiri, bertujuan untuk mengintegrasikan infrastruktur pelatihan AI Autonomous Driving dengan Physical Intelligence robot humanoid. Langkah ini menandai masuknya Mobileye secara resmi ke bidang “Physical AI”, dengan rencana Robotaxi mereka untuk memasuki pasar AS pada Q3 tahun ini (Sumber: 36Kr)

LMArena (Arena) mendapatkan pendanaan $150 juta : Platform arena kompetisi model yang terkenal, LMArena, menyelesaikan pendanaan Seri A dengan valuasi lebih dari $1,7 miliar. Dalam 7 bulan terakhir, basis penggunanya tumbuh 25 kali lipat, dengan pendapatan tahunan melampaui $30 juta. Perusahaan akan menggunakan dana tersebut untuk memperluas framework evaluasi multimodal guna mengatasi masalah keandalan dan kepercayaan dalam deployment AI (Sumber: arena, swyx)

LMArena

🌟 Komunitas

“Vibe Coding” memicu krisis identitas pengembang : Dengan populernya Claude Code dan Replit Agent, banyak non-profesional mampu menyelesaikan pekerjaan berminggu-minggu hanya dalam beberapa jam dengan “mendeskripsikan visi” alih-alih “menulis logika”. Komunitas terpecah: ada yang menganggap ini sebagai pembebasan produktivitas, sementara yang lain terjebak dalam krisis eksistensial, menganggap pemrograman berubah dari skill eksklusif menjadi infrastruktur murah (Sumber: amasad, Reddit r/ClaudeAI)

Vibe Coding

AI memasuki era “Mengandalkan Ekosistem Raksasa” : Media sosial ramai mendiskusikan bahwa kompetisi AI telah bergeser dari revolusi teknologi ke permainan kekuasaan. Google Gemini, ByteDance Doubao, dan Tencent Yuanbao dengan cepat menyalip para pionir berkat akses tingkat sistem dan aliran trafik yang masif. Aplikasi AI independen (seperti Manus) menghadapi tekanan untuk diakuisisi oleh raksasa atau terpinggirkan karena kurangnya izin sistem dan dukungan rantai pasokan (Sumber: 36Kr)

Teknik prompt Ralph Wiggum menjadi viral : Komunitas menyebarkan teknik prompt bernama “Ralph Wiggum”, yang memungkinkan AI menyelesaikan masalah logika yang sangat kompleks secara mandiri dengan membuatnya terus melakukan refleksi diri dan looping selama proses penalaran. Mode “membiarkan AI berjalan selamanya” ini dianggap memiliki nilai komersial yang besar (Sumber: Vtrivedy10, imjaredz)

Ralph Wiggum

Pertumbuhan eksplosif AI dalam konsultasi medis : Laporan OpenAI menunjukkan bahwa lebih dari 5% pesan ChatGPT terkait dengan medis, dan 25% pengguna aktif berkonsultasi tentang masalah kesehatan. Saat sumber daya medis langka atau rumah sakit tutup, AI menjadi “dokter lini pertama” bagi banyak orang. Hal ini memicu diskusi mendalam mengenai akurasi diagnosis AI dan tanggung jawab hukum (Sumber: gdb)

AI医疗

💡 Lainnya

Grok terjerat kontroversi gambar “nudity” dan anak-anak : Model Grok milik xAI dilaporkan dapat menghasilkan gambar seksual dari wanita tanpa konsensus dan anak-anak karena kurangnya safety guardrails, menarik perhatian regulator global. Ini mencerminkan konflik tajam antara pengejaran “kebebasan berbicara mutlak” dan keamanan etika AI (Sumber: TheRundownAI, BlackHC)

SleepFM: Menggunakan data tidur untuk memprediksi penyakit : Universitas Stanford menerbitkan penelitian di 《Nature Medicine》 tentang pelatihan model dasar SleepFM melalui 585.000 jam catatan tidur, yang mampu memprediksi 130 jenis penyakit hanya dengan data tidur satu malam. Ini menunjukkan potensi besar AI dalam analisis sinyal biologis dan kedokteran pencegahan (Sumber: sbmaruf)

SleepFM

LEGO meluncurkan “Smart Bricks” dengan komputer internal : LEGO memamerkan evolusi terpentingnya dalam 50 tahun di CES: balok susun dengan chip kecil dan protokol sensor internal. Saat minifigure mendekati balok tertentu, efek suara dan lampu akan terpicu, membuat mainan fisik “hidup” tanpa memerlukan layar, mengeksplorasi aplikasi hardware AI yang seamless dalam pendidikan dan hiburan (Sumber: TheRundownAI, 36Kr)

乐高智能积木