Berita AI - 2025-06-12(Edisi pagi)

Kata Kunci：Meta, Scale AI, Kecerdasan Super, AGI, Anotasi Data, Pelatihan AI, Akurasi Model, Meta mengakuisisi saham Scale AI, Alexandr Wang memimpin tim Kecerdasan Super, Akurasi anotasi data AI 99.7%, Tingkat polusi data pelatihan menurun, Siklus pelatihan model dipersingkat 40%

🔥 Fokus

Meta Dilaporkan Mengeluarkan Hampir 15 Miliar USD untuk Akuisisi Saham Scale AI dan Menunjuk CEO-nya untuk Memimpin Tim “Super Intelligence” Baru: Meta berencana mengakuisisi 49% saham perusahaan anotasi data dan infrastruktur AI, Scale AI, dengan nilai sekitar 14,9 miliar USD, dan menunjuk CEO-nya yang baru berusia 28 tahun keturunan Tionghoa, Alexandr Wang, untuk memimpin “Super Intelligence Group” yang baru dibentuk. Langkah ini bertujuan untuk memperkuat daya saing Meta di bidang AI, terutama dalam hal data pelatihan berkualitas tinggi dan riset serta pengembangan AGI. Scale AI dikenal dengan akurasi anotasi datanya yang mencapai 99,7%, dan diharapkan dapat mengurangi tingkat kontaminasi data pelatihan model Meta dari 15% menjadi 2%, serta mempersingkat siklus pelatihan sebesar 40%. Akuisisi ini dianggap sebagai langkah kunci bagi Meta dalam upaya mengejar dan melampaui pesaingnya di kancah persaingan AI, sekaligus menyoroti posisi strategis inti data dalam pengembangan AI. (Sumber: 36氪, 36氪, 36氪, 36氪, Reddit r/LocalLLaMA)

OpenAI Dilaporkan Mencapai Kesepakatan Penyediaan Daya Komputasi Skala Besar dengan Google Cloud, Kemungkinan untuk Mengurangi Ketergantungan pada Microsoft: Dilaporkan bahwa OpenAI telah mencapai kesepakatan layanan cloud yang penting dengan Google Cloud. Google Cloud akan menyediakan daya komputasi yang dibutuhkan OpenAI untuk pelatihan dan deployment model AI-nya yang terus meningkat. Sebelumnya, Microsoft Azure adalah pemasok daya komputasi utama OpenAI. Langkah ini mungkin menandakan bahwa OpenAI sedang mencari diversifikasi sumber daya komputasi untuk mengurangi ketergantungan pada satu pemasok dan memenuhi kebutuhan komputasinya yang besar. Kerja sama ini merupakan kemenangan besar bagi Google Cloud, tetapi juga memicu diskusi tentang bagaimana Google Cloud akan menyeimbangkan sumber daya TPU antara bisnisnya sendiri dan kebutuhan pelanggan. (Sumber: 36氪, scaling01)

Mistral AI Merilis Model Inferensi Magistral, Memicu Pertanyaan dari Komunitas Mengenai Transparansi Benchmark-nya: Perusahaan AI Prancis, Mistral AI, meluncurkan seri model pertamanya yang dirancang khusus untuk inferensi, Magistral, termasuk versi open-source 24B Magistral Small dan Magistral Medium untuk perusahaan. Secara resmi dinyatakan dirancang khusus untuk penalaran logis multi-langkah yang transparan dan dapat dilacak, serta mendukung multi-bahasa. Namun, komunitas mempertanyakan hasil benchmark yang dirilis, menganggapnya tidak dibandingkan dengan model pesaing versi terbaru seperti Qwen dan DeepSeek R1, sehingga mungkin ada dugaan “menghindari persaingan”. Meskipun demikian, Magistral menunjukkan peningkatan signifikan pada benchmark matematika AIME-24 dibandingkan dengan Mistral Medium 3. (Sumber: 36氪, Reddit r/artificial, Reddit r/ArtificialInteligence, teortaxesTex, qtnx_, charles_irl, algo_diver)

Bapak Reinforcement Learning Richard Sutton: Dominasi LLM Hanya Sementara, Komputasi yang Dapat Diskalakan dan Pembelajaran Berdasarkan Pengalaman Adalah Masa Depan: Pemenang Turing Award dan Bapak Reinforcement Learning, Richard Sutton, memprediksi bahwa dominasi Large Language Model (LLM) saat ini hanya sementara. Meniru cara berpikir manusia hanya akan membawa peningkatan kinerja jangka pendek. Ia percaya masa depan AI terletak pada “era pengalaman”, yaitu Agent belajar dengan memperoleh data pengalaman melalui interaksi orang pertama dengan dunia, bukan bergantung pada data manusia yang statis. Sutton menekankan bahwa reinforcement learning adalah jalur inti menuju masa depan ini, dikombinasikan dengan algoritma deep learning yang berkelanjutan dan komputasi skala besar yang dapat diperluas, akan memungkinkan AI untuk menerobos kognisi yang ada dan mencapai inovasi sejati. (Sumber: 量子位)

Hugging Face Berkolaborasi dengan NVIDIA Meluncurkan “Training Cluster as a Service”, Menurunkan Hambatan untuk Melatih Model Besar: Hugging Face mengumumkan kolaborasi dengan NVIDIA untuk meluncurkan “Training Cluster as a Service”, yang bertujuan untuk mempermudah institusi riset global mendapatkan akses ke sumber daya klaster GPU besar untuk melatih berbagai model mutakhir. Layanan ini mengintegrasikan NVIDIA DGX Cloud Lepton dan sumber daya pengembangan Hugging Face, memungkinkan organisasi untuk meminta dan membayar penggunaan klaster GPU sesuai kebutuhan durasi. Langkah ini bertujuan untuk menjembatani “kesenjangan kaya-miskin GPU”, mendorong keragaman dan demokratisasi riset AI, dan telah diadopsi lebih awal oleh institusi riset dan perusahaan startup seperti TIGEM, Numina, dan Mirror Physics. (Sumber: HuggingFace Blog, clefourrier, mervenoyann, reach_vb)

🎯 Dinamika

OpenAI Merilis Model o3-pro dan Menurunkan Harga API o3 Secara Drastis: OpenAI meluncurkan model inferensi unggulan barunya, o3-pro, dan telah membukanya untuk pengguna ChatGPT Pro dan pengguna API. Sementara itu, harga API model o3 diturunkan secara drastis sebesar 80%, dan batas kecepatan o3 untuk pengguna ChatGPT Plus juga ditingkatkan dua kali lipat. Umpan balik komunitas menunjukkan bahwa o3-pro berkinerja lebih baik daripada Claude Opus 4 pada tugas non-kode, dan mencetak rekor baru di berbagai benchmark seperti Extended NYT Connections dan Creative Short Story Writing, bahkan berhasil memecahkan “Masalah Menara Hanoi 10 cakram” yang sebelumnya dipertanyakan kemampuannya oleh LLM dalam paper Apple. Namun, beberapa pengguna melaporkan bahwa o3-pro lebih lambat. OpenAI menyatakan bahwa penurunan harga o3 bukan melalui distilasi atau kuantisasi, melainkan berkat pekerjaan optimasi oleh para insinyur inferensi. (Sumber: snsf, SebastienBubeck, imjaredz, Teknium1, TheRundownAI, op7418, paul_cal, johnowhitaker, scaling01, scaling01, code_star, Teknium1)

OpenBMB Merilis Seri LLM Efisien untuk Perangkat Edge, MiniCPM4: OpenBMB meluncurkan seri model MiniCPM4, yang dirancang khusus untuk perangkat edge, dan diklaim mencapai percepatan generasi lebih dari 5 kali lipat pada chip edge tipikal. Seri ini mencakup MiniCPM4-8B, MiniCPM4-0.5B, serta versi terkuantisasi triner BitCPM4-1B/0.5B. MiniCPM4 menggunakan mekanisme sparse attention yang dapat dilatih, InfLLM v2, mendukung pemrosesan teks panjang 128K, dan menggabungkan algoritma pembelajaran dan teknik pelatihan yang efisien seperti Model Wind Tunnel 2.0, kuantisasi triner BitCPM, komputasi presisi rendah FP8, dan prediksi multi-token. Bersamaan dengan itu, dirilis pula dataset pra-pelatihan berkualitas tinggi dalam bahasa Mandarin dan Inggris, UltraFineweb, dan dataset fine-tuning terawasi, UltraChat v2. (Sumber: GitHub Trending)

MSRA dan Cendekiawan dari Universitas Tsinghua dan Peking Mengusulkan Paradigma Baru Pra-pelatihan yang Diperkuat (RPT): Microsoft Research Asia (MSRA) bersama dengan peneliti dari Universitas Tsinghua dan Universitas Peking mengusulkan paradigma pra-pelatihan LLM baru yang disebut Reinforced Pre-training (RPT). Metode ini mengintegrasikan reinforcement learning (RL) secara mendalam ke dalam tahap pra-pelatihan, di mana model akan menghasilkan urutan penalaran chain-of-thought sebelum memprediksi setiap token, dan menerima imbalan berdasarkan kebenaran prediksi. RPT bertujuan agar model beralih dari mempelajari korelasi token permukaan ke pemahaman makna yang lebih dalam. Eksperimen menunjukkan bahwa model 14B yang dilatih berdasarkan RPT dapat menandingi atau bahkan melampaui model pra-pelatihan tradisional 32B pada beberapa tugas penalaran, menunjukkan potensi besar dalam meningkatkan kemampuan pemodelan bahasa dan penalaran LLM. (Sumber: 量子位, omarsar0)

Meta Merilis Model Dunia Video V-JEPA 2 dan Benchmark Baru: Meta AI meluncurkan V-JEPA 2, sebuah model dunia dengan 1,2 miliar parameter yang dilatih pada data video, bertujuan untuk meningkatkan pemahaman dan kemampuan prediksi mesin terhadap dunia fisik. Model ini dapat berperan dalam perencanaan robot zero-shot, memungkinkannya merencanakan dan melaksanakan tugas di lingkungan yang tidak dikenal. Bersamaan dengan itu, Meta juga merilis tiga benchmark baru untuk mengevaluasi kemampuan model yang ada dalam menalar dunia fisik dari video. HuggingFace telah menyediakan dukungan pustaka transformers untuk V-JEPA 2. (Sumber: AIatMeta, ClementDelangue, Reddit r/LocalLLaMA)

ByteDance Merilis Model Generasi Video Seedance 1.0 Pro, Telah Tersedia di Aplikasi Doubao: ByteDance meluncurkan model generasi video terbarunya, Seedance 1.0 Pro (yaitu model Video 3.0 Pro dalam Dream Engine). Model ini menunjukkan kinerja luar biasa dalam pemahaman prompt, detail gambar, dan konsistensi representasi fisik, serta mampu menghasilkan video 5 detik 1080P. Saat ini, model tersebut telah dibuka untuk pengguna korporat melalui Volcano Engine, dan fungsi “Foto Bergerak” telah diluncurkan di aplikasi Doubao untuk dicoba gratis oleh pengguna. (Sumber: op7418)

Huawei Meluncurkan Platform Simulasi “Digital Wind Tunnel” untuk Mengoptimalkan Efisiensi Pelatihan dan Inferensi AI: Tim simulasi pemodelan Markov Huawei untuk pertama kalinya memamerkan teknologi “Digital Wind Tunnel” mereka, sebuah platform untuk melakukan “gladi bersih” di lingkungan virtual sebelum pelatihan dan inferensi model AI yang kompleks secara aktual. Platform ini mencakup tiga modul utama: Sim2Train (simulasi pelatihan), Sim2Infer (simulasi inferensi), dan Sim2Availability (simulasi ketersediaan tinggi). Tujuannya adalah untuk menyelesaikan masalah seperti ketidaksesuaian sumber daya perangkat keras dan keterkaitan sistem melalui simulasi dan optimasi otomatis, sehingga dapat melakukan pratinjau skema klaster puluhan ribu kartu dalam hitungan jam, menghindari pemborosan daya komputasi, dan meningkatkan efisiensi serta stabilitas pelatihan dan inferensi model besar AI. (Sumber: 量子位)

Gemini 2.5 Pro Menunjukkan Kinerja Unggul dalam Berbagai Benchmark: Model terbaru Google, Gemini 2.5 Pro (06-05), menunjukkan kinerja menonjol di berbagai papan peringkat AI publik. Model ini berkinerja terbaik dalam tes Live Fiction yang memproses 192k token, menduduki peringkat pertama di SimpleBench dengan skor 62,4%, dan menunjukkan kemampuan pemrosesan dokumen serta efektivitas biaya yang kuat dalam benchmark seperti IDP (Intelligent Document Processing) dan Aider (AI-assisted coding). Selain itu, beberapa pengguna melaporkan bahwa Gemini 2.5 Pro berhasil menyelesaikan semua soal bagian matematika JEE Advanced 2025. (Sumber: _philschmid, dilipkay)

Model Video Kling AI Memperbarui Fitur Sinkronisasi Bibir, Mendukung Pemilihan dan Pengeditan Karakter: Alat generasi video AI milik Kuaishou, Kling AI, baru-baru ini memperbarui fitur sinkronisasi bibir (Lip-sync). Fitur baru ini memungkinkan pengguna untuk memilih karakter tertentu dalam video yang dihasilkan untuk pencocokan bibir, dan dapat menyesuaikan waktu sinkronisasi audio dengan gerakan mulut. Pembaruan ini meningkatkan fleksibilitas dan realisme Kling AI dalam pembuatan video percakapan multi-karakter, dan merupakan kemajuan penting di bidang generasi video. (Sumber: Kling_ai, Kling_ai)

Delta Lake 4.0.0 Dirilis, Meningkatkan Kemampuan Lakehouse: Versi Delta Lake 4.0.0 telah resmi dirilis, membawa beberapa fitur baru yang penting, termasuk Catalog-Managed Tables versi pratinjau untuk tata kelola dan penemuan terpadu, ekstensi Delta Connect untuk Spark Connect, dukungan untuk tipe data Variant guna menangani data semi-terstruktur, dan fungsi DROP FEATURE instan yang memungkinkan penghapusan fitur tabel tanpa memotong riwayat atau downtime. Rilis ini bertujuan untuk meningkatkan pengalaman komunitas open lakehouse. (Sumber: matei_zaharia)

Hugging Face Meluncurkan Server MCP, Menyederhanakan Interaksi Model dan Alat: Hugging Face merilis versi pertama server Model Context Protocol (MCP) miliknya. Pengguna sekarang dapat menggunakan server ini melalui http://hf.co/mcp di aplikasi seperti Claude atau Cursor untuk mencari model, dataset, paper, aplikasi, atau informasi spesifik. Ini menandai langkah penting Hugging Face dalam mendorong interoperabilitas alat dan model dalam ekosistem AI, dan di masa depan mungkin akan diperluas ke fungsi seperti mengunggah, mengunduh, dan memulai PR. (Sumber: clefourrier, ClementDelangue)

Baidu Meluncurkan “AI Camera” yang Mengintegrasikan Penyimpanan dan Manajemen Cerdas serta Meningkatkan GenFlow Super Partner 2.0: Baidu Netdisk dan Baidu Wenku bersama-sama merilis fitur “AI Camera”, yang mengintegrasikan pengambilan foto, penyimpanan cloud, dan manajemen cerdas. Foto dapat secara otomatis diarsipkan ke album cloud dan mendukung klasifikasi serta pencarian cerdas melalui deskripsi bahasa alami. AI Camera juga memiliki berbagai kemampuan AI seperti beautification,科普 identifikasi objek, pembuatan coretan gambar sederhana, pemindaian tiket, dan konversi tabel tulisan tangan. Sementara itu, platform kolaborasi multi-agen cerdas “GenFlow Super Partner” ditingkatkan ke versi 2.0, yang dapat lebih mendalam menggabungkan data dan kebiasaan pengguna untuk menyediakan layanan pembuatan konten yang dipersonalisasi. (Sumber: 量子位)

ByteDance Merilis Kode dan Bobot Model Perbaikan Video SeedVR2 secara Open Source: Tim ByteDance SEED merilis kode inferensi dan bobot model untuk model perbaikan video satu langkah mereka, SeedVR2, yang kini tersedia di Hugging Face. Model ini menggunakan teknik diffusion adversarial post-training dan telah mencapai hasil yang signifikan dalam pemulihan video, terutama menunjukkan kinerja yang sangat baik dalam pemrosesan video beresolusi tinggi. (Sumber: _akhaliq)

GroqCloud Meluncurkan Model Qwen3-32B, Mendukung Lebih dari Seratus Bahasa dan Konteks 131k: Groq mengumumkan peluncuran model Qwen3-32B dari Tongyi Qianwen di platform cloud inferensi LPU-nya, GroqCloud. Model ini mendukung lebih dari 100 bahasa dan dialek, memiliki jendela konteks 131k, dan berjalan dengan kecepatan real-time khas perangkat keras Groq, menyediakan kemampuan pemrosesan multi-bahasa dan teks panjang yang kuat bagi para pengembang. (Sumber: JonathanRoss321)

CEO OpenAI Sam Altman Menyatakan Model Bobot Open Source Mereka Akan Ditunda Perilisannya: Sam Altman menyatakan bahwa model bobot open source OpenAI akan ditunda perilisannya hingga akhir musim panas tahun ini, bukan Juni seperti yang direncanakan semula. Dia mengungkapkan bahwa tim riset telah mencapai beberapa kemajuan yang “tidak terduga dan sangat menakjubkan” yang patut ditunggu, tetapi membutuhkan lebih banyak waktu untuk penyempurnaan. (Sumber: SebastienBubeck, Reddit r/LocalLLaMA, eliebakouch, teortaxesTex)

Digua Robot Merilis Kit Pengembangan RDK S100, Mengintegrasikan Arsitektur Otak Besar dan Kecil dalam Satu SoC: Digua Robot meluncurkan kit pengembangan robot terintegrasi komputasi dan kontrol pertama di industri dengan satu SoC, RDK S100. Kit ini mengadopsi desain arsitektur kolaboratif super heterogen yang menyerupai otak besar dan kecil manusia (CPU Arm Cortex-A78AE 6-core + BPU 80 TOPS sebagai “otak besar”, Arm Cortex-R52+ MCU 4-core sebagai “otak kecil”), mendukung kolaborasi efisien model besar dan kecil untuk embodied intelligence, dan menghubungkan loop tertutup “persepsi-keputusan-kontrol”. RDK S100 menyediakan antarmuka yang kaya dan infrastruktur pengembangan full-link, dengan harga pra-penjualan 2499 yuan. (Sumber: 量子位)

Aibook Smart Merilis Modul Komputasi AI E300, Dilengkapi SoC Buatan Dalam Negeri 50TOPS: Aibook Smart meluncurkan modul komputasi AI E300 yang ditujukan untuk skenario edge, dilengkapi dengan chip AI SoC hasil pengembangan mandiri, AB100. Modul ini menyediakan daya komputasi INT8 hingga 50TOPS, mendukung komputasi presisi campuran FP16/FP32, dan dilengkapi dengan bandwidth memori LPDDR5 102GB/s. E300 mengadopsi desain modular, bertujuan untuk menyediakan solusi AI edge buatan dalam negeri yang berkinerja tinggi, latensi rendah, dan sangat andal untuk industri seperti pendidikan, energi, dan medis, serta mendukung deployment model besar open-source mainstream dan berbagai model visual serta suara di edge. (Sumber: 量子位)

Huawei Mengungkap Teknologi Ketersediaan Tinggi Klaster Ascend Puluhan Ribu Kartu, Mencapai Ketersediaan Pelatihan 98%: Huawei untuk pertama kalinya mengungkapkan detail teknologi ketersediaan tinggi klaster daya komputasi Ascend puluhan ribu kartu miliknya. Melalui tiga kemampuan dasar yaitu diagnosis persepsi kesalahan, manajemen kesalahan, dan toleransi kesalahan tautan optik klaster, serta kemampuan pendukung bisnis seperti optimasi linearitas klaster, pemulihan cepat pelatihan dan inferensi, Huawei mencapai ketersediaan pelatihan klaster puluhan ribu kartu hingga 98%, linearitas lebih dari 95%, pemulihan kesalahan dalam hitungan detik, dan diagnosis dalam hitungan menit. Sistem teknologi dua dimensi “3+3” ini bertujuan untuk menjamin operasi pelatihan dan inferensi AI skala besar yang stabil dan efisien. (Sumber: 量子位)

Tingkat Penetrasi Sistem Kemudi Cerdas Mobil Baru BYD Mencapai 79%, NOA Kecepatan Tinggi Menjadi Konfigurasi Utama: Data terbaru yang dirilis BYD menunjukkan bahwa dari mobil baru yang terjual pada bulan Mei, proporsi model yang dilengkapi dengan sistem bantuan kemudi cerdas (setidaknya memiliki fungsi NOA kecepatan tinggi dan parkir otomatis) mencapai 79%. Hal ini menunjukkan bahwa BYD telah mencapai hasil yang signifikan dalam memajukan strategi “kemudi cerdas untuk semua”, dan fungsi kemudi cerdas dengan cepat menjadi konfigurasi standar pada model-modelnya. Tren ini juga mencerminkan percepatan laju普及 teknologi kemudi cerdas di pasar otomotif Tiongkok. (Sumber: 量子位)

Fitur Suara Canggih ChatGPT Diluncurkan untuk Semua Pengguna Berbayar: OpenAI mengumumkan bahwa fitur suara canggih ChatGPT (Advanced Voice) yang sebelumnya diperbarui dengan tingkat kealamian yang lebih tinggi kini telah diluncurkan untuk semua pengguna berbayar (ChatGPT Plus, Team, Enterprise). Pengguna dapat berinteraksi suara secara lebih alami dengan ChatGPT melalui fitur ini. (Sumber: juberti)

🧰 Alat

Browser AI Genspark Dirilis, Mengintegrasikan Berbagai Fungsi Agen AI Cerdas: Tim Eric Jing merilis browser AI Genspark, yang diklaim dibuat oleh tim beranggotakan 24 orang dalam 10 minggu, mengintegrasikan 8 produk utama termasuk browser AI, sekretaris AI, panggilan pribadi AI, agen unduhan AI, AI Drive, dan AI Sheets. Browser ini mengedepankan kecepatan, pemblokiran iklan, sepenuhnya terintegrasi dengan agen, mode autopilot, dan dilengkapi dengan MCP store serta super-agen, bertujuan untuk menyediakan pengalaman penjelajahan dan kerja yang dibantu AI secara terpadu. (Sumber: blader)

Yutori AI Meluncurkan Platform Scouts, Memungkinkan Pemantauan Jaringan Agen AI: Yutori AI merilis platform Scouts, yang memungkinkan pengguna membuat agen AI yang terus online untuk memantau pembaruan informasi spesifik di internet. Agen-agen ini dapat melacak berbagai konten yang diminati pengguna, seperti berita niche, perubahan harga produk, informasi tiket, dll., dan memberi tahu pengguna melalui email pada saat-saat penting, bertujuan untuk membebaskan pengguna melalui pelacakan informasi otomatis. (Sumber: DhruvBatraDB, DhruvBatraDB, DhruvBatraDB, DhruvBatraDB, DhruvBatraDB, DhruvBatraDB, DhruvBatraDB, DhruvBatraDB)

Hugging Face Meluncurkan AISheets, Menggabungkan Model AI dengan Spreadsheet: Hugging Face merilis AISheets, sebuah aplikasi yang menggabungkan ribuan model AI (terutama LLM open-source) dengan fungsionalitas spreadsheet. Pengguna dapat membangun, menganalisis, dan mengotomatiskan pemrosesan data di AISheets, bertujuan untuk menyediakan pengalaman pemrosesan data yang didukung AI secara lancar, cepat, dan sederhana. (Sumber: ben_burtenshaw, LoubnaBenAllal1)

PLaMo Merilis Alat CLI Terjemahan Lokal, Berbasis MLX: Tim PLaMo LLM merilis alat antarmuka baris perintah (CLI) open-source yang dapat melakukan terjemahan teks secara lokal di Mac yang menggunakan Apple Silicon dengan memanfaatkan framework MLX. Alat ini bertujuan untuk menyediakan pengalaman terjemahan lokal yang cepat dan akurat, serta dilengkapi dengan server dan klien HTTP dan MCP bawaan untuk kemudahan integrasi dengan aplikasi lain yang kompatibel dengan MCP (seperti Claude Desktop). (Sumber: awnihannun)

GPT Researcher Mengintegrasikan Adaptor LangChain MCP, Meningkatkan Pemilihan Alat dan Kemampuan Riset: GPT Researcher kini memanfaatkan adaptor Model Context Protocol (MCP) dari LangChain untuk mencapai pemilihan alat dan alur riset yang lebih cerdas. Langkah ini bertujuan untuk menggabungkan keunggulan MCP dengan kemampuan pencarian web guna melakukan pengumpulan dan analisis data yang lebih komprehensif. (Sumber: Hacubu)

Consilium: Kerangka Kerja Kolaborasi Multi-Agen Cerdas Open Source Dirilis: Victor M meluncurkan Consilium, sebuah kerangka kerja kolaborasi tim agen AI open source. Pengguna dapat menetapkan strategi, yang akan diperdebatkan oleh beberapa agen ahli, dan memanfaatkan riset real-time (web, arXiv, data SEC) untuk bersama-sama memecahkan masalah kompleks dan mencapai konsensus. Alat ini telah menyediakan Demo di Hugging Face. (Sumber: clefourrier)

youtube-transcript-api: Pustaka Python untuk Mendapatkan Transkrip YouTube, Mendukung Terjemahan dan Pembuatan Konten Otomatis: Pustaka Python youtube-transcript-api yang dikembangkan oleh jdepoix mendapat perhatian di GitHub. API ini mampu mendapatkan transkrip video YouTube, termasuk transkrip yang dibuat secara otomatis, dan mendukung fungsi terjemahan. Berbeda dengan solusi lain berbasis Selenium, API ini tidak memerlukan kunci API atau browser headless, sehingga menyediakan cara yang mudah bagi pengembang untuk mengekstrak konten teks video. (Sumber: GitHub Trending)

Browser Arc Meluncurkan Fitur Dia, Merekam Riwayat Penjelajahan dan Mendukung Tanya Jawab AI: Browser Arc menambahkan fitur Dia, yang jika diaktifkan akan terus merekam semua riwayat penjelajahan pengguna. Pengguna dapat menggunakan fungsi @History, menggunakan pertanyaan bahasa alami yang samar untuk menemukan informasi yang pernah dijelajahi tetapi lupa alamat web spesifiknya. Fitur ini bahkan mungkin mendukung pembuatan laporan riwayat penjelajahan, meningkatkan kemampuan manajemen informasi yang cerdas dan dipersonalisasi pada browser. (Sumber: op7418)

📚 Pembelajaran

Apple Merilis Paper “The Illusion of Thinking”, Membahas Batas Kemampuan LLM: Tim riset machine learning Apple menerbitkan paper berjudul “The Illusion of Thinking”, yang menganalisis kinerja dan keterbatasan Large Language Model (LLM) saat ini dalam tugas penalaran kompleks (seperti memecahkan masalah Menara Hanoi). Paper ini memicu diskusi di komunitas tentang tingkat kecerdasan LLM yang sebenarnya, dan ada pandangan bahwa penelitian semacam ini terkadang digunakan sebagai alasan untuk menunda adopsi AI. Model o3-pro OpenAI kemudian berhasil memecahkan teka-teki Menara Hanoi yang diajukan dalam paper tersebut. (Sumber: Reddit r/deeplearning, Teknium1, Reddit r/ArtificialInteligence)

Penelitian Baru “General agents need world models” Membahas Hubungan Generalisasi Agen dan Model Prediktif: Sebuah paper penelitian baru berjudul “General agents need world models” menunjukkan bahwa agen umum yang mampu melakukan generalisasi pada tugas berorientasi tujuan multi-langkah harus mempelajari model dunia prediktif. Model ini dikodekan dalam kebijakan agen, dan paper tersebut membuktikan hubungan langsung antara kemampuan generalisasi dan fidelitas model yang dipelajari dengan menanyakan pilihan kebijakan agen di bawah tujuan majemuk untuk mengekstrak probabilitas transisi lingkungan. (Sumber: menhguin)

Paper Membahas Concept-Aware Fine-Tuning (CAFT) untuk Meningkatkan Kinerja LLM: Sebuah paper baru berjudul “Improving large language models with concept-aware fine-tuning” mengusulkan metode CAFT, yang meningkatkan pemahaman model terhadap konsep dengan mengaktifkan prediksi multi-token untuk fine-tuning. Penelitian menunjukkan bahwa CAFT mencapai peningkatan kinerja yang signifikan dalam tugas-tugas seperti pengkodean, matematika, peringkasan teks, generasi molekul, dan desain protein. Kode telah tersedia secara open source di GitHub. (Sumber: Reddit r/MachineLearning)

DeepLearning.AI Meluncurkan Kursus Baru “Orchestrating Workflows for GenAI Applications”: DeepLearning.AI milik Andrew Ng bekerja sama dengan Astronomer meluncurkan kursus singkat baru berjudul “Orchestrating Workflows for GenAI Applications”. Kursus ini mengajarkan cara membangun alur kerja GenAI yang andal menggunakan alat open-source populer Airflow 3.0, dan mengubah prototipe Jupyter Notebook atau skrip Python menjadi alur kerja yang siap produksi, mencakup dekomposisi tugas, penjadwalan, eksekusi paralel, pemulihan kegagalan, dan observabilitas. (Sumber: AndrewYNg)

Paper “Token-by-Token Alignment of Text, Images, and 3D Structures” Menjelajahi Model Autoregresif Multimodal: Penelitian ini mengusulkan kerangka kerja LLM terpadu yang bertujuan untuk menyelaraskan bahasa, gambar, dan adegan 3D terstruktur. Paper ini merinci pilihan desain utama untuk mencapai pelatihan dan kinerja optimal, termasuk representasi data, fungsi objektif khusus modalitas, dll., dan dievaluasi pada empat tugas 3D inti (rendering, pengenalan, kepatuhan instruksi, dan tanya jawab) serta berbagai data. Penelitian ini juga diperluas untuk merekonstruksi bentuk objek 3D yang kompleks melalui pengkodean bentuk terkuantisasi. (Sumber: HuggingFace Daily Papers)

Paper “Squeeze3D”: Memanfaatkan Model Generatif 3D Pra-terlatih untuk Kompresi Neural Ekstrem: Kerangka kerja Squeeze3D memanfaatkan pengetahuan prior implisit yang dipelajari dalam model generatif 3D pra-terlatih untuk mengompres data 3D (mesh, point cloud, radiance field) secara ekstrem. Ini menghubungkan encoder pra-terlatih dan ruang laten model generatif melalui jaringan pemetaan yang dapat dilatih, mengompres model 3D menjadi kode laten yang ringkas, yang kemudian direkonstruksi oleh model generatif saat dekompresi. Metode ini dilatih pada data sintetis, tanpa memerlukan dataset 3D nyata, dan mencapai rasio kompresi mesh bertekstur hingga 2187 kali. (Sumber: HuggingFace Daily Papers)

Paper “Frame Guidance”: Kontrol Tingkat Frame Bebas Pelatihan dalam Model Difusi Video: Penelitian ini mengusulkan “Frame Guidance”, sebuah metode untuk mencapai kontrol tingkat frame dalam model difusi video tanpa perlu pelatihan. Melalui pemrosesan ruang laten sederhana dan strategi optimasi ruang laten yang baru, metode ini mampu secara efektif mengontrol sinyal tingkat frame seperti keyframe, referensi gaya, sketsa, atau peta kedalaman, cocok untuk berbagai tugas seperti panduan keyframe, stilisasi, pemutaran berulang, dan kompatibel dengan model video apa pun. (Sumber: HuggingFace Daily Papers)

Paper “Geopolitical Biases in Large Language Models” Mengungkap Posisi Negara Model: Penelitian ini mengevaluasi bias geopolitik dalam LLM dengan menganalisis interpretasi LLM terhadap peristiwa sejarah dengan perspektif negara yang berbeda (AS, Inggris, Soviet, Tiongkok). Peneliti memperkenalkan dataset baru yang berisi deskripsi peristiwa netral dan pandangan kontras dari berbagai negara, menemukan bahwa LLM memiliki bias yang signifikan dalam memihak narasi negara tertentu, dan prompt de-biasing sederhana memiliki efek terbatas. Karya ini menyediakan kerangka kerja dan dataset untuk penelitian bias geopolitik di masa depan. (Sumber: HuggingFace Daily Papers)

Repositori Awesome Lists Terus Diperbarui, Mengumpulkan Berbagai Tema Menarik: Proyek GitHub awesome yang dikelola oleh sindresorhus adalah meta-list yang mengumpulkan “Awesome lists” tentang berbagai topik menarik. Daftar-daftar ini mencakup banyak bidang mulai dari bahasa pemrograman, platform pengembangan hingga teori, buku, alat, dll., menyediakan indeks sumber daya yang kaya bagi pengembang dan pembelajar. (Sumber: GitHub Trending)

Universitas Peking dan Berkeley Bersama-sama Meluncurkan IDA-Bench, Mengevaluasi Kemampuan Interaktif Agen Analisis Data AI: Tim peneliti dari Universitas Peking dan University of California, Berkeley (termasuk Profesor Michael I. Jordan) meluncurkan IDA-Bench, sebuah benchmark baru yang bertujuan untuk mengevaluasi kemampuan Large Language Model (LLM) sebagai agen analisis data (Agent) dalam skenario interaksi multi-putaran. Benchmark ini mensimulasikan alur kerja analis data nyata, menguji kemampuan Agent untuk mengikuti instruksi, menulis kode, dan mengeksekusi kode melalui instruksi yang berkembang secara bertahap. Evaluasi awal menunjukkan bahwa bahkan model teratas seperti Claude-3.7 dan Gemini-2.5 Pro memiliki tingkat keberhasilan tugas kurang dari 40%, mengungkap tantangan saat ini bagi Agent dalam interaksi kompleks dan kepatuhan terhadap instruksi. (Sumber: 量子位)

💼 Bisnis

xAI Bekerja Sama dengan Polymarket, Menggabungkan Prediksi Pasar dengan Analisis Grok: xAI milik Elon Musk mengumumkan kerja sama dengan platform pasar prediksi Polymarket. Kedua pihak akan menggabungkan kemampuan prediksi pasar Polymarket, data dari platform X, dan kemampuan analisis model Grok, bertujuan untuk menciptakan “mesin kebenaran hardcore” (Hardcore truth engine) untuk memahami faktor-faktor yang membentuk dunia. Pihak resmi menyatakan ini baru permulaan kerja sama, dan akan ada lebih banyak perkembangan di masa depan. (Sumber: Yuhu_ai_)

UnslothAI Dinobatkan sebagai Perusahaan Infrastruktur Terkemuka oleh Redpoint, Tampil di Layar Besar Nasdaq: Perusahaan startup AI UnslothAI, atas kontribusinya di bidang infrastruktur AI, dinobatkan oleh perusahaan modal ventura Redpoint sebagai salah satu dari 100 perusahaan infrastruktur paling berpengaruh dan dengan pertumbuhan tercepat untuk tahun 2025. Logo perusahaan ini pun tampil di layar elektronik Gedung Nasdaq di New York. UnslothAI berfokus pada optimalisasi efisiensi pelatihan dan inferensi LLM. (Sumber: danielhanchen, karminski3)

Ant Digital Tingkatkan Tianji Laboratory, Fokus pada “AI + Inovasi Industri”: Ant Digital mengumumkan peningkatan Tianji Laboratory dari sebelumnya “Laboratorium Keamanan Identitas Digital” menjadi laboratorium “Kecerdasan Buatan + Inovasi Industri”. Laboratorium yang ditingkatkan ini akan fokus pada penelitian terobosan teknologi kunci dalam aplikasi model besar AI di industri, dengan fokus pada empat arah utama: AI+Data, AI+Keamanan, AI+Finansial, dan AI+Embodied Intelligence. Tujuannya adalah untuk mendorong integrasi mendalam teknologi AI dan industri melalui inovasi kolaboratif antara industri, akademisi, riset, dan aplikasi. (Sumber: 量子位)

🌟 Komunitas

Kemampuan Kemudi Otomatis AI di Lingkungan Lalu Lintas Kompleks Menjadi Perhatian: Ronald van Loon membagikan video pengujian kemudi otomatis di tengah lalu lintas India yang kacau, memicu diskusi tentang kemampuan persepsi, pengambilan keputusan, dan kontrol AI di lingkungan yang kompleks dan sangat dinamis. Skenario dunia nyata semacam ini mengajukan tuntutan yang sangat tinggi terhadap ketahanan dan kemampuan adaptasi sistem kemudi otomatis. (Sumber: Ronald_vanLoon)

Intisari Konferensi AI Engineer World’s Fair: Protokol MCP, Biaya Agen AI, dan Model Lokal Menjadi Fokus: Yogi dan Shawn “swyx” Wang serta lainnya membagikan poin-poin penting dari konferensi AI Engineer World’s Fair. Tren inti meliputi: 1) Agen AI adalah masa depan, unit interaksi atomik akan menjadi pemanggilan agen; 2) Model Context Protocol (MCP) dengan cepat menjadi standar, mengatasi “neraka salin-tempel”, memungkinkan AI berinteraksi langsung dengan aplikasi eksternal; 3) Membangun alat AI yang dioptimalkan secara mendalam untuk domain dan alur kerja tertentu (pola Cursor-for-X) adalah kunci; 4) Biaya model turun drastis, kemampuan model lokal meningkat, memberikan pengembang kontrol lebih besar dan solusi latensi rendah; 5) AI berevolusi dari alat bantu menjadi “rekan tim” bagi pengembang; 6) Rekayasa AI beralih dari tahap demonstrasi ke sistem tingkat produksi. (Sumber: swyx, TheTuringPost)

Komunitas Ramai Membahas Iterasi Cepat Setelah Rilis o3-pro dan Paper AI Apple: andersonbcdefg dengan humor berkomentar bahwa hanya 6 jam setelah rilis o3-pro, komunitas sepertinya sudah mengharapkan seseorang menulis ulang fastText dengan Rust, dan menyindir perdebatan panjang tentang “super intelijen yang jinak”, mencerminkan kecepatan iterasi teknologi di bidang AI dan ekspektasi tinggi komunitas. Sementara itu, Teknium1 menunjukkan bahwa o3-pro memecahkan teka-teki Menara Hanoi yang diajukan dalam paper Apple “The Illusion of Thinking”, dan mempertanyakan mengapa Apple, dalam konteks kerja sama dengan OpenAI, tidak melakukan verifikasi internal terlebih dahulu sebelum menerbitkan paper semacam itu, memicu diskusi di komunitas tentang hubungan kompetisi dan kerja sama antar perusahaan teknologi. (Sumber: andersonbcdefg, Teknium1)

Diskusi Etika dan Efektivitas Aplikasi AI di Dunia Nyata: Komunitas membahas efektivitas dan masalah etika aplikasi AI dalam skenario tertentu. Misalnya, Arvind Narayanan menunjukkan bahwa konsep aplikasi penghitung kalori AI pada dasarnya cacat, karena informasi gambar tidak cukup untuk memperkirakan kalori secara akurat, dan menganggapnya lebih sebagai “ritual” untuk membantu pengguna membangun kebiasaan memperhatikan diet. Selain itu, apakah penggunaan gambar yang dihasilkan AI untuk promosi komersial (seperti tampilan menu kedai kopi) etis atau praktik yang tepat juga menjadi titik diskusi, dengan pandangan umum bahwa selama tidak secara jelas salah atau menyesatkan, itu adalah cara yang dapat diterima untuk mengurangi biaya dan meningkatkan efisiensi. (Sumber: random_walker, Reddit r/artificial)

“Humanisasi” LLM dan Pengalaman Interaksi Pengguna Menjadi Fokus: Pengguna komunitas Reddit membahas cara membuat interaksi LLM lebih mirip manusia sungguhan, termasuk memperkenalkan keraguan, jeda, respons yang lebih pendek, dan ekspresi yang tidak sempurna. Ini mencerminkan kebutuhan pengguna akan pendamping atau asisten AI yang lebih alami dan tidak terlalu “robotik”. Pada saat yang sama, ada juga pengguna yang mengeluhkan bahwa LLM saat ini (seperti ChatGPT) sering menggunakan pola kalimat tetap dan ekspresi berlebihan (seperti “Ini bukan hanya X, tetapi juga Y”), dan berharap ekspresinya lebih ringkas dan langsung. Diskusi-diskusi ini menunjuk pada tantangan berkelanjutan LLM dalam meniru percakapan manusia dan memenuhi kebutuhan emosional pengguna. (Sumber: Reddit r/LocalLLaMA, Reddit r/ChatGPT)

💡 Lainnya

CEO NVIDIA Jensen Huang Akan Menyampaikan Pidato Utama di GTC Paris, Fokus pada Tahap Baru Komputasi AI: NVIDIA mengumumkan bahwa CEO-nya, Jensen Huang, akan menyampaikan pidato utama pada 11 Juni di konferensi GTC Paris (selama VivaTech 2025). Diharapkan akan mengungkap tahap berikutnya dari komputasi AI, mencakup topik-topik mutakhir mulai dari sistem agen hingga pabrik AI. (Sumber: nvidia, nvidia)

Databricks Data+AI Summit Akan Menampilkan Terobosan Terbaru: Databricks mengumumkan bahwa Data+AI Summit mereka akan mengumpulkan para ahli terkemuka, peneliti, dan kontributor open source untuk menampilkan terobosan terbaru perusahaan di bidang data dan AI, serta berbagi kisah sukses perusahaan inovatif. KTT ini menawarkan partisipasi secara online dan offline. (Sumber: matei_zaharia, lateinteraction)

Dampak Etika dan Lingkungan AI Menarik Perhatian, Dikemas dalam Bentuk Novel Grafis Edukatif: Pusat LEARN di EPFL (École Polytechnique Fédérale de Lausanne) bekerja sama dengan ilustrator Herji meluncurkan novel grafis edukatif berbahasa Prancis berjudul “Utop’IA”. Novel ini bertujuan untuk mengedukasi remaja tentang dampak lingkungan kecerdasan buatan melalui cerita, termasuk konsumsi sumber dayanya (energi, air, logam langka) dan potensi manfaat ekologisnya. Karya ini menekankan pemikiran kritis dan membahas jalur pengembangan AI yang berkelanjutan. (Sumber: aihub.org)

🔥 Fokus

🎯 Dinamika

🧰 Alat

📚 Pembelajaran

💼 Bisnis

🌟 Komunitas

💡 Lainnya

Tag Terkait

Related Posts

Berita AI – 2026-07-21

Berita AI – 2026-07-20

Berita AI – 2026-07-19