Berita AI – 2025-12-19(Edisi pagi)

Kata Kunci:SAM 3, Gemini 3 Flash, Pembuatan Video AI, Kecerdasan Embodied, Model Besar, Agen AI, Manusia Digital 3D, Segmentasi Gambar Meta SAM 3, Kinerja Google Gemini 3 Flash, Pembuatan Video Alibaba Wanxiang 2.6, Pengumpulan Data Situasional Deepwise, Sumber Terbuka Xiaomi MiMo-V2-Flash

🔥 Fokus Utama

Meta Merilis Model SAM 3 : Facebook Research merilis SAM 3, sebuah model dasar segmentasi yang dapat diprompt untuk gambar dan video yang terpadu. Model ini melakukan deteksi objek, segmentasi, dan pelacakan melalui prompt teks atau visual, memperkenalkan kemampuan segmentasi instans untuk konsep kosakata terbuka, dan mencapai 75-80% kinerja manusia pada benchmark SA-CO. Model ini didukung oleh mesin data inovatif yang secara otomatis menganotasi lebih dari 4 juta konsep unik, dan mengadopsi desain arsitektur baru yang mencakup token keberadaan dan detektor-pelacak yang terpisah untuk meningkatkan diskriminasi dan efisiensi. (Sumber: GitHub Trending)

SAM 3 architecture

Google Merilis Model Gemini 3 Flash : Google meluncurkan model AI tercepat hingga saat ini, Gemini 3 Flash, yang dirancang untuk kecepatan sambil mempertahankan kecerdasan mutakhir. Model ini menunjukkan kinerja luar biasa dalam benchmark penalaran dan pengetahuan tingkat doktoral seperti GPQA Diamond dan Humanity’s Last Exam, bahkan melampaui Gemini 3 Pro dalam benchmark pengkodean SWE-bench Verified. Gemini 3 Flash menawarkan kecepatan tiga kali lebih cepat dari Gemini 2.5 Pro dengan biaya lebih rendah ($0.50 per juta input token, $3 per juta output token), dan telah diluncurkan secara global sebagai model default untuk mode AI Google Search, bertujuan untuk mempopulerkan AI dalam aplikasi tingkat perusahaan dan ekosistem pengembang. (Sumber: WeChat)

刚刚,谷歌祭出迄今最前沿模型 Gemini 3 Flash!编程能力上反超 Gemini 3 Pro,且更快更便宜

🎯 Tren

Model Generasi Video AI Terus Berevolusi : Model-model seperti Alibaba Wanxiang 2.6, ByteDance Seedance 1.5 Pro, dan Kling 2.6 telah dirilis secara berurutan. Wanxiang 2.6 mencapai kustomisasi karakter dengan konsistensi audio-visual dan kontrol storyboard multi-shot, menghasilkan video hingga 15 detik dalam satu kali pembuatan; Seedance 1.5 Pro berfokus pada sinkronisasi audio-visual presisi tinggi dan dukungan multi-dialek; sementara Kling 2.6 memperkuat kontrol timbre dan fitur Motion Control. Kemajuan ini menandai bahwa kreasi video AI sedang bergerak dari era “gacha” menuju tahap produksi tingkat sinematik yang presisi dan terkontrol. (Sumber: WeChat, WeChat, Kling_ai, Alibaba_Wan)

硬刚Sora2,万相2.6轻松定制角色、控制分镜,普通人也能当导演

Pengembangan Mendalam Teknologi dan Strategi Embodied AI : DeepMind meluncurkan mode “Pengumpulan Data Kontekstual” untuk Embodied AI, mengatasi masalah generalisasi melalui data sudut pandang orang pertama manusia; Horizon Robotics merilis strategi Wintel “BPU + Compiler + Base Model” untuk memberdayakan mobil pintar dan robot umum; tim Dr. Wang Guangrun dari Sun Yat-sen University merilis model besar Embodied AI E0, menekankan pemisahan model fisik dan spasial untuk mencapai generalisasi fine-tuning sampel kecil. Kemajuan ini secara kolektif mendorong Embodied AI dari imitasi mekanis menuju pemahaman logis dan interaksi dunia fisik. (Sumber: WeChat, WeChat, WeChat)

与Physical Intelligence同日发声:深度机智亮出「情境数采」杀手锏,具身智能的通用性天花板要被捅破了?

Xiaomi dan SenseTime Merilis Model Besar Mutakhir : Xiaomi merilis model besar open-source MiMo-V2-Flash, mengadopsi arsitektur MoE dan dirancang khusus untuk skenario Agent dan kode, memasuki eselon teratas model open-source global dengan efisiensi inferensi ekstrem dan biaya rendah. SenseTime merilis model SenseNova-SI dan arsitektur NEO, bertujuan untuk mengatasi keterbatasan pemahaman model bahasa murni tentang dunia fisik, meningkatkan kecerdasan spasial melalui multimodalitas asli dan prediksi lintas-pandangan. (Sumber: WeChat, WeChat)

罗福莉执掌小米大模型首秀!定调下一代模型,全新MiMo-V2开源还横扫Agent第一梯队

Integrasi AI PC dengan Skenario Aplikasi Spesifik : Covestro Motion meluncurkan asisten kesehatan pribadi AI PC, menggunakan teknologi rPPG non-kontak untuk pengukuran tekanan darah dan deteksi kulit tanpa sentuhan, serta menggabungkan Intel NPU untuk komputasi lokal yang efisien. Pada saat yang sama, Yunpeng Technology merilis produk baru AI+Kesehatan, termasuk lemari es pintar model besar kesehatan AI dan laboratorium dapur masa depan digital, mengintegrasikan AI ke dalam manajemen kesehatan harian dan teknologi rumah tangga. (Sumber: WeChat, 36氪)

行啊AI PC!现在都能隔空测血压、检测皮肤了

Terobosan Teknologi LiteGS Moore Threads dalam Rendering Grafis 3D : Moore Threads memenangkan Silver Award dalam tantangan rekonstruksi 3DGS di SIGGRAPH Asia 2025 dan merilis teknologi LiteGS yang dikembangkan sendiri sebagai open-source. LiteGS adalah pustaka dasar 3D Gaussian Splatting yang, melalui optimasi kolaboratif seluruh rantai, mencapai keunggulan signifikan dalam efisiensi pelatihan dan kualitas rekonstruksi, mendorong aplikasi teknologi 3DGS dalam rekonstruksi 3D, rendering real-time, dan skenario pelatihan Embodied AI. (Sumber: WeChat)

摩尔线程算法一鸣惊人,图形学顶会夺银!已开源

Kemajuan Baru dalam Pra-pelatihan LLM Skala Kecil yang Efisien Data : Seorang insinyur riset independen Korea merilis Gumini, sebuah LLM dasar bilingual Korea-Inggris dengan 1.5B parameter, yang menduduki peringkat teratas dalam benchmark Korea hanya dengan 3.14B training tokens. Kemajuan ini menunjukkan bahwa melalui optimasi arsitektur dan strategi pelatihan, pra-pelatihan LLM dapat mencapai efisiensi data, menyediakan jalur baru bagi tim kecil dan peneliti independen di luar paradigma “lebih banyak data + lebih banyak daya komputasi”. (Sumber: Reddit r/LocalLLaMA)

An independent Korean researcher is trying to democratize LLM pretraining with a 1.5B model

Aplikasi Mendalam AI Multimodal di Bidang Spesifik : MiraTTS, sebagai model TTS cepat berkualitas tinggi, mampu menghasilkan suara realistis dengan kecepatan lebih dari 100 kali real-time, mendukung berbagai bahasa. Pada saat yang sama, sistem RAG multibahasa telah diterapkan untuk dukungan keputusan ekologi pertanian, meneliti perilaku LLM di bidang sumber daya rendah dan sangat spesialis, dan telah beroperasi di lingkungan produksi selama setahun. Ini menunjukkan aplikasi matang AI multimodal dalam generasi suara dan dukungan keputusan di bidang vertikal. (Sumber: Reddit r/LocalLLaMA, Reddit r/ArtificialInteligence)

MiraTTS: High quality and fast TTS model

Teknologi Taobao Meluncurkan Sistem Rekonstruksi Manusia Digital 3D Berbasis Ponsel : Tim Teknologi Taobao Meta merilis sistem HRM²Avatar di SIGGRAPH Asia, memungkinkan pengguna untuk membuat dan merender manusia digital 3D real-time dengan fidelitas tinggi hanya melalui video monokuler ponsel. Sistem ini menggabungkan mesh pakaian eksplisit dengan representasi Gaussian, mendukung penggerakan dan rendering real-time pada perangkat seluler, menunjukkan kinerja luar biasa dalam realisme visual, konsistensi lintas-pose, dan kinerja seluler, bertujuan untuk menurunkan ambang batas pembuatan manusia digital 3D. (Sumber: WeChat)

SIGGRAPH Asia 2025 | 只用一部手机创建和渲染高质量3D数字人

🧰 Alat

Letta: Platform untuk Membangun Agen AI Berstatus : Letta (sebelumnya MemGPT) adalah platform untuk membangun agen AI berstatus, dengan inti manajemen memori canggih yang memungkinkan agen AI belajar dan meningkatkan diri seiring waktu. Platform ini menyediakan Python/TypeScript SDK, lingkungan ADE tanpa kode, serta versi desktop lokal dan layanan cloud, mendukung konsep inti seperti hierarki memori, blok memori, rekayasa konteks agen, dan memungkinkan berbagi memori multi-agen serta “agen waktu tidur” yang berjalan di latar belakang. Maestro adalah aplikasi desktop lintas-platform gratis dan open-source untuk mengatur agen AI, mendukung memori sistem file dan pembuatan alat, serta memiliki fungsi “auto-run”. Toad, sebagai antarmuka terminal agen pengkodean AI terpadu, menyederhanakan integrasi dengan berbagai alat pengkodean AI. (Sumber: GitHub Trending, Reddit r/LocalLLaMA, huggingface)

letta-ai/letta - GitHub Trending (all/daily)

Alat Pemrograman AI Tanpa Kode Miaoda Memberdayakan Non-Programmer : Miaoda adalah alat pemrograman AI tanpa kode yang telah dirilis selama 8 bulan, menciptakan nilai output lebih dari 5 miliar yuan, dengan pengguna utama adalah non-programmer. Alat ini menggunakan “agen manajer produk” untuk komunikasi kebutuhan multi-putaran, mengubah kebutuhan yang tidak jelas menjadi dokumen produk terstruktur, yang kemudian diimplementasikan oleh “agen R&D”. Miaoda telah mengatasi masalah pembangunan backend, mencapai integrasi mendalam AI dengan database, dan mengurangi biaya serta meningkatkan efisiensi melalui strategi yang disempurnakan, menghindari “gunung kode sampah”. (Sumber: WeChat)

8 个月 50 亿产值,非程序员用秒哒赚疯了?秒哒如何解决后端难、token 贵、屎山烦

Alat Analisis Berbantuan AI dan Otomatisasi Penjualan : Artikel ini menunjukkan bagaimana AI dapat membantu menganalisis tren kebijakan “penutupan pelabuhan Hainan”, membantu pengguna memahami informasi kompleks melalui integrasi informasi multi-saluran, klasifikasi, dan inferensi. QuickHook adalah alat otomatisasi penjualan berdasarkan Gemini 3 dan Search Grounding, yang dapat mengubah 15 menit penelitian manual menjadi 10 detik otomatisasi, bertujuan untuk mengatasi masalah “gaya AI” dalam outreach dingin. (Sumber: WeChat, Reddit r/artificial)

海南"封关":我用 AI 做了一次完整的趋势分析,结论让我坐不住了

OpenWebUI API dan Sistem STT Lokal : OpenWebUI menyediakan antarmuka API, memungkinkan pengembang untuk membuat aplikasi klien kustom, seperti aplikasi mode suara di WearOS, untuk pengalaman interaksi AI yang dipersonalisasi. Kroko-onnx-home-assistant adalah pipeline Speech-to-Text (STT) streaming lokal open-source, dirancang khusus untuk Home Assistant, dengan fitur-fitur seperti kualitas tinggi, pemrosesan streaming real-time, dan lokalisasi 100%, dapat beroperasi secara efisien bahkan pada perangkat dengan sumber daya rendah. (Sumber: Reddit r/OpenWebUI, Reddit r/LocalLLaMA)

Fast on-device Speech-to-text for Home Assistant (open source)

Kolaborasi Multi-LLM Meningkatkan Efisiensi Pengembangan Game : Pengembang menggunakan OpenAI Realtime API untuk mengumpulkan kebutuhan game, menghasilkan spesifikasi Markdown melalui Gemini 3 Pro, dan kemudian mengkodekan aplikasi dengan Anthropic Opus 4.5 untuk mengembangkan game bola pintar yang disesuaikan. Alur kerja kolaboratif multi-LLM ini mengoptimalkan keunggulan berbagai LLM, meningkatkan efisiensi dan kualitas pengembangan dari kebutuhan hingga kode, serta menyediakan paradigma pengembangan baru untuk proyek kompleks. (Sumber: Reddit r/artificial)

Using 3 different LLMs to build/code games for a smart ball

📚 Pembelajaran

Optimasi Arsitektur Transformer dan Inovasi Normalisasi : Tim Liu Zhuang dari Princeton University mengusulkan operator Derf, yang menggantikan LayerNorm dalam Transformer berdasarkan fungsi kesalahan Gaussian (erf), secara komprehensif melampaui metode yang ada dalam tugas-tugas seperti visi, generasi, dan pemodelan sekuens gen. Pada saat yang sama, Nanyang Technological University dan Fudan University mengusulkan EFLA (Error-Free Linear Attention), yang menghilangkan pergeseran numerik perhatian linear dalam sekuens panjang melalui solusi analitik, mencapai peningkatan stabilitas dan kinerja secara bersamaan. (Sumber: WeChat, WeChat)

继何恺明DyT后,LayerNorm再遭暴击!简单erf函数竟成Transformer新宠

Riset Mutakhir dalam Pemahaman Multimodal dan Video : Kerangka kerja DiffusionVL dapat mengubah model autoregresif menjadi model bahasa visual difusi, secara signifikan meningkatkan kinerja dan mempercepat inferensi. Sistem SAGE menggunakan pembelajaran penguatan untuk penalaran multi-putaran pada video panjang, dan menunjukkan kinerja luar biasa dalam tugas video terbuka. MMSI-Video-Bench, sebagai benchmark komprehensif untuk kecerdasan spasial video, mengungkapkan kegagalan sistematis MLLM dalam penalaran geometris, grounding gerakan, dan aspek lainnya. VGGT4D mengusulkan kerangka kerja rekonstruksi adegan 4D tanpa pelatihan, memproses adegan dinamis dengan menggali petunjuk gerakan internal Transformer. (Sumber: HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, WeChat)

挖掘注意力中的运动线索:无需训练,解锁4D场景重建能力

Optimasi Memori Agen AI dan LLM : Nanjing University of Science and Technology dan Baidu, serta institusi lainnya, mengusulkan ViLoMem, yang mengatasi masalah “model besar multimodal tidak belajar dari kesalahan” melalui memori semantik aliran ganda (aliran visual + aliran logis), secara signifikan meningkatkan kinerja inferensi. Kerangka kerja LightSearcher mengoptimalkan panggilan alat Agent yang digerakkan oleh RL melalui memori pengalaman, mengurangi jumlah panggilan sebesar 39.6%, mempersingkat waktu inferensi sebesar 48.6%, sambil mempertahankan akurasi. Kerangka kerja MEM1 juga melatih Agent melalui RL untuk mempertahankan memori konstan dalam tugas jangka panjang. (Sumber: WeChat, WeChat, omarsar0)

让大模型“吃一堑长一智”,南理工百度等提出模型记忆新方法

Evaluasi LLM dan Pembangunan Dataset : LikeBench, sebagai kerangka evaluasi dinamis multi-sesi, pertama kali memecah preferensi personalisasi LLM menjadi tujuh indikator diagnostik untuk mengukur kemampuan model beradaptasi dengan preferensi pengguna. VOYAGER adalah metode tanpa pelatihan yang menggunakan LLM untuk menghasilkan dataset yang beragam, secara signifikan meningkatkan keragaman 1.5-3 kali lipat. Pipeline pembuatan dataset FiNERweb menyediakan sumber daya pengenalan entitas bernama multibahasa yang dapat diskalakan untuk 91 bahasa dan 25 skrip. NVIDIA juga merilis panduan evaluasi lengkap untuk Nemotron 3 Nano, meningkatkan transparansi dan reproduktifitas evaluasi LLM. (Sumber: HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers, Reddit r/LocalLLaMA)

NVIDIA Publishes Complete Evaluation Recipe for Nemotron 3 Nano

Riset Keamanan dan Interpretasi AI : Penelitian ini mengusulkan kerangka kerja re-sintesis untuk deteksi keaslian konten multimedia yang robust dan terkalibrasi, guna menghadapi tantangan deepfake. Pada saat yang sama, kerangka kerja Hybrid Attribution Priors memandu model bahasa untuk menangkap diskriminasi kategori berbutir halus melalui Class-Aware Attribution Prior (CAP), meningkatkan interpretasi dan robustnes model. Hyper++ meningkatkan pembelajaran penguatan mendalam hiperbolik, meningkatkan stabilitas pembelajaran Agent. (Sumber: HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers)

Sumber Daya Pembelajaran dan Peluang Riset Deep Learning : AIhub merilis kompilasi wawancara forum mahasiswa doktoral AAAI/ACM SIGAI 2025, mencakup riset mutakhir AI di berbagai bidang. Pada saat yang sama, ada pengumuman kursus baru tentang sistem ML dan pemrograman GPU, bertujuan untuk memahami tumpukan DL secara mendalam melalui praktik. Tantangan perangkat keras PyTorch/vLLM mendorong pengembang untuk memperbaiki bug, dan ada saran jalur pembelajaran Computer Vision untuk membantu pelajar merencanakan pengembangan karir. (Sumber: aihub.org, DeepLearningAI, vllm_project, Reddit r/deeplearning, Reddit r/deeplearning)

2025 AAAI / ACM SIGAI Doctoral Consortium interviews compilation

Pemodelan 3D/XR dan Interaksi Manusia-Komputer : Kerangka kerja TIMAR mengusulkan pemodelan kausal dinamika kepala dialog 3D interaktif, menggabungkan informasi multimodal dan memprediksi dinamika kepala 3D berkelanjutan. Penelitian terjemahan gambar SAR ke RGB mengeksplorasi cara menghasilkan gambar yang jelas melalui model deep learning. Penelitian algoritma penilaian tulisan tangan huruf prasekolah mencari metode pencocokan template untuk secara akurat mengevaluasi kualitas tulisan tangan anak-anak. (Sumber: HuggingFace Daily Papers, Reddit r/deeplearning, Reddit r/deeplearning)

Scaling Laws dan Teori Fusi Model : Penelitian ini menantang pandangan “Scaling Law lebih unggul dari bias induktif”, menemukan bahwa arsitektur yang mengkodekan simetri memiliki Scaling Exponents yang lebih baik. Pada saat yang sama, solusi konflik fusi model multi-tugas (TATR, CAT Merging, LOT Merging) secara efektif mengurangi konflik pengetahuan dan meningkatkan kinerja serta robustnes multi-tugas dengan mengidentifikasi dan menyaring dimensi konflik, proyeksi, atau fusi berbobot. (Sumber: dair_ai, WeChat)

Scaling Laws and Symmetry

Pelatihan End-to-End untuk Difusi Video Autoregresif : Penelitian ini memperkenalkan kerangka kerja “Resampling Forcing” untuk memungkinkan pelatihan end-to-end model difusi video autoregresif. Dengan mensimulasikan kesalahan model pada frame historis selama inferensi, dikombinasikan dengan sparse causal mask dan mekanisme routing historis, metode ini mencapai kinerja yang sebanding dengan baseline distilasi sambil mempertahankan konsistensi temporal, dan mendukung generasi jarak jauh yang efisien. (Sumber: HuggingFace Daily Papers)

Diskusi Evaluasi dan Reproduktifitas LLM : Komunitas Reddit membahas tantangan evaluasi LLM dan masalah reproduktifitas. Pengguna berfokus pada bagaimana membangun standar evaluasi yang andal untuk memastikan hasil yang sebanding antara penelitian dan model yang berbeda, serta mengeksplorasi cara mengelola dan berbagi metode evaluasi dan dataset secara efektif di bidang LLM yang berkembang pesat untuk mempromosikan kemajuan ilmiah. (Sumber: Reddit r/deeplearning)

💼 Bisnis

Zhipu AI dan MiniMax Berpacu untuk IPO di Bursa Hong Kong : Perusahaan model besar domestik MiniMax dan Zhipu AI telah menyelesaikan pengajuan di Komisi Regulasi Sekuritas Tiongkok dan berpartisipasi dalam dengar pendapat pencatatan di Bursa Efek Hong Kong. MiniMax berencana untuk listing pada Januari 2026. Zhipu AI memiliki valuasi sekitar 40 miliar yuan, berfokus pada segmen G dan B serta Agent multimodal; MiniMax memiliki valuasi hampir 30 miliar yuan, dengan kemampuan multimodal sebagai inti dan model berbasis produk. Kedua perusahaan telah melakukan konvergensi strategis dan penyesuaian tim sebelum listing, mencerminkan bahwa industri model besar telah memasuki “periode kendala ganda modal dan efisiensi”. (Sumber: 36氪)

中国大模型“第一股”来了,揭秘智谱与MiniMax IPO背后的“隐秘算盘”

Amazon Berencana Investasi $10 Miliar di OpenAI : Amazon berencana untuk menginvestasikan setidaknya $10 miliar di OpenAI. Langkah ini diperkirakan akan mencakup penggunaan chip AI seri Trainium Amazon oleh OpenAI dan penyewaan kapasitas pusat data yang lebih besar untuk menjalankan model dan alatnya (seperti ChatGPT). Investasi ini bertujuan untuk memperdalam kerja sama antara kedua perusahaan dalam infrastruktur AI dan penerapan model. (Sumber: Reddit r/ArtificialInteligence)

Amazon to invest $10 billion in OpenAI

Biren Technology Berpacu untuk Menjadi Perusahaan GPU Umum Pertama yang Listing di Bursa Hong Kong : Biren Technology, unicorn GPU umum dengan valuasi 20.9 miliar yuan, telah melewati dengar pendapat di Bursa Efek Hong Kong dan akan menjadi “perusahaan GPU domestik pertama” yang listing di Bursa Hong Kong. Perusahaan ini didirikan oleh Dr. Zhang Wen, lulusan hukum Harvard, dengan produk inti berupa sistem perangkat keras berdasarkan arsitektur GPGPU yang dikembangkan sendiri (chip Biren 106, 110, 166) dan platform perangkat lunak BIRENSUPA, menyediakan dukungan penuh untuk pelatihan dan inferensi AI. Pelanggannya mencakup industri dengan daya komputasi tinggi seperti telekomunikasi dan fintech. (Sumber: WeChat)

港股通用GPU第一股也冲刺了!哈佛博士带队,估值209亿

🌟 Komunitas

Kualitas Konten yang Dihasilkan AI dan Fenomena “Slop” di Internet : Media sosial secara luas membahas fenomena “slop” dari konten yang dihasilkan AI yang kualitasnya bervariasi, yang dipilih sebagai kata tahun ini, mencerminkan masalah proliferasi konten AI dan kualitas rendah. Ini memicu kritik terhadap platform iklan internet yang didorong oleh keuntungan, serta pemikiran tentang bagaimana meningkatkan ambang batas kreasi konten AI. (Sumber: 36氪)

slop成为年度词汇,AI终究要污染整个互联网

Dampak AI terhadap Pasar Tenaga Kerja dan Pola Kerja Pengembang : Media sosial secara mendalam membahas disrupsi AI terhadap pasar kerja dan pola kerja pengembang. AI dipandang sebagai alat produktivitas yang kuat, menggeser peran pengembang dari penulisan kode murni ke desain sistem, orkestrasi agen, verifikasi dan debugging kode, yang membutuhkan penguasaan keterampilan tingkat lebih tinggi. LinkedIn memperkenalkan asisten perekrutan AI, mengubah proses pencarian kerja dan perekrutan. Pada saat yang sama, AI secara signifikan meningkatkan efisiensi di bidang seperti fotografi, tetapi kesiapan produksi agen pengkodean AI masih menghadapi tantangan. (Sumber: Reddit r/ClaudeAI, Reddit r/artificial, Reddit r/artificial, Reddit r/artificial, Reddit r/artificial, Yuchenj_UW, gdb, amasad, amasad, Ronald_vanLoon)

How much longer do Devs probably have realistically?

Aplikasi dan Tantangan AI di Bidang Pendidikan, Kesehatan, dll. : Penggunaan perangkat lunak deteksi AI oleh guru untuk menilai apakah siswa menggunakan AI memicu kontroversi etika pendidikan, menyerukan sistem pendidikan untuk fokus pada pemahaman siswa daripada penggunaan alat. ChatGPT menunjukkan potensi dalam bidang kesehatan untuk membantu diagnosis dan memberikan saran kesehatan, tetapi perlu digunakan dengan hati-hati. Platform seperti Glass 5.0 menerapkan AI untuk dukungan keputusan klinis, mendorong AI medis beralih dari chatbot menjadi mitra. (Sumber: Reddit r/artificial, Reddit r/ChatGPT, GlassHealthHQ)

Teachers are using software to see if students used AI. What happens when it's wrong?

Diskusi Berkelanjutan tentang Kinerja, Biaya, dan Pengalaman Pengguna LLM : Pengguna media sosial secara antusias membahas kinerja, biaya, dan pengalaman penggunaan aktual LLM seperti Gemini 3 Flash dan Claude Opus 4.5. Fokusnya termasuk kemajuan model dalam pengkodean, pemanggilan alat, dan kemampuan penalaran, serta masalah seperti degradasi kinerja dan tingkat halusinasi. Pengguna membandingkan rasio harga-kinerja berbagai model dan membahas strategi penetapan harga model AI serta persepsi pengguna tentang nilai model. (Sumber: Vtrivedy10, hrishioa, tokenbender, inerati, scaling01, Reddit r/ClaudeAI, Reddit r/ClaudeAI, max__drake, MiniMax__AI, scaling01)

Gemini 3 flash (and 3 pro) are just.. different. This is one of the rare new releases that's hard to pin down.

Eksplorasi Mendalam Etika, Filosofi, dan AGI AI : Media sosial membahas etika dan dampak sosial AI, termasuk apakah AI mengisi “kekosongan Tuhan”, definisi sebenarnya dari AGI, serta potensi dan keterbatasan AI dalam penelitian fisika. Pengguna juga memperhatikan reproduktifitas benchmark AI, kritik terhadap kualitas riset AI, dan pemikiran filosofis tentang perbedaan esensial antara model AI dan kecerdasan manusia. (Sumber: Ronald_vanLoon, ImazAngel, Ronald_vanLoon, RisingSayak, snwy_me, TheTuringPost, teortaxesTex, _lewtun)

#AI is filling the God void for many – but is ChatGPT really something to worship?

Optimasi Arsitektur Model AI, Efisiensi, dan Infrastruktur : Media sosial membahas arsitektur dan efisiensi model AI, termasuk efisiensi MFU model MoE, pelatihan MoE ultra-sparse nmoe, dan penyederhanaan inferensi LLM (seperti mini-SGLang). Pengguna memperhatikan kemajuan model dalam pemrosesan konteks panjang, manajemen memori, dan optimasi perangkat keras (seperti backend terdistribusi MLX, vLLM serving) untuk meningkatkan kinerja keseluruhan dan skalabilitas sistem AI. (Sumber: lateinteraction, hyhieu226, TheZachMueller, dejavucoder, awnihannun, vllm_project, aiamblichus)

How long have you been "planning to understand" how modern LLM inference works?

Strategi Perusahaan AI, Persaingan Pasar, dan Mobilitas Talenta : Media sosial membahas strategi perusahaan AI dan persaingan pasar, termasuk Amazon merekrut peneliti AI top, Thinking Machines berencana merilis model, input-output Meta AI, dan masalah organisasi yang dihadapi OpenAI. Pengguna juga memperhatikan kepemimpinan NVIDIA di bidang AI open-source, strategi berbasis perangkat kerasnya, dan mobilitas talenta kunci seperti peneliti Anthropic yang bergabung dengan Tencent. (Sumber: pmddomingos, scaling01, teortaxesTex, steph_palazzolo, TheTuringPost, Sentdex, teortaxesTex, turbopuffer, iScienceLuvr, EthanJPerez)

John Schulman says Thinking Machines, the lab he co-founded with Mira Murati, will release their own models in 2026

Laporan Status Pengkodean AI dan Tren Industri : Greptile merilis “Laporan Status Pengkodean AI 2025”, menunjukkan bahwa output kode bulanan pengembang meningkat 76%, volume PR membengkak, dan distribusi keuntungan alat AI tidak merata. Laporan ini juga membandingkan kinerja model OpenAI, Anthropic, dan Google dalam waktu respons token pertama, throughput, dan biaya, serta mengungkapkan lanskap persaingan pasar untuk database vektor dan alat memori AI. (Sumber: dotey)

Today we're releasing the first annual "State of AI Coding" report.

Evaluasi Model AI dan Reproduktifitas : Komunitas Reddit membahas tantangan evaluasi LLM dan masalah reproduktifitas. Pengguna berfokus pada bagaimana membangun standar evaluasi yang andal untuk memastikan hasil yang sebanding antara penelitian dan model yang berbeda, serta mengeksplorasi cara mengelola dan berbagi metode evaluasi dan dataset secara efektif di bidang LLM yang berkembang pesat untuk mempromosikan kemajuan ilmiah. (Sumber: Reddit r/deeplearning)

AI Terbuka dan Strategi Berbasis Perangkat Keras : Perilisan NVIDIA Nemotron 3 menandai titik balik simbolis dalam kepemimpinan AI open-source. Model ini, melalui data pra-pelatihan skala besar, dataset RL, dan arsitektur hibrida baru, mengoptimalkan konsumsi komputasi perangkat keras NVIDIA. Strategi ini menunjukkan bahwa AI open-source sedang bergerak dari era “filantropi teknologi besar” menuju era “AI yang ditentukan oleh perangkat keras”, di mana perilisan model bertujuan untuk memperluas konsumsi komputasi perangkat keras tertentu. (Sumber: TheTuringPost, teortaxesTex)

When @NVIDIA announced Nemotron 3 – it marked a symbolic turning point in a year that fundamentally reshaped open-source AI leadership.

Perbandingan dan Aplikasi Alat Generasi Gambar dan Video AI : Pengguna media sosial membahas kinerja dan aplikasi alat generasi gambar dan video AI, termasuk ChatGPT, Gemini, Midjourney, Grok, Nano Banana Pro, dll. Diskusi mencakup realisme karya seni AI, konversi karakter game, dan aplikasi video AI dalam produksi film. Pengguna juga memperhatikan kualitas, biaya, dan efisiensi konten yang dihasilkan AI, serta dampak disruptifnya terhadap alur kerja kreatif. (Sumber: dotey, swyx, karminski3, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT, Kling_ai)

Original No.73 | Visual Note

Aplikasi dan Tren AI di Sektor Keuangan : Media sosial membahas aplikasi AI di sektor keuangan, mencakup 26 kasus spesifik, seperti deteksi penipuan, manajemen risiko, layanan pelanggan, dll. Aplikasi ini menunjukkan bagaimana machine learning dan AI memberdayakan industri keuangan, meningkatkan efisiensi, mengoptimalkan pengambilan keputusan, dan menciptakan nilai bisnis baru. (Sumber: Ronald_vanLoon)

26 Examples of #AI in #Finance

Kombinasi Agen AI dan Knowledge Graph : Ilmuwan AI dari SAP membahas bagaimana meningkatkan penemuan dan eksekusi agen AI melalui knowledge graph. Knowledge graph menyediakan konteks semantik dan proses bagi agen AI, memungkinkan mereka untuk menemukan dan memanggil alat dan API dalam sistem perusahaan dengan lebih efektif, sehingga meningkatkan efisiensi agen dalam lingkungan perusahaan yang kompleks. (Sumber: DeepLearningAI)

Christoph Meyer, Principal AI Scientist and Lars Heling, Senior Knowledge Engineer at @SAP, discussed at AI Dev 25 x NYC how to improve AI agent discovery and execution using a knowledge graph.

Diskusi Evaluasi dan Reproduktifitas LLM : Komunitas Reddit membahas tantangan evaluasi LLM dan masalah reproduktifitas. Pengguna berfokus pada bagaimana membangun standar evaluasi yang andal untuk memastikan hasil yang sebanding antara penelitian dan model yang berbeda, serta mengeksplorasi cara mengelola dan berbagi metode evaluasi dan dataset secara efektif di bidang LLM yang berkembang pesat untuk mempromosikan kemajuan ilmiah. (Sumber: Reddit r/deeplearning)

Kinerja Model AI di UE dan Dampak Regulasi : Pengguna Reddit membahas apakah model AI video dan gambar menjadi “lebih bodoh” di wilayah UE karena regulasi. Pandangan umum adalah bahwa kualitas inti model tidak terpengaruh, tetapi lapisan keamanan yang ketat dan persyaratan kepatuhan UE dapat menyebabkan penundaan peluncuran fitur, penyaringan yang lebih ketat, atau pengaturan default yang berbeda, sehingga memengaruhi pengalaman pengguna, bukan penurunan kecerdasan model itu sendiri. (Sumber: Reddit r/ArtificialInteligence)

💡 Lain-lain

Integrasi AI di Bidang Seni dan Hiburan : Desdemona Robot dan band-nya akan tampil di San Francisco pada 11 Januari, menggabungkan AI dengan seni, menjelajahi potensi robot sebagai penampil. Pada saat yang sama, ada pengguna yang menyatakan harapan untuk melihat band menggunakan alat AI seperti Suno untuk menghasilkan lagu dan memainkannya secara langsung, yang mencerminkan tren aplikasi AI yang berkembang di bidang penciptaan musik dan hiburan langsung. (Sumber: bengoertzel, fabianstelzer)

ComfyUI Menjelajahi “Mode Sederhana” untuk Menyederhanakan Alur Kerja : ComfyUI sedang mengeksplorasi “mode sederhana” baru, bertujuan untuk membuat alur kerja yang kompleks lebih mudah dibagikan dan diulang, dengan fokus pada hasil daripada grafik node yang mendasarinya. Mode ini secara khusus ditujukan untuk pengguna yang merasa sulit memahami diagram besar, untuk menurunkan ambang batas penggunaan, meningkatkan pengalaman pengguna, dan efisiensi kerja. (Sumber: NerdyRodent)