Berita AI - 2025-12-23(Edisi pagi)

Kata Kunci：MiniMax M2.1, Kling 2.6, GLM-4.7, AI Agent, Model generasi video, Pelatihan LLM, Robot humanoid, Aplikasi bisnis AI, Peningkatan kemampuan pemrograman MiniMax M2.1, Teknologi kontrol gerak Kling 2.6, Optimasi Agentic Coding GLM-4.7, Integrasi ruang kerja AI Agent, Tingkat recall panjang konteks 192K

🎯 Tren

Kemajuan Model MiniMax M2.1/M2.5 dan Peningkatan Kemampuan Agent : MiniMax meluncurkan model M2.1, yang secara signifikan meningkatkan kemampuan pemrograman, Agent, dan penarikan konteks panjang. Model ini menunjukkan kinerja luar biasa dalam tugas Agent, melampaui pendahulunya, M2, dalam uji keuntungan. M2.1 mencapai tingkat penarikan 94% pada panjang konteks 192K dan membawa peningkatan besar dalam desain dan kualitas visual, mengisyaratkan lebih banyak terobosan di M2.5. Perusahaan secara aktif mengintegrasikan model Agentic dengan ruang kerja untuk memecahkan masalah praktis yang kompleks, tidak hanya terbatas pada obrolan. (Sumber: karminski3, MiniMax__AI, MiniMax__AI, MiniMax__AI, MiniMax__AI, MiniMax__AI）

Peningkatan Kemampuan Model Generasi Video Kling 2.6/Wan 2.6 : Versi 2.6 dari Kling AI dan Alibaba Wan menunjukkan kemajuan signifikan dalam generasi video, terutama dalam kontrol gerakan dan kemampuan narasi multi-shot. Kling 2.6 mencapai reproduksi gerakan dan ekspresi karakter yang mulus melalui kontrol gerakan, mampu mengekspresikan tarian kompleks secara akurat, dan mendukung model AI video real-time dengan memori konteks panjang untuk memastikan konsistensi. Wan 2.6 menekankan narasi multi-shot dan kontrol kamera tingkat sinematik, mendukung storyboard cerdas, konsistensi lintas-shot, generasi audio yang disinkronkan, dan pembuatan video hingga 15 detik, meningkatkan koherensi dan ekspresivitas video yang dihasilkan. (Sumber: karminski3, Alibaba_Wan, Kling_ai, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, Alibaba_Wan, connerruhl, Kling_ai, Kling_ai, Kling_ai, Alibaba_Wan, Kling_ai, Kling_ai, Kling_ai, Kling_ai, Kling_ai, Kling_ai, Kling_ai, Kling_ai, Kling_ai, Kling_ai, seo_leaders）

Model GLM-4.7 Tiongkok Dirilis, Memimpin dalam Kemampuan Pemrograman dan Agent : Zhipu AI merilis model GLM-4.7, yang secara signifikan meningkatkan kemampuan pengkodean, perencanaan tugas jangka panjang, dan orkestrasi alat, terutama dioptimalkan untuk skenario Agentic Coding. Model ini menunjukkan kinerja terdepan di berbagai benchmark publik, termasuk LMArena Code Arena blind test dan SWE-bench-Verified, bahkan melampaui GPT-5.2 dan Claude Sonnet 4.5, serta mencapai skor SOTA di LiveCodeBench V6. (Sumber: dejavucoder, Reddit r/LocalLLaMA, Reddit r/LocalLLaMA）

Model Multimodal Jan-v2-VL-Max 30B Dirilis : Tim Jan merilis Jan-v2-VL-Max, sebuah model multimodal 30B yang dirancang khusus untuk tugas eksekusi jangka panjang. Model ini melampaui Gemini 2.5 Pro dan DeepSeek R1 dalam benchmark “diminishing returns of hallucination”, yang mengukur panjang eksekusi. Model ini didasarkan pada Qwen3-VL-30B-A3B-Thinking dan menggunakan teknologi LoRA-based RLVR untuk meningkatkan stabilitas dan mengurangi akumulasi kesalahan dalam eksekusi multi-langkah. (Sumber: Reddit r/LocalLLaMA）

Gemini 3 Flash Dirilis dan Kemampuan Konteks Panjang : Google DeepMind merilis Gemini 3 Flash, mengklaim mencapai kinerja terdepan dan 3 kali lebih cepat dari 2.5 Pro. Model ini mencapai akurasi 90% dengan jendela konteks 1 juta di benchmark MRCR OpenAI, menunjukkan kinerja luar biasa dalam tugas konteks panjang, melampaui sebagian besar model yang hanya dapat menangani 256k konteks. (Sumber: GoogleDeepMind, agihippo）

Kemajuan Industri Robot Humanoid dan Prospek Pasar : Teknologi dan komersialisasi di bidang robot humanoid semakin cepat. Tesla Optimus dengan cepat melakukan iterasi dalam kontrol gerakan dan interaksi skenario, dan berencana untuk memulai pembangunan kapasitas produksi jutaan unit pada tahun 2026. Perusahaan domestik seperti Ubtech, ZHIYUAN Robotics, dan Unitree Robotics juga mempercepat produksi massal. Beijing Humanoid Robot Innovation Center merilis model VLA embodi XR-1 sumber terbuka, mendorong robot menuju “otonomi penuh dan penggunaan yang lebih baik”. Pasar diperkirakan akan beralih dari “spekulasi tema” menjadi didorong oleh “pesanan-elastisitas kinerja”, dengan penggantian komponen inti hulu secara domestik sebagai fokus investasi. (Sumber: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Sentdex, 36氪）

Anthropic Merilis Alat Bloom untuk Mengevaluasi Keselarasan Perilaku AI : Anthropic merilis alat sumber terbuka Bloom, yang digunakan untuk menghasilkan evaluasi keselarasan perilaku model AI terdepan. Bloom memungkinkan peneliti untuk mendefinisikan perilaku spesifik dan secara otomatis menghasilkan skenario untuk mengukur frekuensi dan tingkat keparahannya, bertujuan untuk meningkatkan keamanan dan keselarasan model AI. (Sumber: crystalsssup）

Model Qwen-Image-Layered Mencapai Pengeditan Gambar Berlapis : Alibaba merilis model Qwen-Image-Layered sumber terbuka, menyediakan fungsi dekomposisi gambar asli, mendukung pengeditan berlapis RGBA tingkat Photoshop. Model ini memungkinkan pengguna untuk mengontrol struktur gambar melalui Prompt, menentukan 3-10 lapisan, dan mencapai dekomposisi kedalaman tak terbatas, membawa fleksibilitas dan akurasi baru untuk generasi dan pengeditan gambar. (Sumber: RisingSayak, RisingSayak）

Kerangka Kerja Peningkatan Sistem LLM Multi-Agent : Penelitian baru mengusulkan kerangka kerja koordinasi adaptif yang secara signifikan meningkatkan kinerja sistem LLM multi-agent dalam menangani ambiguitas, konteks yang bervariasi, dan tugas kinerja yang tidak seimbang melalui perutean dinamis, umpan balik dua arah, dan mekanisme evaluasi agent paralel. Kerangka kerja ini meningkatkan cakupan faktual hingga 92% dan akurasi kepatuhan hingga 94% dalam tugas analisis SEC 10-K, serta secara signifikan mengurangi tingkat koreksi. (Sumber: omarsar0）

Runway Merilis Gen-4.5, Meningkatkan Pemahaman Anatomi dan Fisika dalam Video yang Dihasilkan : Runway merilis Gen-4.5, menandai langkah penting dalam teknologi generasi video dalam memahami anatomi, fisika, dan gerakan, yang diharapkan dapat menciptakan konten video yang lebih realistis dan koheren. (Sumber: c_valenzuelab）

🧰 Alat

Pustaka Google LangExtract: Ekstraksi Informasi Terstruktur LLM : Google merilis pustaka Python LangExtract, yang menggunakan LLM untuk mengekstrak informasi terstruktur dari teks tidak terstruktur, dengan fitur pelacakan sumber yang akurat, output terstruktur yang andal, pemrosesan dokumen panjang yang dioptimalkan, dan fungsionalitas visualisasi interaktif. Mendukung model Gemini dan Ollama lokal, cocok untuk catatan klinis, laporan, dan berbagai bidang lainnya, serta dapat menyesuaikan tugas ekstraksi. (Sumber: GitHub Trending）

Generasi PPT dan Infografis Berbantuan LLM : Pengguna berbagi pengalaman menggunakan LLM (seperti Google Gemini/Opal) untuk secara otomatis menghasilkan PPT berkualitas tinggi dan infografis kartun. Melalui prompt terstruktur dan konten format JSON, pengeditan cepat konten PPT dan generasi multi-halaman dapat dicapai, serta mengubah konten artikel menjadi infografis gaya kartun yang digambar tangan, meningkatkan efisiensi pembuatan konten dan daya tarik visual. (Sumber: dotey, dotey）

Qdrant Mendukung Pencarian Teks Multi-Sudut : Qdrant menyediakan dukungan pencarian teks yang komprehensif, termasuk pencarian semantik (berdasarkan vektor padat), pencarian leksikal/kata kunci, dan mode pencarian hibrida yang menggabungkan keduanya. Fitur ini memungkinkan pengguna untuk secara fleksibel mengkonfigurasi dan menyesuaikan strategi pencarian berdasarkan skenario aplikasi spesifik, memenuhi berbagai kebutuhan mulai dari pemahaman niat hingga pencocokan kata kunci yang tepat, cocok untuk RAG dan sistem pencarian umum. (Sumber: qdrant_engine）

Pengujian dan Aplikasi AI Coding Agent : Arstechnica menguji empat AI coding Agent dalam rekonstruksi game Minesweeper, mengungkapkan potensi AI dalam pengembangan game dan generasi kode. Pada saat yang sama, GPT-5.2-Codex digunakan untuk membangun simulator jalan anjing 3D, mengiterasi aset dan logika penempatan properti melalui tangkapan layar, menunjukkan peran bantu AI dalam pengembangan perangkat lunak yang kompleks. (Sumber: Reddit r/artificial, kylebrussell）

Fungsi dan Aplikasi Ekstensi Claude Chrome : Ekstensi Claude Chrome digunakan oleh pengguna untuk berbagai tugas kompleks, seperti memigrasikan proyek Notion ke database MySQL (termasuk membuat database, menulis kode), menyelesaikan pelatihan kerja, membandingkan perbedaan UI/UX aplikasi dan prototipe, serta mengelola jadwal. Ekstensi ini secara signifikan meningkatkan efisiensi kerja dengan menganalisis dan memanipulasi konten web, menunjukkan potensi kuat AI Agent di lingkungan browser. (Sumber: Reddit r/ClaudeAI）

Bot Dukungan AI Open WebUI : Saluran Discord Open WebUI meluncurkan bot pertanyaan/dukungan “mahatahu” yang mengindeks semua dokumentasi, pertanyaan, dan diskusi Open WebUI. Bot ini secara efektif dapat menjawab pertanyaan pengguna tentang konfigurasi, kode kesalahan, dll., bertujuan untuk meningkatkan efisiensi dukungan komunitas. (Sumber: Reddit r/OpenWebUI）

Alur Kerja Agregasi Berita AI : Seorang pengguna berbagi pengalaman membangun alur kerja ringkasan berita otomatis menggunakan alat seperti n8n. Sistem ini secara otomatis mengagregasi, meringkas berita, dan mempublikasikannya ke situs web, bahkan diindeks oleh Google News. Ini menunjukkan potensi komersial AI dalam generasi konten dan penyebaran berita. (Sumber: Reddit r/ArtificialInteligence）

📚 Pembelajaran

Evolusi Era Pelatihan LLM dan Optimasi Inferensi : Metode pelatihan LLM berkembang dari pre-training, RLHF+PPO, LoRA SFT menjadi Mid-Training dan RLVR+GRPO. Pada saat yang sama, penelitian mengusulkan komponen arsitektur ringan seperti Canon Layers, yang secara signifikan meningkatkan kedalaman dan keluasan inferensi LLM dengan memfasilitasi aliran informasi lateral antara Token yang berdekatan, dan dapat membuat arsitektur yang lebih lemah cocok dengan model SOTA, menyediakan jalur prediksi yang hemat biaya untuk desain arsitektur di masa depan. (Sumber: rasbt, HuggingFace Daily Papers）

Aplikasi dan Optimasi Multi-turn RL dalam Agentic LLM : Menanggapi tantangan dalam tugas interaksi multi-turn LLM Agent di lingkungan nyata, penelitian mengusulkan algoritma Turn-PPO, yang meningkatkan ketahanan dan efektivitas PPO dalam multi-turn RL dengan melakukan estimasi keuntungan melalui MDP tingkat giliran daripada MDP tingkat Token. Metode ini secara signifikan mengungguli baseline GRPO pada dataset WebShop dan Sokoban, terutama menunjukkan kinerja yang lebih baik dalam skenario yang membutuhkan penalaran jangka panjang. (Sumber: HuggingFace Daily Papers）

Paradigma Evaluasi LLM-as-a-Judge Baru Sage : Benchmark LLM-as-a-Judge yang ada bergantung pada anotasi manual, memperkenalkan bias dan sulit diskalakan. Suite evaluasi Sage memperkenalkan dua metrik baru, yaitu konsistensi diri lokal (stabilitas preferensi berpasangan) dan konsistensi logis global (transitivitas preferensi), untuk mengevaluasi kualitas penilaian LLM tanpa anotasi manual. Penelitian menemukan bahwa bahkan model SOTA masih memiliki masalah “preferensi kontekstual” yang signifikan dalam kasus-kasus kompleks, menyoroti pentingnya kriteria penilaian yang jelas. (Sumber: HuggingFace Daily Papers）

Anatomi dan Tantangan Model VLA Embodi : Tinjauan sistematis model Visual-Language-Action (VLA), dari modul, tonggak sejarah hingga tantangan inti, menganalisis secara rinci kemajuan revolusioner model VLA di bidang robotika. Fokus pada lima tantangan utama: representasi, eksekusi, generalisasi, keamanan, serta dataset dan evaluasi, memberikan panduan belajar dan arah penelitian di masa depan bagi para peneliti. (Sumber: HuggingFace Daily Papers）

Eksplorasi dan Adaptasi Meta-RL LLM Agent : Kerangka kerja LaMer memungkinkan LLM Agent untuk secara aktif menjelajahi lingkungan dan belajar dari umpan balik selama pengujian melalui pelatihan lintas-giliran dan adaptasi kebijakan kontekstual berbasis refleksi. Metode Meta-RL ini secara signifikan meningkatkan kinerja Agent di lingkungan seperti Sokoban, MineSweeper, dan Webshop, dan menunjukkan kemampuan generalisasi yang lebih baik, menyediakan jalur baru untuk adaptasi Agent yang kuat di lingkungan yang kompleks dan tidak diketahui. (Sumber: HuggingFace Daily Papers）

Penelitian Peningkatan Kemampuan Inferensi Model LLM : Penelitian Carnegie Mellon University menemukan bahwa peningkatan kemampuan inferensi model AI dipengaruhi secara berbeda oleh pre-training, mid-training, dan Reinforcement Learning (RL). RL dapat benar-benar meningkatkan penalaran dalam kondisi tertentu, generalisasi lintas konteks membutuhkan pre-training, mid-training sangat penting, dan reward yang sadar proses adalah kuncinya. (Sumber: TheTuringPost, TheTuringPost）

Strategi Adaptasi Agentic AI, Tumpukan Teknologi, dan Jalur Pembelajaran : Lembaga penelitian seperti UIUC, Stanford, dan Harvard mengusulkan empat strategi adaptasi kunci untuk Agentic AI, termasuk mengadaptasi Agent melalui hasil alat, melatih Agent menggunakan outputnya sendiri, mengadaptasi alat secara independen, dan melatih alat melalui umpan balik Agent yang tetap, memberikan panduan untuk pengembangan dan optimasi Agentic AI. Selain itu, ada juga tentang cara kerja Agentic AI, karakteristik arsitektur, tujuh jenis umum, dan panduan 50 langkah untuk menguasai Agentic AI pada tahun 2025-2026. (Sumber: TheTuringPost, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon）

Strategi Prompt Terstruktur XML Claude : Anthropic secara resmi menyarankan penggunaan prompt terstruktur XML untuk meningkatkan pemahaman dan kualitas output model Claude. Dengan menambahkan tag seperti <task>, <context>, <constraints>, <output_format> dalam permintaan, dapat membantu Claude mengurai Prompt dengan lebih akurat, terutama efektif untuk tugas-tugas kompleks. (Sumber: Reddit r/ClaudeAI）

Panduan Evaluasi End-to-End Pipeline RAG : Qdrant membagikan panduan mendalam tentang evaluasi end-to-end pipeline RAG (Retrieval-Augmented Generation). Panduan ini menggabungkan alat seperti RAGAS, LangGraph, Qdrant, dan OPIK, menunjukkan cara membangun proses evaluasi RAG tingkat produksi, termasuk pembuatan dataset, metode evaluasi LLM-as-a-Judge, efektivitas evaluasi biner, dan metode RAG-Triad, bertujuan untuk memastikan keandalan sistem RAG sebelum deployment. (Sumber: qdrant_engine）

Panduan Fine-tuning LLM NVIDIA Unsloth : NVIDIA merilis panduan pemula untuk fine-tuning LLM menggunakan Unsloth, mencakup metode pelatihan seperti LoRA, FFT, RL, kapan dan kasus penggunaan fine-tuning, serta jumlah data dan VRAM yang dibutuhkan, dan memandu cara melakukan pelatihan lokal pada perangkat seperti DGX Spark, RTX GPU. (Sumber: Reddit r/LocalLLaMA）

💼 Bisnis

Perusahaan Model AI Besar Tiongkok Zhipu dan MiniMax Antre untuk IPO : Perusahaan model AI besar Tiongkok Zhipu dan MiniMax (Xiyu Technology) telah melewati dengar pendapat di Bursa Efek Hong Kong dan sedang dalam proses IPO, berpotensi menjadi perusahaan model AI besar pertama di dunia yang go public. Kedua perusahaan memiliki valuasi puluhan miliar RMB, tetapi masih jauh dari valuasi OpenAI yang ratusan miliar dolar. Zhipu berfokus pada pasar B2B dan G2B, menyediakan layanan platform MaaS; MiniMax bertaruh pada multimodalitas, mendalami produk C2C dan mengikuti jalur globalisasi. Kedua perusahaan menghadapi tantangan pendapatan yang melonjak tetapi kerugian besar. (Sumber: 36氪）

CEO JPMorgan Berbicara tentang Dampak AI pada Pasar Kerja dan Keterampilan Masa Depan : CEO JPMorgan Jamie Dimon percaya bahwa AI akan menghilangkan pekerjaan yang berulang, tetapi tidak akan menyebabkan pengangguran massal. Dia menekankan bahwa kunci keberhasilan karir di masa depan adalah menguasai tiga keterampilan: kefasihan teknologi (menggunakan alat AI secara efektif), penilaian (menafsirkan output AI dan membuat keputusan berisiko tinggi), dan keterampilan manusia (komunikasi, empati, kepemimpinan). JPMorgan menginvestasikan lebih dari 12 miliar dolar setiap tahun dalam teknologi, dan AI telah diterapkan di ratusan skenario internal. (Sumber: Reddit r/ArtificialInteligence）

Akselerator AI Founderscape.ai : Founderscape.ai adalah platform MMORG (Massively Multiplayer Online Role-Playing Game) yang akan datang untuk para pendiri, bertujuan untuk membantu pengusaha dari ide hingga IPO, bahkan mencapai valuasi triliunan dolar, menggunakan AI untuk mempercepat proses startup. (Sumber: amasad）

🌟 Komunitas

Dampak AI pada Pasar Kerja dan Peringatan Ahli : Pada tahun 2025, hampir 55.000 pekerjaan di AS digantikan oleh AI, dengan total PHK mencapai 1,17 juta. Pemenang Turing Award Yoshua Bengio dan CEO Anthropic Dario Amodei sama-sama memperingatkan bahwa AI akan menyebabkan pengangguran massal dan keruntuhan pasar tenaga kerja, dengan pekerjaan baru yang tidak cukup untuk mengimbangi pekerjaan yang digantikan. Di masa depan, hanya orang yang menguasai alat AI, penilaian, komunikasi interpersonal, dan kolaborasi lintas domain serta keterampilan manusia unik lainnya yang dapat beradaptasi. (Sumber: 36氪, Reddit r/ArtificialInteligence, Reddit r/ChatGPT, ClementDelangue）

Halusinasi LLM dan Fenomena “Psikosis AI” dalam Penemuan Ilmiah : Dengan peningkatan kemampuan LLM, muncul fenomena “psikosis AI” (LLM psychosis), yaitu model atau pengguna secara keliru percaya telah membuat terobosan signifikan di bidang yang tidak mereka pahami, misalnya, ada yang mengklaim LLM dapat membuktikan persamaan Navier-Stokes. Para ahli memperingatkan bahwa respons cepat LLM dapat membuat orang salah mengira telah memahami, tetapi 1% halusinasi dapat menyebabkan kesalahpahaman serius, yang dapat menyebabkan keraguan berlebihan terhadap pekerjaan pemula dan kembalinya sertifikasi, memperlambat kemajuan ilmiah. (Sumber: teortaxesTex, demishassabis, hyhieu226, arohan）

Kontroversi Kegunaan Browser AI : Di media sosial, ada keraguan luas tentang kegunaan browser AI (seperti Comet, ChatGPT Atlas). Pengguna berpendapat bahwa fungsi otomatisasinya tidak berkinerja baik dalam tugas-tugas kompleks, pengaturan, pemeliharaan, dan debugging memakan waktu, dan dapat menyebabkan penurunan kinerja perangkat. Pengembang menunjukkan bahwa alat-alat ini masih dalam tahap awal, “janji lebih besar dari kenyataan”, tetapi di masa depan diharapkan dapat memecahkan masalah kompleks melalui model agent dan manajemen status visual. (Sumber: Reddit r/artificial, TheTuringPost, TheTuringPost）

Dampak AI pada Pembuatan Konten dan Kepercayaan Informasi : Dengan meluasnya konten yang dihasilkan AI, kepercayaan pengguna terhadap jawaban AI meningkat, banyak orang cenderung langsung menggunakan ringkasan AI daripada menjelajahi situs web lengkap. Hal ini mendorong pembuat konten untuk menyesuaikan strategi, berfokus pada bagaimana konten dapat diambil dan diringkas oleh model AI. Pada saat yang sama, ada juga pandangan bahwa orang mempercayai kecepatan dan kemampuan komprehensif AI, tetapi masih perlu memverifikasi melalui situs web, AI adalah perhentian pertama, bukan otoritas terakhir. (Sumber: Reddit r/ArtificialInteligence）

Perdebatan Keberadaan dan Definisi AGI : Yann LeCun berpendapat bahwa tidak ada General Artificial Intelligence (AGI), dan kecerdasan manusia adalah ilusi yang sangat terspesialisasi. Sementara itu, CEO DeepMind Demis Hassabis membantah, menyatakan bahwa otak sangat umum, dan model dasar AI adalah perkiraan Turing machine, yang memiliki potensi untuk mempelajari apa pun yang dapat dihitung. Selain itu, sebuah makalah mengusulkan definisi AGI berdasarkan “entity fidelity”, yaitu kecerdasan adalah kemampuan untuk menghasilkan entitas konsep yang sama berdasarkan contoh konsep, bertujuan untuk menyediakan standar kecerdasan yang dapat dievaluasi dan tidak tergantung spesies. (Sumber: demishassabis, Reddit r/ArtificialInteligence）

Dampak AI Mempercepat Pembuatan Video pada Industri : Seorang pengguna berbagi pengalaman menggunakan alat AI (Claude Code, Gemini CLI, ElevenLabs, Remotion) untuk membuat video penjelasan animasi berdurasi 18 menit dalam beberapa hari, dan terkejut karenanya. Dia percaya bahwa bahkan versi awal alat AI dapat mencapai tingkat profesional yang “cukup baik”, yang akan membuat banyak desainer gerak, animator, dan editor video tingkat menengah menghadapi risiko kehilangan pekerjaan, menandakan bahwa perubahan industri sedang terjadi. (Sumber: Reddit r/ArtificialInteligence）

Visi dan Tantangan Masa Depan AI Agent : Sam Altman memprediksi bahwa kekuatan persuasif super-manusia AI akan tercapai lebih awal dari kecerdasan umum, yang mungkin membawa konsekuensi tak terduga. Perusahaan seperti MiniMax berkomitmen untuk membangun model Agentic dan ruang kerja yang dapat memecahkan masalah kompleks dunia nyata, menekankan bahwa manajemen status yang terlihat sangat penting untuk kepercayaan dan kegunaan. (Sumber: teortaxesTex, MiniMax__AI）

Diskusi Kinerja Model dan Fungsi Memori ClaudeAI : Komunitas Reddit mendiskusikan batasan penggunaan, bug, dan masalah kinerja ClaudeAI, serta kekuatan dan potensi dampak fungsi memorinya. Pengguna menemukan bahwa fungsi memori Claude dapat mengingat banyak detail percakapan historis, sangat meningkatkan efisiensi kerja, tetapi beberapa pengguna memilih untuk mematikannya karena penggunaan memori yang terlalu agresif. (Sumber: Reddit r/ClaudeAI, Reddit r/ClaudeAI）

Aplikasi AI dalam Ritel dan Human API : Seorang peneliti machine learning, dengan pengalamannya sebagai staf paruh waktu di Walmart, mengungkapkan tantangan yang dihadapi AI/otomatisasi di lingkungan ritel. Dia mengamati bahwa karyawan manusia sering dipekerjakan untuk menangani tempat-tempat di mana sistem gagal, seperti pergeseran inventaris, kebingungan visual, inferensi kerusakan, dan kegagalan optimasi rute, secara efektif bertindak sebagai “Human API” untuk mesin. Ini menunjukkan bahwa sistem otomatisasi yang ada masih perlu beroperasi di lingkungan yang dirancang untuk mesin agar berfungsi paling baik. (Sumber: Reddit r/ArtificialInteligence）

Tantangan dalam Evaluasi Konteks Panjang LLM : Model Claude berkinerja buruk dalam evaluasi konteks panjang, memicu diskusi komunitas. Meskipun Anthropic Opus 4.5 telah meningkatkan kecepatan, masih menghadapi tantangan dalam penarikan dan pemahaman konteks panjang, yang sangat penting untuk tugas Agent yang membutuhkan pemrosesan informasi dalam jumlah besar. (Sumber: scaling01, dejavucoder）

💡 Lain-lain

Teknologi Militer Berbasis AI dan Aplikasi Drone : Laporan medan perang Ukraina menunjukkan bahwa peran drone dalam operasi militer semakin meningkat, termasuk koordinasi serangan udara dan serangan swarm drone FPV. Ini menunjukkan bahwa kemampuan militer banyak diinvestasikan dalam pasukan drone, mengisyaratkan bahwa perang di masa depan mungkin melibatkan konfrontasi dengan kekuatan drone yang terindustrialisasi. (Sumber: teortaxesTex, jpt401）

Penyebaran Teknologi Pengawasan AI di Sekolah AS Menimbulkan Kontroversi : Sekolah-sekolah di seluruh AS sedang mempromosikan teknologi pengawasan berbasis AI, termasuk drone, pengenalan wajah, dan bahkan perangkat pendengar kamar mandi. Ini menimbulkan kekhawatiran siswa tentang privasi dan kepercayaan, dengan 32% siswa menyatakan merasa selalu diawasi dan mengurangi keinginan untuk melaporkan masalah kesehatan mental kepada pendidik. (Sumber: Reddit r/artificial）

Firefox Akan Memungkinkan Pengguna Menonaktifkan Semua Fitur AI : Mozilla Firefox mengkonfirmasi akan segera memungkinkan pengguna untuk sepenuhnya menonaktifkan semua fitur AI di browser. Langkah ini bertujuan untuk menanggapi ketidakpuasan beberapa pengguna terhadap fitur AI yang dipaksakan, memberikan lebih banyak kontrol kepada pengguna. (Sumber: Reddit r/ArtificialInteligence）

🎯 Tren

🧰 Alat

📚 Pembelajaran

💼 Bisnis

🌟 Komunitas

💡 Lain-lain

Tag Terkait

Related Posts

Berita AI – 2026-07-21

Berita AI – 2026-07-20

Berita AI – 2026-07-19