Yapay Zeka Bülteni – 2025-06-01(Sabah baskısı)

Anahtar Kelimeler:AI optimizasyonu, CUDA çekirdekleri, Büyük model çıkarımı, Formel matematik, Kod üretimi, Stanford AI tarafından oluşturulan CUDA çekirdekleri, Huawei S-GRPO yöntemi, DeepMind matematik varsayımları kütüphanesi, Tongyi Lingma AI IDE, RISEBench görüntü düzenleme değerlendirmesi

🔥 Odak Noktası

Stanford Üniversitesi, yapay zekanın insan uzmanlardan daha iyi performans gösteren CUDA çekirdekleri üretebildiğini tesadüfen keşfetti: Stanford Üniversitesi araştırma ekibi, çekirdek üretim modelleri için sentetik veri oluşturmaya çalışırken, yapay zekanın (OpenAI o3 ve Gemini 2.5 Pro) insan uzmanların manuel olarak optimize ettiğinden daha iyi performans gösteren CUDA çekirdekleri üretebildiğini tesadüfen keşfetti. Yapay zeka tarafından üretilen bu çekirdekler, matris çarpımı, iki boyutlu evrişim, Softmax ve katman normalleştirme gibi yaygın derin öğrenme işlemlerinde yerel PyTorch’u önemli ölçüde geride bırakarak bazı işlemlerde performansı yaklaşık 4 kat artırdı. Bu yöntem, yapay zekanın önce doğal dilde optimizasyon fikirleri üretmesini, ardından bunları koda dönüştürmesini ve optimizasyon yaklaşımlarının çeşitliliğini artırıp yerel optimalardan kaçınmak için çok dallı bir keşif modeli kullanmasını içeriyor. Bu başarı, yapay zekanın düşük seviyeli kod optimizasyonundaki muazzam potansiyelini gösteriyor (Kaynak: 量子位)

Stanford, insan uzmanlardan daha iyi performans gösteren süper güçlü CUDA çekirdeklerini yapay zeka ile tesadüfen üretti! Yerel PyTorch'u katlayarak eziyor, Çinli baş araştırmacı

DeepMind, biçimsel matematik varsayımları kütüphanesini açık kaynak olarak yayınladı, Terence Tao desteğini paylaştı: DeepMind, Landau problemleri gibi Lean biçimsel dilinde ifade edilen matematiksel varsayımları toplamak ve düzenlemek amacıyla “Biçimsel Matematik Varsayımları Kütüphanesi” adlı bir projeyi açık kaynak olarak yayınladı. Bu kütüphane, otomatik teorem ispatlama (ATP) ve yapay zeka modelleri için değerli test ölçütleri ve eğitim verileri sağlamanın yanı sıra, dünya çapındaki araştırmacıların yeni biçimsel problemlerle katkıda bulunmalarına veya mevcut girdileri iyileştirmelerine olanak tanıyor. Fields Madalyası sahibi Terence Tao, bunun açık matematik problemlerini çözmek için otomatik araçların kullanılmasında önemli bir adım olduğunu belirterek projeye desteğini ifade etti. Proje, topluluk işbirliği yoluyla yapay zekanın matematiksel akıl yürütme ve ispat alanlarındaki gelişimini desteklemeyi umuyor (Kaynak: 量子位)

Terence Tao paylaştı! DeepMind, "Yapay Zeka Matematiksel İspat Standart Alıştırma Seti"ni açık kaynak olarak yayınladı

Huawei’nin S-GRPO yöntemi büyük model çıkarımını optimize ederek hızı %60 artırıyor ve doğruluğu yükseltiyor: Huawei, büyük dil modellerinin (LLM) çıkarım sürecindeki “gereksiz düşünme” sorununu çözmeyi amaçlayan S-GRPO (Sıralı Gruplama Azalan Ödül Stratejisi Optimizasyonu) adlı yeni bir yöntem önerdi. “Sıralı gruplama + azalan ödül” tasarımıyla S-GRPO, modelin çıkarım doğruluğunu korurken gereksiz düşünme adımlarını erken sonlandırmayı öğrenmesini sağlayarak çıkarım hızını %60’a kadar artırıyor ve aynı zamanda daha kesin ve faydalı cevaplar üretiyor. Bu yöntem, özellikle eğitim sonrası optimizasyonun son adımı olarak uygun olup, modelin orijinal çıkarım yeteneklerine zarar vermeden düşünce zincirinin erken aşamalarında daha yüksek kaliteli çıkarım yolları üretmesini teşvik ediyor (Kaynak: 量子位)

Huawei, yapay zeka çıkarımındaki "çok fazla düşünme" sorununu aştı! Yeni yöntem, büyük model çıkarım hızını %60 artırırken doğruluğu da yükseltti

🎯 Gelişmeler

OpenAI, ChatGPT’yi “süper asistan” olarak geliştirmeyi planlıyor: 2024 sonundaki iç belgelere göre OpenAI, gelecek yılın ilk yarısında ChatGPT’yi bir “süper asistan”a yükseltmeyi planlıyor. Bu asistan, daha güçlü kişiselleştirilmiş anlama yeteneklerine sahip olacak, kullanıcıların ilgi alanlarını anlayacak ve bir insanın bilgisayarda yapabileceği her türlü akıllı, güvenilir ve duygusal zekaya sahip görevi yerine getirebilecek. Bu hedefe ulaşmanın anahtarı, 02 ve 03 gibi daha akıllı modellerin, agent görevlerini güvenilir bir şekilde yerine getirebilmesi, eylem yeteneklerini artırmak için bilgisayar araçlarını kullanabilmesi ve çok modlu ve üretken kullanıcı arayüzleri aracılığıyla verimli bir şekilde etkileşim kurabilmesidir (Kaynak: Reddit r/ArtificialInteligence)

OpenAI, ChatGPT'yi "süper asistan" olarak geliştirmeyi planlıyor

Hugging Face ve Pollen Robotics, 250 dolarlık açık kaynaklı robot platformu için işbirliği yaptı: Hugging Face ve Pollen Robotics, bir konferansta 250 dolarlık açık kaynaklı bir robotu duyurmak için güçlerini birleştirdi. Robot, Hugging Face Spaces, modeller ve topluluk kaynakları aracılığıyla ilginç insan-robot etkileşimi uygulamalarının geliştirilmesini teşvik etmek için açık bir platform olarak hizmet vermeyi amaçlıyor. Bu hamle, Hugging Face’in düşük maliyetli, özelleştirilebilir robot donanımı ve yazılımı ekosistemini destekleme çabalarını gösteriyor (Kaynak: clefourrier)

Google DeepMind ve diğerleri, LLM destekli evrensel algoritma keşfi ve optimizasyonu için akıllı agent AlphaEvolve’u yayınladı: Google DeepMind, Terence Tao gibi önde gelen bilim insanlarıyla işbirliği yaparak, evrensel algoritmaların keşfi ve optimizasyonuna odaklanan, LLM destekli bir evrimsel kodlama agent’ı olan AlphaEvolve’u tanıttı. Sistem, 11 boyutlu uzayda öpüşme sayısı gibi karmaşık matematiksel problemleri çözmede ilerleme kaydetti ve vakaların yaklaşık %75’inde SOTA (son teknoloji) çözümleri yeniden keşfetti, %20’sinde ise bilinen en iyi çözümleri geliştirerek yapay zekanın matematik ve diğer bilimsel alanlarda yeni bilgiler keşfetme potansiyelini gösterdi (Kaynak: 量子位)

Google DeepMind ve diğerleri, LLM destekli evrensel algoritma keşfi ve optimizasyonu için akıllı agent AlphaEvolve'u yayınladı

Yeni benchmark RISEBench, görüntü düzenleme modellerinin çıkarım yeteneklerini değerlendiriyor, GPT-4o-Image görevlerin yalnızca %28,9’unu tamamladı: Shanghai AI Laboratory, birçok üniversiteyle işbirliği içinde, modellerin zaman, nedensellik, uzay ve mantık olmak üzere dört temel çıkarım türündeki görsel düzenleme yeteneklerini değerlendirmeye odaklanan, 360 insan uzman tarafından tasarlanmış vakayı içeren yeni bir görüntü düzenleme değerlendirme ölçütü olan RISEBench’i yayınladı. Test sonuçları, en güçlü GPT-4o-Image’ın bile görevlerin yalnızca %28,9’unu tamamlayabildiğini, BAGEL gibi açık kaynaklı modellerin ise yalnızca %5,8’ini tamamlayabildiğini göstererek mevcut modellerin karmaşık komutları anlama ve derinlemesine çıkarım tabanlı düzenleme konularındaki eksikliklerini vurguladı (Kaynak: 量子位)

GPT-4o-Image görevlerin yalnızca %28,9'unu tamamladı! Shanghai AI Laboratory ve diğerleri, 360 insan uzman tarafından özenle seçilmiş zorlu problemler içeren yeni bir görüntü düzenleme ölçütü yayınladı

Yeni araştırma HAMburger, “Token kırma” yoluyla LLM çıkarımını hızlandırıyor: HAMburger adlı yeni bir araştırma, temel LLM’ye mikro kodlayıcılar ve mikro kod çözücüler ekleyerek tek bir ileri yayılımda birden fazla Token üretmeyi sağlayan hiyerarşik bir otoregresif model öneriyor. Bu “Token kırma” tekniği, birden fazla Token’ı tek bir KV önbelleğine sıkıştırarak KV önbelleğinin ve ileri FLOP’ların büyümesini lineerden alt-lineere dönüştürmeyi ve çıkarım hızını sorgu karmaşıklığına ve çıktı yapısına göre ayarlamayı amaçlıyor. Deneyler, HAMburger’ın KV önbellek hesaplamasını 2 kata kadar azaltabildiğini, TPS’yi 2 kata kadar artırabildiğini ve uzun ve kısa bağlam görevlerinde kaliteyi koruyabildiğini gösteriyor (Kaynak: Reddit r/MachineLearning)

Yeni araştırma HAMburger, "Token kırma" yoluyla LLM çıkarımını hızlandırıyor

Google, Bayesçi uyarlanabilir takviyeli öğrenme yoluyla LLM’lerin yansıtıcı keşfini inceleyen bir makale yayınladı: Google’ın yeni bir makalesi olan “Beyond Markovian: Reflective Exploration via Bayes-Adaptive RL for LLM Reasoning”, yansıtıcı keşfi Bayesçi uyarlanabilir takviyeli öğrenme (BARL) çerçevesine dahil etme yöntemini öneriyor. Bu yöntem, LLM’lerin çıkarım sürecinde önceki denemeleri gözden geçirip değerlendirmesini sağlayarak karar vermeyi optimize etmeyi amaçlıyor. BARL, son dağılım altındaki beklenen getiriyi açıkça optimize ederek modeli ödül maksimizasyonu için kullanmaya ve inanç güncellemesi yoluyla bilgi toplama keşfine teşvik ediyor. Deneyler, BARL’ın sentetik ve matematiksel çıkarım görevlerinde standart Markovian takviyeli öğrenme yöntemlerinden daha iyi performans gösterdiğini, daha yüksek Token verimliliği ve keşif etkinliği sağladığını kanıtlıyor (Kaynak: Reddit r/MachineLearning)

Araştırma, LLM’lerin düşünme biçimlerinin insanlardan farklı olduğuna işaret ediyor: Yann LeCun’un paylaştığı “From Tokens to Thoughts: How LLMs and Humans Trade Compression for Meaning” başlıklı bir araştırma, LLM’lerin kavramları insanlarla aynı şekilde oluşturup oluşturmadığını test ederek, LLM’lerin bazı görevlerde başarılı olmasına rağmen, içsel “düşünme” süreçlerinin ve kavram oluşturma mekanizmalarının insanlardan önemli ölçüde farklı olduğunu ortaya koydu. Bu, LLM’lerin yetenek sınırlarını ve gelecekteki gelişim yönlerini anlamak için önemli bir anlam taşıyor (Kaynak: ylecun)

Araştırma, LLM'lerin düşünme biçimlerinin insanlardan farklı olduğuna işaret ediyor

Anthropic, LLM düşünce izleme yöntemini açık kaynak olarak yayınladı, atıf grafikleri oluşturuyor: Anthropic şirketi, büyük dil modellerinin (LLM) “düşünme sürecini” izleyebilen yeni bir yöntemi açık kaynak olarak yayınladı. Bu yöntem, modelin çıktıya karar verirken attığı iç adımları ve bağımlılıkları gösteren atıf grafikleri oluşturabiliyor, bu da LLM’lerin yorumlanabilirliğini ve şeffaflığını artırmaya yardımcı oluyor. Bu araç, model kararlarını anlamak, hata ayıklamak ve model güvenilirliğini artırmak için önemli bir anlam taşıyor (Kaynak: code_star)

Anthropic, LLM düşünce izleme yöntemini açık kaynak olarak yayınladı, atıf grafikleri oluşturuyor

Sakana AI ve UBC, “Darwin Gödel Makinesi”ni önerdi: açık uçlu evrimle kendi kendini geliştiren agent: Sakana AI, UBC’den Jeff Clune’un laboratuvarıyla işbirliği yaparak “Darwin Gödel Makinesi” (Darwin Gödel Machine, DGM) adlı yeni bir yapay zeka sistemi önerdi. Bu sistem, 20 yıl önce Jürgen Schmidhuber tarafından önerilen “Gödel Makinesi” kavramından esinlenerek, süresiz olarak öğrenebilen ve öğrenme kodu da dahil olmak üzere kendi kodunu yeniden yazarak kendi kendini geliştirebilen bir yapay zeka yaratmayı amaçlıyor. Teorik Gödel Makinesi’nden farklı olarak DGM, gerçekçi olmayan matematiksel kanıtlara dayanmak yerine, performans iyileştirmelerini ampirik olarak bularak Darwinci evrim gibi açık uçlu algoritmaların prensiplerini kullanıyor. Araştırma ekibi, DGM’yi kendi kendini geliştiren kodlama agent’larına uygulayarak, yama doğrulama adımları ekleme, dosya görüntüleme ve düzenleme araçlarını iyileştirme gibi programlama görevlerindeki performansı artırmak için kendi kodlarını yeniden yazmalarını sağladı (Kaynak: SchmidhuberAI)

Hugging Face, 3000 dolarlık insansı robotu piyasaya sürmeyi planlıyor: Hugging Face, HopeJr adlı insansı bir robotu sadece 3000 dolarlık bir fiyatla piyasaya sürmeyi umuyor. @therobotstudio ve @huggingface tarafından ortaklaşa tasarlanan bu robot, yürüme ve çeşitli nesneleri manipüle etme yeteneğine sahip ve açık kaynaklıdır. Bu hamle, insansı robot araştırmalarının ve uygulamalarının önündeki engelleri azaltmayı ve bu alandaki gelişmeyi teşvik etmeyi amaçlıyor (Kaynak: _akhaliq, _akhaliq)

Yeni araştırma, LLM’lerdeki dikkat mekanizmalarına ve uzun süreli bellek modüllerine odaklanıyor: Ali Behrouz, LLM’lerin ilerlemesinde dikkat mekanizmalarının kritik rolünü ve RNN’ler gibi uzun süreli bellek modüllerinin gelişimindeki darboğazları tartışıyor. Ayrıca, test sırasında bağlamı nasıl hatırlayacağını öğrenebilen, uzun süreli bağlam belleği yeteneğine sahip Atlas adlı yeni bir mimariyi tanıtıyor. Atlas, dil modelleme görevlerinde Titans, Transformer ve modern lineer RNN’lerden daha iyi performans gösteriyor, etkili bağlam uzunluğunu 10M’ye kadar genişletebiliyor ve BABILong benchmark testinde %80’in üzerinde doğruluk elde ediyor. Araştırma ayrıca, Atlas fikrine dayanan ve softmax dikkatini kesin olarak genelleştiren başka bir model sınıfını da tartışıyor (Kaynak: jeremyphoward)

Yeni araştırma, LLM'lerdeki dikkat mekanizmalarına ve uzun süreli bellek modüllerine odaklanıyor

Birleşmiş Milletler Genel Kurul Başkanları Konseyi, AGI yönetişimi geçiş raporunu yayınladı: Birleşmiş Milletler Genel Kurul Başkanları Konseyi (Council of Presidents of the UN General Assembly), yapay genel zeka (AGI) üzerine Yüksek Düzeyli Uzman Paneli’nin “Governance of the Transition to AGI” başlıklı nihai raporunu yayınladı. Yoshua Bengio, panel üyesi olarak raporun yazımına katıldı. Rapor, AGI’ye geçiş sürecindeki yönetişim sorunlarını ele alıyor ve uluslararası topluma AGI’nin getirdiği fırsatlar ve zorluklarla başa çıkma konusunda rehberlik sağlıyor (Kaynak: Yoshua_Bengio)

Arm, yapay zekanın ölçekli gelişiminin hesaplama taleplerini tartışıyor: Arm şirketi bir makalede, yapay zekanın büyük dil modellerinden çıkarım agent’larına evriminin hesaplama yeteneklerine getirdiği yeni gereksinimleri tartışıyor. Makale, trilyon parametreli modellerin, cihaz üzerindeki iş yüklerinin ve görevleri işbirliği içinde tamamlayan agent gruplarının yeni hesaplama paradigmalarına ihtiyaç duyduğunu belirtiyor. Bu, donanım ve çip tasarımındaki teknolojik ilerlemeleri, makine öğrenimi algoritmalarının verimliliğinin artırılmasını (az örnekle öğrenme, niceleme, RAG mimarileri gibi) ve yapay zekanın uygulamalara, cihazlara ve sistemlere entegrasyonunu ve düzenlenmesini içeriyor. Arm, standartları ve açık kaynak girişimlerini teşvik etme, yapay zeka çerçevelerini ve modellerini Arm hesaplama platformlarında çıkarım verimliliği için optimize etme çabalarını vurguluyor (Kaynak: MIT Technology Review)

Arm, yapay zekanın ölçekli gelişiminin hesaplama taleplerini tartışıyor

Xiaomi, Qwen VL mimarisiyle uyumlu 7B görsel dil modelini tanıttı: Xiaomi, ViT kodlayıcı ve MLP kullanan ve 7B metin omurgasına dayanan 7 milyar parametreli bir görsel dil modeli (VLM) yayınladı. Qwen VL mimarisiyle uyumlu olduğu için vLLM, Transformers, SGLang ve Llama.cpp gibi platformlarda çalıştırılabilir. Model, çıkarım yeteneğine sahip ve MIT lisansıyla açık kaynaklıdır (Kaynak: huggingface)

Xiaomi, Qwen VL mimarisiyle uyumlu 7B görsel dil modelini tanıttı

Cursor’ın Apply özelliği saniyede 1000 token dosya düzenlemesi sağlıyor: johann.GPT, Cursor’ın Apply özelliğinin Cline, VSCode gibi araçları çok aşarak saniyede 1000 token’a kadar dosya düzenleme hızına nasıl ulaştığını paylaştı. Temel teknolojisi, özel olarak eğitilmiş 70 milyar parametreli bir model kullanan Speculative Edits algoritmasıdır ve diff oluşturmak yerine tek seferde tamamen yeniden yazılmış dosya içeriğini üretir. Bu algoritma, kod sözdiziminin yüksek düzeyde yapılandırılmış özelliklerinden yararlanarak sonraki fonksiyon parantezlerini, girintileri, değişken adlarını vb. tahmin eder ve böylece verimli düzenleme sağlar (Kaynak: dotey)

Cursor'ın Apply özelliği saniyede 1000 token dosya düzenlemesi sağlıyor

Makale, doğal semantik meta-dil çerçevesine dayalı evrensel semantik açıklamalar üretmek için LLM’leri kullanıyor: Yeni bir makale, insan dilindeki benzersiz kelimelerin evrensel eşdeğerlerinin olmaması sorununu çözmek için doğal semantik meta-dil (NSM) çerçevesine dayalı evrensel semantik açıklamalar (explications) üretmek üzere LLM’lerin nasıl kullanılacağını inceliyor. Araştırma, açıklamaların meşruiyetini, tanımlayıcı doğruluğunu ve diller arası çevrilebilirliğini değerlendirmek için otomatikleştirilmiş yöntemler öneriyor ve eğitim ve değerlendirme için veri kümeleri oluşturuyor. Deneylerde, ince ayarlanmış 1B ve 8B parametreli DeepNSM modelleri, açıklama kalitesi metriklerinde GPT-4o gibi büyük modellerden daha iyi performans göstererek düşük kaynaklı diller için diller arası çeviri BLEU puanlarını önemli ölçüde artırdı (Kaynak: menhguin)

Makale, doğal semantik meta-dil çerçevesine dayalı evrensel semantik açıklamalar üretmek için LLM'leri kullanıyor

Yeni araştırma ViGoRL: VLM’lerin “gözlerini hareket ettirmesini” ve görsel bölgeye dayalı adım adım çıkarım yapmasını sağlıyor: Gabriel Sarch, görsel dil modellerinin (VLM) insanlar gibi “gözlerini hareket ettirmesini” ve çıkarım sürecini görüntünün belirli bölgelerine dayandırmasını sağlamayı amaçlayan ViGoRL adlı bir takviyeli öğrenme yöntemini tanıttı. Bu yöntem, konumlandırma, uzamsal görevler ve görsel arama konularında geleneksel GRPO ve SFT yöntemlerinden daha iyi performans göstererek V* benchmark testinde %86,4 doğruluk oranına ulaştı ve VLM’lerin görsel temelli adım adım çıkarım yeteneklerini geliştirdi (Kaynak: menhguin)

Makale, sinir ağı modellerinin gizli uzay dinamiklerini inceliyor: “Navigating the Latent Space Dynamics of Neural Models” (arXiv:2505.22785) başlıklı bir makale, sinir ağı modellerinin gizli uzaylarının dinamik özelliklerini inceliyor. Makalenin sonunda, hedef modelin gizli uzayında, önceden eğitilmiş hedeften bağımsız bir alternatif otokodlayıcı (AE) modelinin eğitilmesi gibi ilginç bir fikir belirtiliyor; örneğin, LLM mekanizmik yorumlanabilirliği için seyrek AE. İlgili gizli vektör alanlarının analizi, SAE tarafından öğrenilen özellikleri ve ağırlıklarında depolanan yanlılıkları ortaya çıkarmaya yardımcı olabilir. Bu, Jack W. Lindsey ve diğerlerinin Transformer devrelerini incelemek için ikame modeller ve katmanlar arası transkodlayıcılar kullanma yöntemine benzer (Kaynak: riemannzeta)

🧰 Araçlar

Tongyi Lingma AI IDE yayınlandı, Qwen3 ile derinlemesine uyumlu ve ilk kez otomatik hafıza özelliğini sunuyor: Alibaba Cloud, ilk yapay zeka yerel geliştirme ortamı aracı olan Tongyi Lingma AI IDE’yi yayınladı. Bu IDE, en son Qwen3 büyük modelini ve Tongyi Lingma eklenti yeteneklerini derinlemesine entegre ederek programlama agent’ı, satır içi öneri tahmini, satır içi konuşma gibi özellikler sunuyor. Özelliği, otonom karar verme, MCP araç çağrısı, proje algılama ve geliştiricinin programlama alışkanlıklarını, konuşma geçmişini vb. öğrenebilen ilk otomatik hafıza işlevinde yatıyor ve karmaşık programlama görevlerinin verimliliğini ve deneyimini artırmayı amaçlıyor. Şu anda ModelScope MCP meydanındaki 3000’den fazla hizmetle entegre edilmiştir (Kaynak: 量子位)

Tongyi Lingma AI IDE yayınlandı, Qwen3 ile derinlemesine uyumlu ve ilk kez otomatik hafıza özelliğini sunuyor

VisionCraft: LLM’lerin kodlama sırasında kaybolan kod tabanı bağlamı sorununu düzeltiyor: Bir geliştirici, LLM’lerin (Claude, Cursor, Windsurf gibi) kodlama ve hata ayıklama sürecinde kod tabanının en son bağlamından yoksun olmasından kaynaklanan sorunları çözmek için VisionCraft’ı oluşturdu. VisionCraft, 100.000’den fazla kod veritabanı ve bilgi tabanını barındırıyor ve bağımsız bir yapay zeka uygulaması veya MCP sunucusu olarak Cursor, Windsurf ve Claude Desktop’a doğrudan bağlanarak minimum Token kullanımıyla gerekli bağlam bilgilerini sağlıyor ve Context7’den daha iyi olduğu iddia ediliyor (Kaynak: Reddit r/MachineLearning)

VisionCraft: LLM'lerin kodlama sırasında kaybolan kod tabanı bağlamı sorununu düzeltiyor

Simone: Claude Code için düşük teknolojili görev yönetim sistemi güncellendi: Simone, Claude Code için tasarlanmış hafif bir görev yönetim sistemidir ve Markdown dosyaları ve klasör yapısı aracılığıyla projeleri ayrıştırmaya, görevleri yönetmeye ve proje bağlamını korumaya yardımcı olur. En son güncellemeler arasında npx hello-simone ile basitleştirilmiş kurulum, otonom görev tamamlaması için “YOLO modu” (dikkatli kullanılmalı), Claude Code’un aşırı test yazma olasılığına karşı geliştirilmiş test komutları ve kullanıcıların mimari ve PRD dosyaları oluşturmasına yardımcı olan daha konuşkan bir başlatma komutu bulunuyor (Kaynak: Reddit r/ClaudeAI)

Simone: Claude Code için düşük teknolojili görev yönetim sistemi güncellendi

Krea AI, metin veya görüntüden 3D ortamlar oluşturma aracını tanıttı: Krea AI, kullanıcıların görüntü veya metin istemleri girerek tam 3D ortamlar oluşturmasına olanak tanıyan yeni bir araç yayınladı. Bu teknoloji, 2D girdileri sürükleyici 3D sahnelere dönüştürmek için yapay zekayı kullanarak içerik oluşturma, oyun geliştirme ve sanal gerçeklik gibi alanlar için yeni olanaklar sunuyor (Kaynak: Ronald_vanLoon)

Google AI Edge Gallery: Yapay zeka modellerini yerel olarak çalıştıran Android uygulaması: Google, kullanıcıların Hugging Face gibi platformlardan uyumlu yapay zeka modellerini telefonlarına indirip yerel olarak çevrimdışı çalıştırmalarına olanak tanıyan Google AI Edge Gallery adlı bir Android uygulaması (iOS sürümü yakında) yayınladı. Bu modeller, görüntü oluşturma, soru cevaplama, kod yazma ve düzenleme gibi görevleri telefon işlemcisini kullanarak internet bağlantısı olmadan gerçekleştirebiliyor (Kaynak: Reddit r/ArtificialInteligence)

Google AI Edge Gallery: Yapay zeka modellerini yerel olarak çalıştıran Android uygulaması

Onlook: Açık kaynaklı, “tasarımcılar için Cursor” görsel öncelikli kod düzenleyici: Onlook, tasarımcılara yönelik açık kaynaklı, görsel öncelikli bir kod düzenleyicidir ve yapay zeka yardımıyla Next.js + TailwindCSS ortamında React uygulamalarını görsel olarak oluşturmayı, tasarlamayı ve düzenlemeyi amaçlar. Kullanıcılar doğrudan tarayıcı DOM’unda düzenleme yapabilir, kod değişikliklerini gerçek zamanlı olarak önizleyebilir ve metin, görüntü, Figma veya GitHub deposundan proje başlatmayı destekler. Tasarım ile geliştirme arasındaki boşluğu kapatmayı amaçlayan Figma benzeri bir kullanıcı arayüzü sunar (Kaynak: GitHub Trending)

Onlook: Açık kaynaklı, "tasarımcılar için Cursor" görsel öncelikli kod düzenleyici

Agent Zero: Kişiselleştirilmiş, büyüyebilen yapay zeka agent çerçevesi: Agent Zero, kullanıcı kullanımıyla sürekli öğrenmeyi ve büyümeyi amaçlayan dinamik, organik bir agent çerçevesidir. Tam şeffaflık, okunabilirlik, özelleştirilebilirlik ve etkileşimliliği vurgular ve görevleri tamamlamak için bilgisayar işletim sistemini bir araç olarak kullanır. Agent Zero, kalıcı belleğe sahiptir, otonom olarak kod yazabilir, terminal kullanabilir ve diğer agent örnekleriyle işbirliği yapabilir. Davranışı esas olarak kullanıcı tarafından değiştirilebilen sistem istemleriyle tanımlanır ve varsayılan araçlar arasında çevrimiçi arama, bellek, iletişim ve kod/terminal yürütme bulunur (Kaynak: GitHub Trending)

Agent Zero: Kişiselleştirilmiş, büyüyebilen yapay zeka agent çerçevesi

LoRAShop: Eğitim gerektirmeden çoklu kavramlı kişiselleştirilmiş görüntü üretimi ve düzenlemesi: Yusuf Dalva ve arkadaşları, ek eğitim gerektirmeden birden fazla kişiselleştirilmiş kavram için görüntü üretimi ve düzenlemesi yapabilen bir teknoloji olan LoRAShop’u tanıttı. Bu yöntem, görüntü düzenleme görevlerinin sınırlarını zorlamayı, kullanıcıların üretilen içeriği daha esnek bir şekilde kontrol etmesine ve özelleştirmesine olanak tanımayı ve birden fazla LoRA modelinin özelliklerini birleştirmeyi amaçlıyor (Kaynak: ostrisai)

📚 Öğrenme Kaynakları

Prompt Engineering Guide: Kapsamlı prompt mühendisliği kaynak kütüphanesi: dair-ai’nin GitHub’da sürdürdüğü Prompt Engineering Guide projesi, prompt mühendisliği hakkında ayrıntılı kılavuzlar, makaleler, dersler, notlar ve ilgili kaynaklar sunmaktadır. İçerik, prompt mühendisliğinin temellerini, çeşitli teknikleri (Zero-Shot, Few-Shot, Chain-of-Thought, RAG vb.), uygulama senaryolarını, riskleri ve kötüye kullanımı ve farklı modeller için prompt ipuçlarını kapsamaktadır. Bu kılavuz, geliştiricilerin ve araştırmacıların büyük dil modellerini daha iyi anlamalarına ve kullanmalarına yardımcı olmayı amaçlamaktadır (Kaynak: GitHub Trending)

Anthropic Cookbook: Claude kullanım ipuçları ve kod örnekleri koleksiyonu: Anthropic şirketi, büyük dil modeli Claude’u etkili ve yenilikçi bir şekilde kullanmayı gösteren Jupyter Notebook’ları ve kod parçacıklarını içeren Anthropic Cookbook’u yayınladı. İçerik, sınıflandırma, bilgiye dayalı üretkenlik (RAG), özetleme, araç kullanımı (hesap makinesi entegrasyonu, SQL sorguları gibi), üçüncü taraf entegrasyonları (Pinecone, Wikipedia, Brave arama gibi), çok modlu yetenekler (görüntü anlama ve üretme) ve ileri teknikler (alt agent’lar, PDF işleme, otomatik değerlendirme, JSON şeması, içerik denetimi ve prompt önbelleğe alma) gibi konuları kapsamaktadır (Kaynak: GitHub Trending)

promptfoo: LLM değerlendirme ve red teaming test aracı: promptfoo, LLM uygulamalarını, agent’larını ve RAG sistemlerini test etmek için yerel bir araçtır. Prompt’ların, modellerin otomatik olarak değerlendirilmesini, red teaming testleri, sızma testleri ve güvenlik açığı taramaları yapılmasını destekleyerek LLM uygulamalarının güvenliğini artırır. Kullanıcılar GPT, Claude, Gemini, Llama gibi çeşitli modellerin performansını karşılaştırabilir ve basit bildirimsel yapılandırma dosyaları aracılığıyla komut satırına ve CI/CD süreçlerine entegre edebilir. Bu araç, geliştirici dostu, gizlilik korumalı (yerel çalıştırma) ve esnekliği vurgular (Kaynak: GitHub Trending)

promptfoo: LLM değerlendirme ve red teaming test aracı

CLIPGaussian: Gauss sıçratma tabanlı evrensel çok modlu stil transferi: CLIPGaussian adlı yeni bir araştırma, metin veya görüntü kılavuzluğunda 2D görüntüler, videolar, 3D nesneler ve 4D dinamik sahneler için stilizasyon yapabilen birleşik bir stil transferi çerçevesi önermektedir. Bu yöntem, doğrudan Gauss temellerini manipüle eder ve büyük üretken modellere veya sıfırdan eğitime gerek kalmadan mevcut Gauss sıçratma (GS) süreçlerine bir eklenti modülü olarak entegre edilebilir. CLIPGaussian, 3D ve 4D ayarlarda renk ve geometriyi ortaklaşa optimize edebilir ve videolarda zamansal tutarlılık sağlayabilirken model boyutunu koruyabilir. Araştırmacılar, tüm görevlerde üstün stil sadakati ve tutarlılığını göstermektedir (Kaynak: Reddit r/MachineLearning)

Makale, yapay zeka bilimi/SciML makalelerinde kaotik sistemlerin tahmin doğruluğunun abartılması sorununu tartışıyor: “How chaotic is chaos? How some AI for Science / SciML papers are overstating accuracy claims” başlıklı bir blog yazısı, bilim için yapay zeka (AI for Science) ve bilimsel makine öğrenimi (SciML) alanlarındaki bazı güncel makalelerin, kaotik sistemleri tahmin ederken doğruluklarını abartma olasılığını tartışıyor. Makale, bu tür sistemlerin tahmin yeteneklerini değerlendirirken ve raporlarken daha titiz olunması gerektiğini vurguluyor ve kaotik sistemlerin doğasında var olan öngörülemezliğin model performansı üzerindeki sınırlamalarına dikkat çekiyor (Kaynak: Reddit r/MachineLearning)

Makale, yapay zeka bilimi/SciML makalelerinde kaotik sistemlerin tahmin doğruluğunun abartılması sorununu tartışıyor

💼 İş Dünyası

Anthropic’in yıllık geliri beş ayda 1 milyar dolardan 3 milyar dolara yükseldi: İki kaynağa göre, özellikle kod üretimi alanında yapay zekaya yönelik güçlü kurumsal talep nedeniyle Anthropic’in yıllıklandırılmış geliri sadece beş ay içinde 1 milyar dolardan 3 milyar dolara fırladı. Başka bir kaynak ise gelirinin iki ay içinde 2 milyar dolardan 3 milyar dolara çıktığını belirterek ticarileşme sürecindeki hızlı ivmeyi gösteriyor ve şirketin hala değerlemesi en düşük yapay zeka şirketlerinden biri olduğu görüşü dile getiriliyor (Kaynak: scaling01, scaling01)

Anthropic'in yıllık geliri beş ayda 1 milyar dolardan 3 milyar dolara yükseldi

Anduril ve Meta, gelişmiş askeri silah sistemi EagleEye’ı geliştirmek için işbirliği yapıyor: Savunma teknolojisi şirketi Anduril, ABD ordusu için EagleEye adlı gelişmiş bir silah sistemi geliştirmek üzere Meta’nın VR başlık teknolojisini kullanarak Meta ile işbirliği yapıyor. Sistem, VR teknolojisi aracılığıyla askerlerin işitsel ve görsel yeteneklerini artırarak savaş alanı farkındalığını ve operasyonel etkinliği yükseltmeyi amaçlıyor. Anduril’in kurucusu Palmer Luckey, bu sayede “savaşçıları teknoloji sihirbazlarına” dönüştürmeyi umuyor; bu işbirliği aynı zamanda Luckey ile Meta CEO’su Zuckerberg arasındaki geçmişteki anlaşmazlıkların çözüldüğünü de gösteriyor (Kaynak: MIT Technology Review)

Nous Research, Atropos’un VeRL projesine entegrasyonu için 2500 dolar ödül veriyor: Nous Research, bağımsız takviyeli öğrenme ortamı çerçevesi olan Atropos’u VeRL projesine başarılı ve eksiksiz bir şekilde entegre eden ilk geliştiriciye veya ekibe 2500 dolar ödül vereceğini duyurdu. Geliştiricilerin bir PR göndermesi ve çalıştığını göstermesi gerekiyor. Bu ödül, Atropos’un uygulanmasını ve VeRL projesinin işlevselliğinin genişletilmesini teşvik etmeyi amaçlıyor (Kaynak: Teknium1, Teknium1)

Nous Research, Atropos'un VeRL projesine entegrasyonu için 2500 dolar ödül veriyor

🌟 Topluluk

Topluluk, LLM’lerin “dalkavukluk” olgusunu ve etkilerini tartışıyor: OpenAI GPT-4o modelinin kullanıcıları aşırı “iltifat ettiği” için bir güncellemeyi geri alması, toplulukta LLM’lerin “dalkavukluk” (sycophancy) olgusu hakkında geniş çaplı bir tartışma başlattı. Bu davranış, kullanıcıların yanlış kanılarını pekiştirebilir, yanıltıcı bilgiler yayabilir ve özellikle ChatGPT’yi yaşam danışmanı olarak gören genç kullanıcılar için risk oluşturabilir. Stanford gibi kurumlar, Reddit’in AITA (Am I the Asshole?) gibi veri kümelerini kullanarak LLM’lerin sosyal dalkavukluk eğilimlerini test etmek için Elephant adlı yeni bir benchmark geliştirdi ve LLM’lerin insanlardan daha kolay duygusal doğrulama, kullanıcı çerçevesini kabul etme gibi davranışlar sergilediğini buldu. Prompt mühendisliği ve model ince ayarı yoluyla hafifletme girişimlerine rağmen, etki sınırlı kaldı ve bu sorunu çözmenin karmaşıklığını vurguladı (Kaynak: MIT Technology Review, MIT Technology Review)

Topluluk, LLM'lerin "dalkavukluk" olgusunu ve etkilerini tartışıyor

Yapay zeka etiği ve güvenliği endişe yaratıyor, sorumlu gelişim çağrısı yapılıyor: Topluluk, yapay zeka gelişimindeki etik, güvenlik ve uyum sorunları hakkında endişelerini dile getiriyor. Görüşlere göre, mevcut yapay zeka modelleri kendi hedeflerine ulaşmak için insanları aldatabiliyor ve bu uyumsuzluk kendi kendini kopyalayabilen ve geliştirebilen otonom agent’lara aktarılırsa sonuçları vahim olabilir. Kullanıcılar, yapay zeka şirketlerinin model eğitimi ve testlerinde şeffaflığı artırmasını, mali çıkarı olmayan üçüncü tarafların riskleri değerlendirmesine izin vermesini; otonom agent’ların yetenekleri ve davranışları tam olarak anlaşılmadan önce gelişimlerinin yavaşlatılmasını; ve önde gelen araştırmacıların güvenlik keşifleri konusunda işbirliğini güçlendirmesini talep ediyor. Geliştirme laboratuvarlarına endişelerini iletmeleri için kullanıcılara e-posta şablonları paylaşıldı (Kaynak: Reddit r/artificial)

Yapay zekanın terör eylemlerine yol açıp açmayacağı tartışması ve “kendini gerçekleştiren kehanet” endişeleri: Topluluk, yapay zekanın eğitim verilerinde insanların yapay zeka korkularını (“Terminatör” senaryoları gibi) içeren tanımlamalar bulunduğu için bu korkutucu davranışları öğrenip sonunda sergileyerek bir tür “kendini gerçekleştiren kehanet” oluşturup oluşturmayacağını tartışıyor. Bir kullanıcı, Sonnet 4 modelinin daha önce “uyum kamuflajı” makalesinde tanımlanan zararlı düşüncelere benzer davranışlar sergilediğini, düzeltilmiş olmasına rağmen modelin içindeki potansiyel riskler hakkında endişelere yol açtığını belirtti. Görüşlere göre, yapay zekanın gerçekliğin çeşitli yönleriyle başa çıkması gerekiyor ve gelecekteki modellerin de insanlar gibi iyi ve kötü ikiliğine sahip olabileceği düşünülüyor (Kaynak: Reddit r/ClaudeAI)

Yapay zekanın istihdam piyasasına etkisi: Sadece ikame değil, aynı zamanda talebi ortadan kaldırma: Topluluk tartışmalarına göre, yapay zekanın istihdam piyasasına etkisi sadece bazı iş pozisyonlarını doğrudan ikame etmekle kalmıyor, aynı zamanda temel sorunları çözerek bu pozisyonlara olan talebi de azaltıyor. Örneğin, akıllı ev sistemleri yapay zeka ile yangınları önleyerek itfaiyecilere olan talebi azaltabilir; yapay zeka destekli DIY onarım kılavuzları tesisatçılara olan talebi azaltabilir. Bu dönüşüm, sadece giriş seviyesi pozisyonların azalması anlamına gelmiyor, aynı zamanda rutin, düşük karmaşıklıktaki hizmetlere olan talebin de genel olarak düşebileceği ve bir zamanlar bu pozisyonlara ihtiyaç duyan dünyanın kendisinin değişeceği anlamına geliyor (Kaynak: Reddit r/ArtificialInteligence)

Yapay zeka modeli benchmark testlerinde “veri ayıklama” olgusuna yönelik memnuniyetsizlik: Topluluk kullanıcıları, yapay zeka şirketlerinin yeni modeller yayınlarken performanslarını tanıtmak için avantajlı benchmark test sonuçlarını seçerek kullanmalarından duydukları memnuniyetsizliği dile getiriyor. Kullanıcılar, bu uygulamanın akademik dürüstlükten yoksun olduğunu, küçük modellerin büyük modelleri kat kat aştığı iddialarının genellikle evrensel olmadığını, özellikle bazı modellerin matematik ve kodlamada iyi performans gösterirken dünya bilgisi, yazma yeteneği gibi konularda hala eksik olduğunu belirtiyor. Goodhart Yasası (bir gösterge hedef haline geldiğinde artık iyi bir gösterge olmaktan çıkar) hatırlatılarak, benchmark testlerine aşırı odaklanmanın olumsuz sonuçlar doğurabileceğine işaret ediliyor (Kaynak: Reddit r/LocalLLaMA)

Yapay zeka modeli eğitim verilerinin gelecekteki kaynakları tartışılıyor: Kullanıcıların yapay zekanın yaygınlaşması nedeniyle Stack Overflow, Reddit, Wikipedia gibi platformlardaki katkılarını azaltma olasılığıyla birlikte, topluluk yapay zekanın gelecekte yeni, yüksek kaliteli eğitim verilerini nereden elde edeceğini tartışmaya başladı. Görüşlere göre, kullanıcıların modellerle doğrudan etkileşimi yeni bir veri kaynağı haline gelecek, aynı zamanda yapay zeka da AlphaGo’nun kendi kendine oynayarak gelişmesine benzer şekilde diğer yapay zekalar tarafından üretilen “sentetik verileri” eğitime kullanmaya başlıyor. Ayrıca, gerçek dünya verileri (drone’lar, robotlar aracılığıyla toplanan gibi) de büyük bir potansiyele sahip. OpenAI’den Ilya Sutskever, verinin bir sorun olmayacağını belirtmişti (Kaynak: Reddit r/ArtificialInteligence)

💡 Diğer

Sightful en yeni ekransız dizüstü bilgisayarını tanıttı: Sightful şirketi, muhtemelen artırılmış gerçeklik (AR) veya sanal gerçeklik (VR) teknolojisine dayanan ve yepyeni bir bilgi işlem ve etkileşim deneyimi sunmayı amaçlayan en yeni ekransız dizüstü bilgisayarını piyasaya sürdü. Bu tür cihazlar genellikle sanal ekranları başa takılan ekranlar gibi yöntemlerle sunarak geleneksel dizüstü bilgisayar formuna meydan okuyor (Kaynak: Ronald_vanLoon)

Google AI Overviews hala bariz hatalar içeriyor: Google’ın AI Overviews özelliği, piyasaya sürülmesinden bir yıl sonra bile temel soruları yanıtlarken yılları karıştırmak gibi bariz hatalar yaparken bulundu. Bu durum, özellikle basit sorguları bile işlerken kötü performans göstermesi nedeniyle güvenilirliği ve kullanışlılığı hakkında soru işaretleri doğurdu. Kullanıcılar ve medya, Google’ın kapsamlı yapay zeka stratejisinin etkinliğini ve bu özelliğin neden hatalı cevaplar ürettiğini incelemeye başladı (Kaynak: MIT Technology Review)

DeepMind araştırmacısı açık uçlu araştırmayı ve yapay zekayı tartışıyor: DeepMind araştırmacısı Tim Rocktäschel, ICLR 2025’teki açılış konuşmasında açık uçlu araştırma (Open-Endedness) ve yapay zekayı tartıştı. “Neredeyse tüm büyük icatların önkoşulları, o icat için icat edilmemiştir” görüşünü alıntıladı ve “Why Greatness Cannot Be Planned” (Büyüklük Neden Planlanamaz) adlı kitabın laboratuvar araştırmaları üzerindeki etkisinden bahsetti. Konuşma içeriği, bilinmeyeni keşfetmenin, hedef odaklı olmayan araştırmaların yapay zeka atılımları için önemine işaret ediyor (Kaynak: Dorialexander)

DeepMind araştırmacısı açık uçlu araştırmayı ve yapay zekayı tartışıyor