Yapay Zeka Bülteni - 2026-01-09(Sabah baskısı)

Anahtar Kelimeler：Yapay Zeka Modeli, Otonom Sürüş, Çok Modlu, GLM-4.7, Alpamayo, Qwen3-VL

🔥 Odak Noktası

Zhipu AI resmi olarak HKEX’te listelendi, büyük model IPO dönemini başlattı : 8 Ocak 2026’da Zhipu AI, Hong Kong Borsası’nda (HKEX) resmen kote olarak dünyanın ilk büyük model (Large Model) hissesi oldu; MiniMax onu yakından takip ediyor. Tang Jie, şirket içi mektubunda amiral gemisi model GLM-4.7’nin piyasaya sürülmesinden sonra MaaS yıllık tekrarlayan gelirinin (ARR) 10 ayda 25 kat artarak 500 milyon RMB’yi aştığını açıkladı. Bu olay, Çin’in büyük modellerinin “teknoloji takibinden” “ticari kapalı döngüye” geçişini simgeliyor. IPO, yerli modellerin küresel pazara açılması için bir kanal açacak ve daha adil bir uluslararası değer değerlendirmesi sağlayacak (Kaynak: Zai_org)

Stanford SleepFM’i yayınladı: Bir gecelik uyku ile yüzden fazla sağlık riskini tahmin ediyor : Stanford University araştırmacıları, 585.000 saatten fazla uyku verisiyle eğitilen çok modlu AI modeli SleepFM’i tanıttı. Model; beyin dalgalarını, kalp atış hızını ve solunum hızını analiz ederek tek bir gecelik kayıttan demans, kalp hastalığı ve bazı kanser türleri dahil 130’dan fazla hastalık riskini tahmin edebiliyor. Bu atılım, AI’nın koruyucu tıp alanındaki devasa potansiyelini göstererek uyku takip cihazlarını güçlü teşhis araçlarına dönüştürüyor (Kaynak: Reddit)

NVIDIA Alpamayo’yu açık kaynak olarak sundu: Akıl yürütme yeteneğine sahip ilk otonom sürüş modeli : NVIDIA, Chain of Thought (CoT) akıl yürütmesine dayalı ilk otonom sürüş modeli olan Alpamayo’yu açık kaynak yaptı. Sadece tepki veren geleneksel sistemlerin aksine Alpamayo, karmaşık veya nadir senaryolarda insan sürücüler gibi mantıksal düşünme yeteneğine sahip. Vera Rubin mimarisinin “AI Factory”si ile birleşen NVIDIA, AI’yı saf dijital alandan simülasyon araçlarını ve edge computing modüllerini kapsayan fiziksel AI’ya taşıyarak endüstriyel düzeyde otonom sürüş standartlarını yeniden şekillendiriyor (Kaynak: TheTuringPost)

LMArena 150 milyon dolar yatırım aldı, AI değerlendirmesi temel altyapı haline geliyor : Tanınmış AI model arenası LMArena, 1,7 milyar dolar değerleme ile 150 milyon dolarlık finansman turunu tamamladı. Bu devasa yatırım, modellerin hızla çoğaldığı günümüzde objektif ve güvenilir değerlendirme sistemlerinin artık yardımcı bir araç değil, AI ekosisteminin temel altyapısı olduğunu gösteriyor. Değerlendirme yeteneklerinin sermayeleşmesi, sektörün “körlemesine genişlemeden” “kalite odaklılığa” geçtiğini işaret ederken, toplulukta yüksek değerleme üzerine geniş tartışmalara yol açtı (Kaynak: nearcyan)

🎯 Gelişmeler

AI21 Labs Jamba 2 serisini yayınladı: Hibrit SSM-Transformer mimarisi kurumsal düzeye odaklanıyor : AI21, Jamba2 3B ve Jamba2 Mini’yi (52B toplam parametre, 12B aktif) tanıttı. Hibrit SSM-Transformer mimarisini kullanan bu seri, 256K ultra uzun context penceresine sahip ve IFEval gibi talimat takip benchmarklarında üstün performans sergiliyor. Temel avantajı, yüksek throughput ve bellek verimliliği olup, özellikle uzun doküman işleme ve yüksek güvenilirlik gerektiren kurumsal Agent iş akışları için uygundur (Kaynak: Reddit)

Alibaba, Qwen3-VL çok modlu erişim modelini açık kaynak yaptı: Çok modlu anlamada SOTA’yı ilerletiyor : Alibaba, metin, görüntü ve video gibi karmaşık girdi modlarını destekleyen Qwen3-VL-Embedding ve Reranker modellerini yayınladı. Model; çok modlu RAG, görsel soru-cevap ve diller arası aramada mükemmel performans göstererek 30’dan fazla dili destekliyor. Bu iki aşamalı erişim mimarisi (vektör üretimi + hassas puanlama), karmaşık görsel içeriklerin erişim doğruluğunu önemli ölçüde artırarak çok modlu AI uygulamaları için güçlü bir temel destek sağlıyor (Kaynak: Alibaba_Qwen)

NVIDIA Nemotron Speech ASR’yi yayınladı: Ultra düşük gecikmeli ses tanıma artık açık kaynak : NVIDIA, sesli Agent’lar için özel olarak tasarlanmış Nemotron Speech ASR modelini yayınladı. Model, 24ms transkripsiyon tamamlama süresi ve 500ms’nin altında uçtan uca sesli etkileşim gecikmesi sağlıyor. Ağırlıklar, kodlar ve eğitim verileriyle birlikte tamamen açık kaynak olan bu model için Jensen Huang, CES’te açık kaynak modellerin bu yıl kapalı kaynak modelleri tamamen yakalayacağını vurguladı (Kaynak: NerdyRodent)

DeepSeek R1 makalesini güncelledi: 22 sayfadan 86 sayfaya büyük genişleme : DeepSeek, dönüm noktası niteliğindeki R1 model makalesini güncelleyerek eğitim detayları ve mimari tasarım hakkında kapsamlı bilgiler ekledi. Bazı içerikler daha önce Nature makalesinde açıklanmış olsa da, bu güncelleme DeepSeek’in açık kaynak topluluğundaki teknik liderliğini pekiştiriyor. Topluluk, yazar listesinin istikrarına ve MLA mimarisi üzerindeki sürekli optimizasyon deneyimine dikkat çekti (Kaynak: teortaxesTex)

Google, Gmail’i Gemini 3 dönemine taşıyor: Proaktif bir gelen kutusu asistanı oluşturuluyor : Google, Gmail’in Gemini 3 ile tam entegrasyonunu duyurarak onu basit bir e-posta aracından proaktif bir gelen kutusu asistanına dönüştürdü. Yeni özellikler arasında günlük programların akıllı yönetimi, karmaşık e-posta zincirlerinin otomatik özetlenmesi ve bağlama dayalı proaktif hatırlatıcılar yer alıyor. Bu, büyük modellerin “diyalog kutusu” formundan çıkıp üretkenlik iş akışlarına derinlemesine gömüldüğünü simgeliyor (Kaynak: GoogleDeepMind)

🧰 Araçlar

VideoRAG/Vimo: Ultra uzun video diyaloglarını destekleyen açık kaynak masaüstü uygulaması : Hong Kong University HKUDS ekibi, yüzlerce saatlik videolarla diyalog kurmayı destekleyen VideoRAG ve masaüstü sürümü Vimo’yu yayınladı. Araç, grafik tabanlı bilgi indeksi ve hiyerarşik context kodlaması kullanarak video sahnelerini hassas bir şekilde bulup soruları yanıtlıyor. Tek bir RTX 3090 üzerinde çalışabilen bu araç, geleneksel çok modlu modellerin uzun videolarda yaşadığı VRAM baskısı ve anlama kopukluğu sorunlarını çözüyor (Kaynak: GitHub)

memU: AI Agent’lar için hiyerarşik bellek altyapısı : NevaMind-AI, LLM ve Agent’lar için tasarlanmış bir bellek sistemi olan memU’yu açık kaynak yaptı. Bir dosya sistemini taklit ederek ham verileri, ayrık bellek öğelerini ve toplu kategorileri üç katmanlı bir yapıda organize eden sistem, RAG vektör erişimini ve LLM anlamsal erişimini destekliyor. Sistem, diyaloglardaki tercihleri, becerileri ve gerçekleri otomatik olarak çıkararak belleğin kendi kendine evrilmesini sağlıyor (Kaynak: GitHub)

Maid: AI modellerini telefonda çevrimdışı çalıştıran açık kaynak uygulama : Maid, LLM’leri mobil cihazlarda yerel olarak çalıştırmayı destekleyen, özellikle internet kesintileri veya yüksek gizlilik gereksinimleri için uygun bir açık kaynak uygulamadır. Telefon tarafındaki model dağıtım sürecini basitleştirerek kullanıcıların farklı boyutlardaki modelleri doğrudan indirip diyalog kurmasına olanak tanır (Kaynak: Reddit)

Claude Code ve Replit derin entegrasyonu: Bulut tabanlı Agent programlamada yeni paradigma : Geliştiriciler, Claude Code ve Replit kombinasyonunun çevre yapılandırma sorunlarını çözmedeki avantajlarını paylaştı. Replit içinde çalışan Claude Code aracılığıyla, telefondan bile birden fazla Agent’ı paralel olarak kontrol ederek geliştirme yapmak mümkün hale geliyor. Bu “üret ve yayına al” modeli, yazılım teslim mantığını değiştirerek profesyonel olmayan geliştiricilerin bile hızlıca karmaşık uygulamalar oluşturmasını sağlıyor (Kaynak: amasad)

📚 Eğitim & Araştırma

MAGMA: Çoklu grafik yapısına dayalı Agent uzun vadeli bellek mimarisi : Geleneksel RAG’ın uzun vadeli akıl yürütmedeki bilgi karmaşası sorununa yönelik olarak MAGMA mimarisi önerildi. Belleği anlamsal, zamansal, nedensel ve varlık tabanlı dört ortogonal grafikte saklayan sistem, strateji rehberliğinde grafik dolaşımı ile erişim sağlıyor. Bu yöntem, bellek gösterimini erişim mantığından ayırarak Agent’ın karmaşık nedensellik ilişkilerini işleme doğruluğunu artırıyor (Kaynak: dair_ai)

Agentic Rubrics: Kod çalıştırmadan SWE Agent doğrulama yöntemi : Doğrulama, pekiştirmeli öğrenmenin anahtarıdır. Araştırmacılar, uzman Agent’ların etkileşim yoluyla kod tabanına özgü kontrol listeleri oluşturmasını ve aday yamaları doğrudan puanlamasını sağlayan “Agentic Rubrics” yöntemini önerdi. SWE-Bench testlerinde bu yöntem, karmaşık ortam kurulumuna gerek duymadan doğrulama verimliliğini ve doğruluğunu önemli ölçüde artırdı (Kaynak: arXiv)

Klear: Ses ve video birleşik üretimi için tekil mimari : Ses-video senkronizasyonu ve dudak uyumu sorunlarına yönelik olarak Klear, tek kule tasarımı ve birleşik DiT bloklarını tanıttı. Büyük ölçekli ve yoğun etiketli ses-video veri setleriyle eğitilen Klear, anlamsal tutarlılığı korurken Google Veo 3 ile kıyaslanabilir yüksek üretim kalitesine ulaştı (Kaynak: arXiv)

Entropi Uyarlamalı İnce Ayar (EAFT): SFT’deki katastrofik unutmayı çözmek : Makale, denetimli ince ayarın (SFT) genellikle modeli dış denetime zorlaması nedeniyle “güven çatışmasına” yol açtığını belirtiyor. EAFT, token düzeyindeki entropiyi bir kapı mekanizması olarak kullanarak epistemik belirsizlik ile bilgi çatışmasını ayırıyor. Bu yöntem, genel yeteneklerin gerilemesini etkili bir şekilde hafifletirken alt görev performansını koruyor (Kaynak: arXiv)

Atlas: Alanlar arası karmaşık akıl yürütme için heterojen model ve araç orkestrasyonu : LLM ve araç çeşitliliği arttıkça, en iyi kombinasyonu seçmek zorlaşıyor. Atlas, kümeleme tabanlı eğitim gerektirmeyen yönlendirme ve pekiştirmeli öğrenme tabanlı çok adımlı yönlendirme içeren çift yollu bir çerçeve önerdi. Bu çerçeve 15 benchmark testinde GPT-4o’yu geride bıraktı (Kaynak: arXiv)

💼 İş Dünyası

Manus, Meta tarafından satın alındı; ARR 8 ayda 125 milyon doları aştı : Görev icra eden Agent girişimi Manus, Meta tarafından 2 milyar dolara satın alınmadan hemen önce ARR’sinin 125 milyon dolara ulaştığını açıkladı. Ürünün yayına girmesinden sadece 8 ay sonra bu rakama ulaşılması, AI ticari mantığının “yetenek”ten “sonuç” ve “görev teslimi”ne kaydığını gösteriyor (Kaynak: 36氪)

Boltz 28 milyon dolar tohum yatırım aldı ve Pfizer ile iş birliği yaptı : Biyoteknoloji AI girişimi Boltz, Boltz PBC’nin kurulduğunu ve 28 milyon dolar yatırım aldığını duyururken Boltz Lab platformunu tanıttı. Platform, özel küçük molekül ve protein tasarım Agent’larını içeriyor ve ilaç devi Pfizer ile çok yıllı bir iş birliği anlaşması imzaladı (Kaynak: sarahcat21)

Çin’in bilgi işlem altyapısı “10.000P Dönemi”ne giriyor : Çin’deki akıllı bilgi işlem merkezi inşaatları hızla devam ediyor ve operatörler ana güç konumunda. 2025 yılında 100 milyon RMB üzerindeki ihale sayısı 222’yi aşarken, 10.000 kartlı kümeler standart hale geldi. Trendler, çıkarım (inference) gücü talebinin hızla arttığını ve sıvı soğutma teknolojisinin zorunlu hale geldiğini gösteriyor (Kaynak: 36氪)

🌟 Topluluk

Tailwind’in %75 oranında işten çıkarma yapması tartışma yarattı: AI, dokümantasyon trafiğini ve geliri düşürdü : Popüler CSS çerçevesi Tailwind, AI Agent’ların dokümantasyonunu yoğun şekilde taraması nedeniyle web sitesi trafiğinde %40 düşüş yaşadı ve ücretli ürün gelirleri azaldığı için işten çıkarma yapmak zorunda kaldı. Bu durum, AI’nın açık kaynak ekosistemine “parazit” etkisi üzerine derin endişeler uyandırdı (Kaynak: aiamblichus)

1 milyon token context bir tuzak mı? Topluluk “Lost in the Middle” etkisini tartışıyor : Geliştirici testleri, modellerin milyonluk context desteği sunmasına rağmen, 100.000 üzerindeki verilerde orta kısımdaki bilgileri geri çağırma oranının önemli ölçüde düştüğünü gösterdi. Topluluk, sadece uzun pencere peşinde koşmak yerine veri temizliği ve erişim stratejilerinin daha önemli olduğunu vurguluyor (Kaynak: Reddit)

Vibe Coding yeni bir geliştirme trendi oluyor: Kod yazmaktan “hissi ayarlamaya” : Topluluk, doğal dil ve Agent’lar kullanarak yapılan deterministik olmayan geliştirme süreci olan “Vibe Coding”i tartışıyor. Destekleyenler bunun bariyerleri düşürdüğünü savunurken, karşı çıkanlar bakımı yapılamayan “kod çöplüğü” oluşmasından endişe ediyor (Kaynak: dotey)

AI arkadaşlığının sınırları: Duygusal değer dış kaynak kullanımı etik endişelere yol açıyor : Arkadaşlık odaklı AI pazarı 100 milyar barajını aşarken, toplum potansiyel riskleri incelemeye başladı. AI tarafından sunulan “düşük çatışmalı, yüksek kontrollü” etkileşimlerin, insanların gerçek ilişkileri yönetme yeteneğini zayıflatabileceği konusunda uzmanlar uyarıda bulunuyor (Kaynak: 36氪)

💡 Diğer

Çinli çiftçiler yaban domuzlarıyla mücadele için AESA radar kullanıyor : Faz dizili radar teknolojisinin Çin’de sivil kullanıma uygun maliyetlere düşmesiyle, çiftçiler yaban domuzu istilasını tespit etmek için drone’larla birlikte AESA radarları kullanmaya başladı. Bu vaka, yüksek teknolojili askeri araçların sivil sorunları çözmedeki ilginç kullanımını gösteriyor (Kaynak: teortaxesTex)

Cerebras “Çikolata” çipinin fiziksel görüntüsü ortaya çıktı: İnanılmaz kalınlık : Geliştiriciler, Cerebras’ın wafer düzeyindeki AI çipinin fiziksel fotoğraflarını paylaştı. Dünyanın en büyük tekil çipi olan bu donanım, ekstrem performans arayışındaki fiziksel sınırların keşfini temsil ediyor (Kaynak: dylan522p)

Debian Veri Koruma ekibi topluca istifa etti, GDPR uyumu zorlaşıyor : 7 yıl önce kurulan Debian veri koruma ekibi, sınırlı kaynaklar nedeniyle topluca görevden ayrıldı. Bu durum, açık kaynak topluluklarının GDPR gibi katı gizlilik düzenlemeleriyle başa çıkmadaki kırılganlığını ortaya koyuyor (Kaynak: 36氪)

🔥 Odak Noktası

🎯 Gelişmeler

🧰 Araçlar

📚 Eğitim & Araştırma

💼 İş Dünyası

🌟 Topluluk

💡 Diğer

İlgili Etiketler

Related Posts

Yapay Zeka Bülteni – 2026-07-21

Yapay Zeka Bülteni – 2026-07-20

Yapay Zeka Bülteni – 2026-07-19