Yapay Zeka Bülteni – 2025-12-26(Akşam baskısı)

Anahtar Kelimeler:Büyük Dil Modelleri, AI Tekboynuz, OpenAI, NVIDIA, Meta, AI Çıkarım, AI Hesaplama Gücü, AI Müzik, GLM-4.7 Modeli, GPT-5.2-Codex-XMas, Groq LPU Mimarisi, Self-play SWE-RL, Nemotron 3 Serisi

🔥 Odak Noktası

Zhipu ve MiniMax “Küresel Büyük Modelin İlk Hissesi” Olmak İçin Yarışıyor: Beijing Zhipu AI ve MiniMax, Hong Kong Borsası (HKEX) duruşmalarını art arda geçerek izahnamelerini açıkladı; bu durum, Çinli AI unicorn’larının sermayeleşme sürecini başlattığının bir işareti. Zhipu’nun 2024 geliri, %130’u aşan bileşik büyüme oranıyla 312 milyon Yuan’a ulaştı, ancak bilgi işlem maliyetlerindeki artış nedeniyle 2025’in ilk yarısındaki zararı 2,358 milyar Yuan oldu. Aynı zamanda Zhipu, programlama arenası Code Arena’da açık kaynaklı modeller arasında birinci sırada yer alan ve GPT-5.2’yi geride bırakan GLM-4.7 modelini yayınladı ve açık kaynak haline getirdi. Bu IPO sadece bir finansman değil, aynı zamanda pazarın saf LLM (Büyük Dil Modeli) şirketlerinin değerlemesi için bir “mihenk taşı” olayıdır (Kaynak: 36氪, 市值水晶)

Zhipu ve MiniMax

OpenAI, Noel’e Özel Codex Sürümünü Yayınladı, “Agentic Programming” Derinleşiyor: OpenAI, Noel döneminde GPT-5.2-Codex-XMas’ı yayına aldı. Bu model, GPT-5.2 performansını korurken kişiselleştirilmiş güncellemeler içeriyor ve abonelere iki kat kullanım sınırı sunuyor. Bu güncelleme sadece bir festival pazarlaması değil, OpenAI’ın Codex’i bir “Engineering Agent” (Mühendislik Temsilcisi) olarak konumlandırma stratejisini yansıtıyor: Uzun bağlam (context) anlama, dosyalar arası görev işleme ve Windows yerel araç zinciri optimizasyonu güçlendirildi. Geliştiriciler, karmaşık projelerin uygulanmasında modelin başarısının çoğu rakibi geride bıraktığını fark etti; bu da 2026’da “AI ile kod yazma” döneminden “AI ile mühendislik yönetimi” dönemine geçileceğinin habercisi (Kaynak: 新智元, op7418)

OpenAI Noel Codex

Axiom Math: AI Akıl Yürütmede Yeni “Kabul” Standardını Tanımlıyor: 24 yaşındaki Stanford terk Carina Hong tarafından kurulan Axiom Math, 300 milyon dolar değerleme ile 64 milyon dolar yatırım aldı. Şirket, mantıksal doğruluğu otonom olarak doğrulayabilen “AI Matematikçileri” geliştirmeye odaklanıyor. Temel atılım, Lean programlama dilinin dahil edilmesiyle AI’ın her akıl yürütme adımının formal verification (biçimsel doğrulama) içermesini sağlamak ve böylece büyük modellerin sonuçlarının “kabul edilmesi” konusundaki güven sorununu çözmektir. Putnam Matematik Yarışması’nda sistem, 9 zor soruyu otonom olarak çözdü ve tamamı doğrulamadan geçti. Bu ilerleme, AI’ın belirsiz “cevap üretiminden” titiz “mantıksal öz-doğrulamaya” geçtiği anlamına geliyor ve bilimsel araştırma ile endüstriyel alanlarda güvenilir bir ortak haline geleceğini gösteriyor (Kaynak: AI 深度研究员)

NVIDIA ve Groq, Bilgi İşlem ve Bellek Darboğazını Aşmak İçin Lisans Anlaşması Yaptı: HBM bellek fiyatlarındaki artış ve kapasite yetersizliği karşısında NVIDIA, Groq ile münhasır olmayan bir teknik lisans anlaşması imzaladı. Groq’un kurucusu ve çekirdek ekibi, Groq’un çıkarım (inference) teknolojisini entegre etmek üzere NVIDIA’ya katılacak. Groq’un LPU mimarisi, ana bellek olarak SRAM kullanıyor ve bu da geleneksel HBM’den birkaç kat daha yüksek bant genişliği sağlayarak çıkarım sürecindeki bellek darboğazını büyük ölçüde hafifletiyor. Bu hamle, NVIDIA’nın “bellek kıtlığı” bağlamında açtığı ikinci bir cephe olarak görülüyor; amaç yeni bellek teknolojisi yollarını keşfederek DRAM tedarik zinciri risklerini dengelemek ve AI çıkarım pazarındaki hakimiyetini pekiştirmektir (Kaynak: 机器之心, op7418)

NVIDIA ve Groq

🎯 Gelişmeler

Meta, Self-play SWE-RL ile Agent Öz-Evrimini Tanıttı: Meta araştırma ekibi, yazılım mühendisliği agent’larının insan etiketlemesine ihtiyaç duymadan “Bug Enjeksiyonu” ve “Bug Onarımı” mekanizmasıyla kendi kendini eğitmesini sağlayan SSR çerçevesini yayınladı. Bu yöntem sadece kaynak kod sandbox erişimi gerektiriyor; agent, kendi kendini yöneten bir evrim döngüsünde sürekli olarak yüksek kaliteli problemler üretiyor ve bunları otonom olarak çözüyor. Deneyler, SSR’nin eğitim sürecinde performansının sürekli arttığını ve temel Reinforcement Learning (RL) yöntemlerinden daha iyi olduğunu kanıtladı. Bu, AI Agent’ların “Süper Zeka”ya doğru ilerlediğini ve sistem anlama ile otonom yazılım oluşturma konularında insan yeteneklerini aşma potansiyeline sahip olduğunu gösteriyor (Kaynak: 学术头条)

Meta SSR

Liquid AI En Güçlü 3B Modelini Yayınladı, RL Etkisi Belirgin: Liquid AI, saf Reinforcement Learning ile oluşturulan ve talimat takibi, bilgi ve matematik kıyaslamalarında üstün performans sergileyen deneysel LFM2-2.6B-Exp modelini tanıttı. IFBench puanı, kendisinden 263 kat daha büyük olan DeepSeek R1’i bile geride bıraktı. Topluluk geri bildirimleri, modelin “doktora düzeyinde bilgiye” sahip olduğunu ve iPhone gibi uç cihazlarda sorunsuz çalıştığını gösteriyor. Bu ilerleme, verimli algoritma tasarımı ve RL optimizasyonu ile küçük parametreli modellerin bile belirli alanlarda üst düzey modellerle yarışabileceğini bir kez daha kanıtlıyor (Kaynak: maximelabonne, huggingface)

Liquid AI 3B

ChatGPT Android Sürümünde Reklam Yerleştirme Planı Sızdı: Geliştiriciler, ChatGPT Android beta kodunda “ads feature”, “search ad” gibi reklamla ilgili dizeler buldu. Sam Altman daha önce reklamın “son çare” olduğunu belirtmiş olsa da, 2025’in ilk yarısında 2,5 milyar dolara ulaşan harcama baskısı altında OpenAI’ın ücretsiz kullanıcılar için gelir elde etme hazırlıklarına başladığı açıkça görülüyor. Planlanan reklam formatları, doğal diyaloğu bozmadan niyet odaklı monetizasyon sağlamak amacıyla kenar çubuğu sponsorlu mesajları veya “konuşma tabanlı önerileri” içerebilir. Bu, AI arama motorlarının “mutlak saf” döneminin sona ereceğine işaret ediyor (Kaynak: 直面AI)

NVIDIA, Uzun Bağlam ve Agent Yeteneklerine Odaklanan Nemotron 3 Serisini Yayınladı: NVIDIA; hibrit Mamba-Transformer mimarisi ve Mixture-of-Experts (MoE) teknolojisini kullanan Nemotron 3 ailesini (Nano, Super, Ultra) tanıttı. Bu seri, 1M uzunluğa kadar context desteği sunuyor ve Agent akıl yürütme ile çok adımlı araç çağırma (tool calling) için post-training optimizasyonundan geçti. Nano versiyonu, benzer küçük modeller arasında lider doğruluk ve son derece düşük çıkarım maliyeti sunarken, Ultra versiyonu SOTA düzeyinde akıl yürütme performansı hedefliyor. NVIDIA, model ağırlıklarını, eğitim yazılımlarını ve tariflerini açık kaynak olarak sunma sözü verdi (Kaynak: Reddit)

SAM 3: Piksel Tıklamadan “Kavram Adlandırmaya” Evriliyor: Meta, video segmentasyon teknolojisini “tıkla-seç” modundan “kavram tanıma” moduna yükselten SAM 3’ü (Segment Anything with Concepts) yayınladı. Kullanıcılar sadece “gözlüklü kişi” yazarak modelin görüntü veya videodaki tüm uygun nesneleri otomatik olarak konumlandırmasını sağlayabiliyor. 4 milyon benzersiz kavramla yapılan otomatik eğitim sayesinde SAM 3, karmaşık video kıyaslaması MOSEv2’deki doğruluğunu %47.9’dan %60.3’e çıkardı. Bu atılım, AI’ın görsel dünyadaki anlamsal anlama yeteneğini büyük ölçüde artırarak video segmentasyonundaki tıkanıklık ve tutarlılık sorunlarını çözüyor (Kaynak: ylecun)

SAM 3

🧰 Araçlar

GAIT ve GaitHub: AI Akıl Yürütme İçin “Git” Versiyon Kontrol Sistemi: AI kararlarının izlenememesi ve tekrarlanamaması sorununa yönelik olarak geliştiriciler GAIT’i tanıttı. Bu sistem, AI etkileşimlerini kullanıcı niyeti, model yanıtı, akıl yürütme dalları ve bellek durumunu kapsayan içerik adresli nesneler olarak ele alıyor. GAIT ile geliştiriciler, AI akıl yürütme sürecini tıpkı kod yönetir gibi versiyonlayabilir, dallara ayırabilir ve kararları birleştirebilir. GaitHub bulut platformu ise iş birliği ve denetimi destekleyerek kurumsal AI iş akışları için gerekli mühendislik altyapısını sağlıyor ve “AI neden bu kararı verdi” şeklindeki kara kutu sorununu çözüyor (Kaynak: Reddit)

GAIT

DeepFabric: Belirli MCP Servisleri İçin Araç Çağırma İnce Ayar Çerçevesi: DeepFabric, geliştiricilerin herhangi bir MCP sunucusu veya araç seti için otomatik olarak alana özgü akıl yürütme veri setleri oluşturmasına olanak tanıyan açık kaynaklı bir araçtır. İzole bir WebAssembly ortamında gerçek araç yörüngelerini yürüterek, bu çerçeve Qwen3-4B gibi küçük modellerin belirli görevlerde (örneğin Blender kontrolü) Claude 4.5 ve Gemini 2.5’i geride bırakacak şekilde ince ayar (fine-tuning) yapılmasını sağlar. Bu, yüksek performanslı ve düşük maliyetli dikey alan uzmanı Agent’lar oluşturmak için net bir yol sunuyor (Kaynak: Reddit)

Quint: CLI’ya Elveda, Chatbot’lar İçin Etkileşimli UI: Quint, LLM destekli etkileşimleri düz metinden yapılandırılmış ve deterministik bir UI’ya dönüştürmeyi amaçlayan bir React kütüphanesidir. Geliştiricilerin açık seçenekler tanımlamasına olanak tanır ve kullanıcılar tıkladığında belirli bilgi gösterimlerini veya yapılandırılmış girişleri tetikleyebilir. Temel konsept; model alımı, kullanıcı görseli ve çıktı oluşturmayı ayırarak MCQs (Çoktan Seçmeli Sorular) ve rol yapma dalları gibi senaryolarda etkileşimi daha kontrollü hale getirmektir. Quint, belirli bir AI sağlayıcısına bağlı değildir ve gelecekte LLM’lerin doğrudan dinamik UI bileşenleri oluşturarak kullanıcı deneyimini artıracağının habercisidir (Kaynak: Reddit)

Quint

📚 Öğrenme

Hugging Face Bir Dizi Ücretsiz AI Kursu Yayınladı: Hugging Face, tatil döneminde en son AI teknolojilerini kapsayan ücretsiz bir kurs matrisi sundu. İçerik şunları kapsıyor: LeRobot kullanarak robot yapımını öğreten Robotics kursu, Model Context Protocol (MCP) öğrenme kursu, Agent oluşturma ve dağıtımına yönelik Agents kursu ve LLM, Deep Reinforcement Learning, Diffusion modelleri gibi derin teknik eğitimler. Bu kurslar HF ekosistemine dayanıyor ve geliştiricilerin temel modellerden öncü Agent mimarilerine kadar pratik becerileri hızla kazanmalarına yardımcı olmayı amaçlıyor (Kaynak: huggingface)

Hugging Face Kursu

WildVideo: Video Soru-Cevap Halüsinasyonlarını Sistematik Sınıflandıran İlk Kıyaslama: NUDT ve Sun Yat-sen Üniversitesi ekipleri, çok modlu modellerin video etkileşimlerindeki “halüsinasyon” sorununa yönelik algı, biliş ve bağlam anlama gibi 9 kategoride görev tanımlayan WildVideo benchmark’ını yayınladı. Deneyler, GPT-4o’nun bile çok turlu görevlerdeki doğruluk oranının sadece %52.7 olduğunu ve birinci şahıs bakış açılı videolarda zayıf performans sergilediğini gösterdi. Bu kıyaslama, modellerin dinamik algılama, derin akıl yürütme ve uzun diyalog tutarlılığı konularındaki eksikliklerini teşhis etmek için hassas araçlar sunuyor (Kaynak: 新智元)

WildVideo

PhononBench: AI Tarafından Üretilen Kristal Kararlılığını Değerlendirmek İçin Yeni Bir Ölçüt: PhononBench, AI tarafından üretilen kristallerin dinamik kararlılığına yönelik ilk büyük ölçekli kıyaslamadır. MatterSim potansiyel fonksiyonu aracılığıyla, altı lider üretici model tarafından üretilen 100.000’den fazla yapı üzerinde verimli hesaplamalar yapıldı. Sonuçlar, mevcut modellerin yaygın sınırlamalarını ortaya koydu: Ortalama kararlılık sadece %25.83. Bu çalışma, sadece üretici modellerin fiziksel uygulanabilirlik konusundaki eksikliklerini göstermekle kalmıyor, aynı zamanda gelecekteki yeni malzeme keşifleri için güvenilir bir aday havuzu sağlayan 28.000 fonon-kararlı kristal yapısını da filtreliyor (Kaynak: HuggingFace)

💼 İş Dünyası

AI Devlerinin 1200 Milyar Dolarlık “Hayalet Borcu” Endişe Yaratıyor: Meta, xAI ve Oracle gibi teknoloji devleri, Özel Amaçlı Araçlar (SPV) aracılığıyla 1200 milyar dolardan fazla veri merkezi harcamasını bilançolarından çıkarıyor. Bu bilanço dışı finansman modeli, şirketlerin kredi notlarını korusa da büyük finansal riskleri gizliyor. AI talebi beklentilerin altında kalırsa, devasa borçlar Wall Street’te zincirleme bir reaksiyona yol açabilir. UBS verileri, bu yıl yaklaşık 125 milyar doların bu tür “proje finansmanına” aktığını gösteriyor; bu da AI silahlanma yarışının yüksek riskli bir sermaye oyununa dönüştüğünü yansıtıyor (Kaynak: 财联社)

AI Hayalet Borç

Hindistan’ın “AI Canavar Hissesi” 550 Kat Arttı, Çip İşi Olmadığı Ortaya Çıktı: Hindistanlı RRP Semiconductor Ltd.’nin hisse fiyatı son 20 ayda %55.000 artarak piyasa değerini 1,7 milyar dolara çıkardı ve NVIDIA’nın artışını bile geride bıraktı. Ancak yapılan incelemeler, şirketin sadece 2 resmi çalışanı olduğunu, hiçbir yarı iletken üretim faaliyeti yürütmediğini ve hatta gelirinin negatif olduğunu ortaya koydu. Bu absürt durum, Hintli bireysel yatırımcıların AI kavramına olan körü körüne ilgisini ve düzenleme eksikliklerini yansıtarak 2025 AI balonundaki en tipik spekülasyon uyarısı haline geldi (Kaynak: 新智元)

Hindistan AI Hissesi

AI Bilgi İşlem Talebi 256GB Bellek Fiyatlarını RTX 5090’ın Üzerine Çıkardı: OpenAI gibi devlerin küresel DRAM arzının %40’ını kapatmasıyla bellek pazarında yapısal bir kıtlık oluştu. Tek bir 256GB DDR5 belleğin piyasa fiyatı 3500-5000 dolara fırlayarak en üst düzey ekran kartlarını geride bıraktı. Bu durum, AI sunucularının HBM ve yüksek performanslı belleklere verdiği yüksek tekliflerin tüketici sınıfı kapasiteyi “gasp ettiğini” gösteriyor. Sadece PC parçaları değil, AI PC konseptinin büyük bellek ihtiyacı da çıtayı yükseltti; sıradan tüketiciler AI priminden kaynaklanan donanım maliyeti artışıyla karşı karşıya (Kaynak: 机器之心)

Bellek Fiyat Artışı

🌟 Topluluk

2025 Yılı AI Popüler Kelimeler Listesi: “Vibe Coding”den “Slop”a: MIT Technology Review, yılın AI kelimelerini seçti. İnsanın sadece hedefini ifade etmesi ve AI’ın bunu gerçekleştirmesi anlamına gelen “Vibe Coding” listenin başında yer aldı. Aynı zamanda “Reasoning Model” ve “World Model” teknik derinliğin evrimini yansıtırken, “Slop” (AI çöp içeriği) ve “Bubble” (Balon) topluluğun içerik fazlalığı ve aşırı sermaye ısınması hakkındaki düşüncelerini yansıtıyor. Ayrıca “GEO” (Generative Engine Optimization), AI çağında markaların trafik çekmek için kullandığı yeni bir savaş alanı olarak SEO’nun yerini alıyor (Kaynak: 腾讯科技, 硅星GenAI)

AI Kelimeleri

Yann LeCun Paylaştı: İnsan ve LLM Yargı Yeteneği Arasındaki “Yedi Çatlak”: Bir makale, insan ve LLM arasındaki yargı farklarını yedi bilişsel aşamada karşılaştırarak, LLM’lerin algısal çıpalama, motivasyonel rehberlik, nedensel akıl yürütme ve üstbiliş konularında temel kusurları olduğuna dikkat çekti. LLM’ler tarafından üretilen dil akıcı ve ikna edici olsa da, özü “zihin” değil olasılıksal tahmindir. Topluluk tartışmaları, bu “yapay zeka zekası hissinin” doğrulama eksikliğinde son derece yanıltıcı olduğunu ve insanların “güven önyargısı” nedeniyle AI çıktılarına aşırı inanma eğiliminde olduğunu, bunun AI çağında yapısal bir zorluk oluşturduğunu belirtiyor (Kaynak: ylecun)

Yargı Çatlakları

Reddit Tartışması: ChatGPT’yi Bilişsel Rehabilitasyon Aracı Olarak Kullanmak: PTSD geçmişi olan bir kullanıcı, yapılandırılmış bilişsel destek için ChatGPT’yi nasıl kullandığına dair deneyimini paylaştı. Uzun süreli etkileşimli diyaloglar aracılığıyla kullanıcı; duygu düzenleme, mantıksal düzenleme ve öz-savunma konularında klinisyenler tarafından onaylanan önemli ilerlemeler kaydetti. Topluluk buna güçlü bir tepki verdi; tartışmalar AI’ın psikolojik rehabilitasyona yardımcı bir “tutarlılık aynası” olarak nasıl hizmet edebileceğine odaklanırken, aynı zamanda aşırı bağımlılık ve AI’ın üretebileceği yanıltıcı “yankı” etkisine karşı uyarıda bulundu (Kaynak: Reddit)

💡 Diğer

Alzheimer Hastalığı Hayvan Deneylerinde Tamamen Geri Döndürüldü: Case Western Reserve Üniversitesi araştırma ekibi, Cell Reports Medicine’da yayınladığı bir atılımla, P7C3-A20 bileşiği aracılığıyla beyindeki NAD+ dengesini onararak geç evre Alzheimer hastası farelerde sinirsel fonksiyonların tamamen iyileşmesini sağladı. Körlemesine NAD+ takviyesi yapmanın aksine, bu tedavi hassas düzenlemeye odaklanarak sadece patolojik hasarı onarmakla kalmadı, aynı zamanda hafıza yeteneğini de geri kazandırdı. İnsan uygulamaları için henüz zaman olsa da, Alzheimer’ın “tamamen iyileştirilmesi” için bir umut kapısı açıldı (Kaynak: dotey)

Alzheimer Atılımı

Stardust Intelligence Kablo Tahrikli Robotu Kör Kutu Satışında Göreve Başladı: Noel gününde, Stardust Intelligence tarafından geliştirilen kablo tahrikli insansı robot S1; Pekin, Şanghay ve Guangzhou gibi birçok şehirdeki alışveriş merkezlerinde resmi olarak “işe başladı”. Robot; sesli karşılama, kör kutu yakalama ve ürün teslimatından sorumlu. Kablo tahrik teknolojisi, robota insan kasına benzer bir esneklik ve hassas kuvvet kontrolü sağlayarak insan-makine etkileşiminde daha güvenli ve “akıcı” olmasını sağlıyor. Şirketin önerdiği “Avatar Intelligence” konsepti, robotların tele-operasyon yoluyla zehirli laboratuvarlar veya uzaktan servis gibi gerçek senaryolara önceden girmesini amaçlıyor (Kaynak: 智能涌现)

Kablo Tahrikli Robot

AI Müzik Hit Parçası “Seven-Day Lover” Telif ve İlgi Odağı Tartışması Başlattı: Bir programcının DeepSeek ve AI müzik araçlarını kullanarak oluşturduğu “Seven-Day Lover”, NetEase Cloud Music’te 2 milyondan fazla dinlendi ve telif hakları on binlerce Yuan’a satıldı. Bu olay, AI müziğinin gerçek bir gelir elde etme yeteneğine sahip olduğunu ve geleneksel telif sistemini sarstığını kanıtlıyor. ByteDance’in Soda Music’i Douyin ekosistemi üzerinden hit yollarını tanımlarken, Tencent ve NetEase denetim ve gelir paylaşımı konusunda sıkı önlemler alıyor. AI’ın getirdiği “sonsuz arz”, platformları telif yarışından ilgi dağıtım verimliliği savaşına zorluyor (Kaynak: 市象)

AI Müzik