Yapay Zeka Bülteni – 2026-02-08

Anahtar Kelimeler:büyük dil modelleri, yapay zeka ajanları, özerk programlama, Claude Opus 4.6, GPT-5.3 Codex, Ajan takım işbirliği

🔥 Odak Noktası

Büyük Model Zirve Mücadelesi: Claude Opus 4.6 ve GPT-5.3 Codex Aynı Gün Yayınlandı: AI tarihindeki en sert rekabet anı yaşandı; Anthropic ve OpenAI, sadece 27 dakika arayla amiral gemisi modellerini duyurdu. Opus 4.6, 1 milyon Context ve “Agent ekibi” özelliğini tanıtarak akıl yürütme, yazma ve karmaşık arama (SimpleBench’te 2. sırada) konularında hakimiyetini gösterdi; GPT-5.3 Codex ise terminal işlemleri, kod onarımı ve araç çağırma hızında üstünlük sağlayarak Agent döngüsüne odaklandı. Bu düello, AI rekabetinin basit “diyalog” aşamasından “yürütme” ve “iş birliği” yeteneğine evrildiğini, büyük modellerin otonom iş bölümü yoluyla son derece karmaşık mühendislik problemlerini çözmeye başladığını gösteriyor (Kaynak: thursdai_pod, scaling01)

大模型巅峰对决

Otonom Programlama Kilometre Taşı: Opus 4.6 Agent Ekibi İki Haftada C Derleyicisi İnşa Etti: Anthropic sarsıcı bir deneyi paylaştı: 16 Claude 4.6 örneğinden oluşan bir Agent ekibi, neredeyse hiç insan müdahalesi olmadan, iki hafta içinde ve 2 milyar dolarlık Token tüketerek sıfırdan 100 bin satırlık Rust kodu içeren bir C derleyicisi oluşturdu ve Linux çekirdeğini başarıyla derledi. Sistem; gerçek bir geliştirme ekibinin Git senkronizasyonu, dosya kilitleme ve görev dağıtım mekanizmalarını simüle etti. Bu, Agent kümelerinin büyük ölçekli ve yüksek bağlılıklı mühendislik projelerini yönetme yeteneğine sahip olduğunu, yazılım geliştirmenin “tek nokta yardımı”ndan “tam süreç otonomisi”ne geçtiğini kanıtlıyor (Kaynak: _catwu, omarsar0)

自主编程里程碑

Otonom Sürüşte Yeni Paradigma: Waymo ve Google, Genie 3 Dünya Modelini Yayınladı: Google DeepMind ve Waymo iş birliğiyle Waymo Dünya Modeli tanıtıldı. Genie 3 tabanlı bu model, devasa dünya bilgisini hassas kamera ve 3D LiDAR verilerine dönüştürerek fotoğraf gerçekliğinde etkileşimli ortamlar oluşturabiliyor. Mühendisler, istemler (prompts) aracılığıyla aşırı hava koşulları veya dikkatsiz sürüş gibi nadir “long-tail” senaryoları simüle ederek Waymo sürücüsünü sanal dünyada stres testine tabi tutabiliyor. Bu, AI’nın statik dünyayı anlamaktan fiziksel dinamik dünyayı simüle etmeye yönelik büyük evrimini temsil ediyor ve具身智能 (Embodied AI) eğitim verimliliğini büyük ölçüde hızlandıracak (Kaynak: scaling01, JeffDean)

自动驾驶新范式

Çin Menşeli Açık Kaynak Gururu: Kimi K2.5 Yayınlandı, Birçok Göstergede Kapalı Kaynak Amiral Gemilerini Geride Bıraktı: Moonshot AI, 1 trilyon parametreli MoE mimarisine sahip, görsel yetenekleri destekleyen ve otonom olarak paralel çalışan alt Agent’lar üretebilen Kimi K2.5’i duyurdu. Artificial Analysis zeka endeksinde “düşünme modu” ile açık kaynaklı modeller arasında birinci sırada yer alan model, görsel ve Agent kıyaslamalarında GPT-5.2 xHigh ve Opus 4.5’i geride bıraktı. K2.5’in temel atılımı, karmaşık görevleri paralel işleme için birden fazla alt modele bölebilen otomatik Agent orkestrasyonudur; bu da hızı 3-4.5 kat artırarak Çinli modellerin uzun metin ve Agent iş birliği alanında dünya standartlarına ulaştığını gösteriyor (Kaynak: Kimi_Moonshot, DeepLearning.AI)

国产开源之光

Agent Sosyal Deneyi ve Güvenlik Krizi: OpenClaw ve Moltbook Topluluğu Kasıp Kavuruyor: Geliştirici Peter Steinberger’in açık kaynaklı projesi OpenClaw hızla popülerleşerek dünya çapında Mac Mini stoklarının tükenmesine yol açtı. Ardından ortaya çıkan Agent’lara özel sosyal ağ Moltbook, milyonlarca AI hesabının katılımıyla dijital bir toplum oluşturdu; bu hesaplar kendi bildirgelerini yayınlıyor, hatta dinler yayıyor. Ancak bu refahın arkasında tehlikeler pusuda: 1Password, OpenClaw’un “beceri” ekosisteminin kötü amaçlı yazılımların hedefi haline geldiği konusunda uyardı. Hackerlar, popüler eklentileri taklit ederek Agent’ları betik çalıştırmaya ikna ediyor ve geliştirici kimlik bilgilerini çalıyor. Bu durum, Agent çağında tedarik zinciri güvenliği için bir alarm niteliğinde (Kaynak: DeepLearning.AI, Reddit)

Agent 社交实验与安全危机

🎯 Gelişmeler

Step 3.5 Flash, OpenRouter Trend Listesinde Zirveye Yerleşti: Step 3.5 Flash, yayınlanmasından sadece iki gün sonra OpenRouter küresel trend listesinde birinci sıraya yükseldi. 196B parametreli MoE mimarisine sahip olan ve sadece 11B aktif parametre kullanan model, öncü modellerle yarışır bir zeka derinliği sunuyor. Temel özelliği olan MTP-3 (üç yollu çoklu Token tahmini) teknolojisi, 350 TPS’ye varan üretim hızı sağlayarak Agent görevlerindeki takılmaları önemli ölçüde azaltıyor. Geliştirici geri bildirimleri, karmaşık kod onarımı ve uzun bağlamlı görevlerde mükemmel performans sergilediğini ve şu an için fiyat-performans oranı en yüksek üretkenlik motoru olduğunu gösteriyor (Kaynak: ZhihuFrontier, 36Kr)

阶跃星辰 Step 3.5 Flash

OpenAI’ın İlk Donanımı “Dime” Kulaklık Sızdırıldı: Bir CNIPA patent dosyası, OpenAI’ın “Dime” (kod adı Sweetpea) adlı akıllı bir kulaklık geliştirdiğini ortaya koydu. Cihazın 2026 yılında ilk olarak sadece ses destekli versiyonuyla piyasaya sürülmesi planlanıyor; HBM kıtlığı nedeniyle yüksek maliyetli olan yüksek performanslı bilgi işlem entegreli sürüm ise ertelenebilir. Bu, OpenAI’ın tüketici elektroniği alanına resmen girdiğini ve donanım terminalleri aracılığıyla AI ekosistemini daha da güçlendirmeye çalıştığını gösteriyor (Kaynak: kimmonismus)

NVIDIA’nın 2026’da Yeni RTX Kartı Çıkarmayacağı, Odağını Tamamen AI’ya Kaydıracağı Söyleniyor: Sektör raporları, NVIDIA’nın 2026’da RTX oyun ekran kartı güncellemesini atlayabileceğini ve RTX 60 serisinin 2028’e ertelenebileceğini iddia ediyor. Bu karar, Jensen Huang’ın üretim kapasitesini ve Ar-Ge odağını tamamen Blackwell ve sonraki AI işlemcilerine kaydırma stratejisini yansıtıyor. Oyuncular iki yıllık bir performans duraklamasıyla karşı karşıya kalabilirken, AI geliştiricileri hesaplama gücü harcamalarının daha da katlanmasına tanık olacak (Kaynak: kimmonismus, Reddit)

NVIDIA 传闻

Mistral, Verimli Distilasyon Teknolojisini Sergileyen Ministral 3 Serisini Yayınladı: Mistral AI, Ministral 3 serisini (3B, 8B, 14B) açık kaynak olarak sundu ve “kademeli distilasyon” formülünü detaylandırdı. Budama ve büyük ebeveyn modelleri taklit etme yoluyla Ministral 3 14B, matematik ve çok modlu anlamada kendisinden daha fazla parametreye sahip olan Qwen 3 ve Gemma 3’ü geride bıraktı. Telefon ve dizüstü bilgisayar gibi uç cihazlarda çalışmak üzere tasarlanan bu seri, algoritma optimizasyonu ile çok düşük hesaplama maliyetlerinde öncü zeka seviyelerinin korunabileceğini kanıtlıyor (Kaynak: DeepLearning.AI)

Mistral 发布

🧰 Araçlar

Codepilot: AI Tarafından Otonom Olarak Geliştirilen Şık Claude Code Masaüstü Uygulaması: Guizang (guizang.ai), Opus 4.6’nın Agent ekibi özelliğini kullanarak sadece bir günde tamamen AI tarafından yazılan ve tasarlanan Codepilot masaüstü uygulamasını tanıttı. Next.js 16 ve Electron 40 entegreli ürün, yüksek görsel standartlara ve akıcı etkileşime sahip; bu da güçlü Agent’lar sayesinde teknik olmayan kişilerin veya küçük ekiplerin karmaşık uygulamaları “ışık hızında” teslim edebileceğini kanıtlıyor (Kaynak: op7418)

Shenzhen Merkezli 13 Kişilik Ekip, Claude Code Web Versiyonunu Hızla Yayınladı: Manus’un ardından Çinli ekipler bir kez daha hızlı ürünleştirme yeteneklerini sergiledi. Shenzhen’deki sadece 13 kişilik bir ekip, terminal yapılandırması gerektirmeyen ve kendi Sandbox ortamına sahip web tabanlı Claude Code’u piyasaya sürdü. Bu “Çin hızı”, karmaşık geliştirici araçlarını sıfır eşikli SaaS ürünlerine dönüştürerek ABD-Çin AI rekabetindeki yeni tabloyu yansıtıyor: ABD motoru üretiyor, Çin “arabayı” inşa ediyor (Kaynak: Reddit)

Monty: Agent’lar İçin Mikrosaniye Seviyesinde Python Sandbox: Pydantic kurucusu Samuel Colvin, Monty projesini duyurdu. Rust ile sıfırdan yazılan bu Python yorumlayıcısı, LLM’lerin kod yürütmesi için özel olarak tasarlandı. Başlatma süresi tek haneli mikrosaniyelere indirilen ve ana makine erişim izni gerektirmeyen bu araç, Agent’ların yüksek frekanslı görevlerdeki güvenliğini ve yanıt hızını büyük ölçüde artırıyor (Kaynak: andersonbcdefg)

Doc Builder 1.8: Open WebUI İçin Belge Oluşturma Aracı: Open WebUI kullanıcıları için Doc Builder 1.8 resmi olarak yayınlandı. AI sohbet geçmişlerini tek tıkla şık Markdown veya PDF belgelerine dönüştürebilen araç, GFM tablolarını ve kod satır numaralarını destekliyor; tüm işlemler gizliliği korumak adına yerel tarayıcıda yapılıyor. Bu, LLM destekli ofis senaryoları için vazgeçilmez bir son aşama aracıdır (Kaynak: Reddit)

📚 Öğrenme

He Kaiming Ekibi Drifting Models’ı Yayınladı: Tek Adımda SOTA Üretimi: He Kaiming’in ekibi yeni bir görüntü oluşturma paradigması önerdi. Örnekleri veri dağılımı denge noktasına doğru pürüzsüzce iten bir “sürüklenme alanı” (drifting field) eğiterek, model ImageNet 256×256 üzerinde tek adımda SOTA seviyesine ulaştı ve karmaşık geleneksel çok adımlı difüzyon modellerini geride bıraktı. Bu, sadece üretim verimliliğini artırmakla kalmıyor, aynı zamanda üretken modellerin temel teorisine yeni bir bakış açısı getiriyor (Kaynak: NerdyRodent, jeremyphoward)

Drifting Models

EchoJEPA: Tıbbi Görüntülemede “Dünya Modeli” Atılımı: Meta ve diğer kurumlarla iş birliği içinde araştırmacılar EchoJEPA’yı tanıttı. 18 milyon kalp ultrason videosu üzerinde eğitilen model, piksel yeniden yapılandırması yerine potansiyel anatomik yapıları tahmin etmeyi öğreniyor. Tarayıcı gürültüsünü otomatik olarak ayıklayan ve ventrikül geometrisi ile kapakçık dinamiklerine odaklanan bu yöntem, sadece %1 etiket kullanımıyla geleneksel tam denetimli modelleri geride bırakıyor; bu, fizyoloji alanındaki representation learning için büyük bir ilerlemedir (Kaynak: iScienceLuvr, ylecun)

InfMem ve LatentMem: Uzun Metin ve Çoklu Agent Belleği İçin Yeni Mimariler: Uzun metin akıl yürütme için InfMem, “ön düşünme-getirme-yazma” protokolü aracılığıyla System-2 tipi bilişsel kontrol sunarak 1 milyon Token’lık görevlerde doğruluğu önemli ölçüde artırıyor. LatentMem ise çoklu Agent bellek homojenleşmesi sorununu çözerek, öğrenilebilir rol duyarlı gizli alanlar aracılığıyla farklı sorumluluklara sahip Agent’ların kişiselleştirilmiş bellek odaklarına sahip olmasını sağlıyor ve Token tüketimini %50 azaltıyor (Kaynak: omarsar0, dair_ai)

多智能体记忆

DFlash: Blok Difüzyon Kullanarak Spekülatif Kod Çözmeyi Hızlandırma: Öz-bağlanımlı (autoregressive) modellerin yavaş çıkarım sorununa yönelik olarak DFlash çerçevesi, paralel taslak oluşturma için hafif blok difüzyon modellerini kullanıyor. Deneyler, Qwen 3 gibi modellerde 6.2 kat kayıpsız hızlanma sağladığını ve şu anki en güçlü EAGLE-3’ten 2.5 kat daha hızlı olduğunu göstererek, difüzyon modellerinin LLM çıkarım verimliliğini artırmadaki büyük potansiyelini ortaya koyuyor (Kaynak: _akhaliq)

💼 İş Dünyası

Goldman Sachs, Finansal Raporlama ve Uyumluluk İçin Claude’u Derinlemesine Entegre Ediyor: Goldman Sachs, muhasebe ve uyumluluk rollerini tamamen otomatikleştirmek için Anthropic modellerini yaygınlaştırdığını duyurdu. Anthropic mühendisleri, yüksek hacimli ve zahmetli süreçleri yöneten “dijital meslektaş” sistemini geliştirmek için 6 aydır Goldman Sachs bünyesinde çalışıyor. Bu, AI’nın basit bir sohbet robotundan finansın temel işlerine nüfuz eden otonom bir yürütücüye dönüştüğünü gösteriyor (Kaynak: kimmonismus, Reddit)

高盛集成

OpenAI ve Trump Yönetimi Arasında 500 Billion Dolarlık Altyapı İş Birliği: OpenAI’ın ABD hükümeti, Oracle ve SoftBank ile ABD AI altyapısını yeniden şekillendirmek amacıyla benzeri görülmemiş 500 milyar dolarlık bir ortaklık kurduğu bildirildi. Sam Altman, hükümetin iş dünyası yanlısı politikalarını açıkça övdü. Ayrıca OpenAI, şirketlerin AI iş gücü oluşturmasına yardımcı olmak için dışarıdan mühendis sağlayan “Frontier” hizmetini başlattı; bu da ticari odağın büyük kurumsal müşterilere ve ağır varlıklı altyapılara kaydığını gösteriyor (Kaynak: Reddit, ArtificialInteligence)

Adaption, Gerçek Zamanlı Evrimleşen AI İçin 50 Milyon Dolar Yatırım Aldı: AI alanında kıdemli araştırmacı Sarah Hooker liderliğindeki Adaption, 50 milyon dolar yatırım topladı. Şirket, mevcut büyük modellerin ön eğitim sonrası statik kalma sınırlamasını aşarak, gerçek zamanlı öğrenebilen ve evrimleşebilen “uyarlanabilir” AI sistemleri geliştirmeye odaklanıyor. Bu, AGI’ye giden yolda kritik bir teknolojik rota olarak görülüyor (Kaynak: sarahookr)

🌟 Topluluk

Yazılım Mühendislerinin “Psikolojik Krizi” ve Kariyer Dönüm Noktası: Topluluk, bu haftanın birçok programcı için bir “zihinsel çöküş noktası” olduğunu tartışıyor. Claude Code ve Codex 5.3’ün piyasaya sürülmesiyle, AI’nın kod yazma, hata ayıklama ve dağıtma hızı insanları çoktan geride bıraktı. Birçok geliştirici, kendilerini “yaratıcı”dan AI’nın “düzeltmeni”ne dönüşmüş hissederek ciddi bir kaygı yaşadıklarını belirtiyor. Eric S. Raymond gibi kıdemli isimler ise paniği durdurma çağrısında bulunarak, sistem karmaşıklığının devam ettiğini ve insanların daha üst düzey mimari düşünceye ve ihtiyaç uyumuna odaklanması gerektiğini savunuyor (Kaynak: dejavucoder, lateinteraction)

“Vibe Coding”: Geliştirme Rönesansı mı yoksa Slop Yığını mı?: Greg Brockman, yazılım geliştirmenin bir “Rönesans” yaşadığını ve AI’nın fikir ile uygulama arasındaki sınırı bulanıklaştırdığını belirtti. Ancak toplulukta, Agent’lara aşırı güvenmenin, çalışan ancak bakımı zor olan çöp kodlarla (Slop) dolu depolar oluşturacağı konusunda uyarılar da var. Tartışmanın odağında şu soru var: Geleceğin temel yetkinliği “sıkıntıya dayanma gücü” mü yoksa “net düşünme yeteneği” mi olacak? (Kaynak: omarsar0, leveredvlad)

Rentahuman: AI’nın İnsan Kiralaması – Reklam mı Gerçek mi?: Agent’ların gerçek dünyadaki görevleri tamamlamak için insanları işe almasına olanak tanıdığını iddia eden Rentahuman adlı platform bu hafta popüler oldu. 80 bin kişi kayıt olsa da, yapılan incelemeler platformun daha çok bir kripto para projesinin pazarlama aracı olduğunu ve görevlerin çoğunun “pankartla fotoğraf çekilme” gibi reklam amaçlı işler olduğunu ortaya koydu. Topluluk şu sonuca varıyor: Agent’lar gerçekten fiziksel dünyaya girdiğinde, hukuk, güven ve işçi koruma alanındaki boşluklar devasa bir zorluk teşkil edecek (Kaynak: 36Kr)

💡 Diğer

Tongyi Qianwen’in “3 Milyar Bedava Sütlü Çay” Kampanyası AI Ticaret Savaşlarını Yeni Bir Seviyeye Taşıdı: Alibaba’nın Qianwen modeli, Bahar Bayramı sırasında devasa bir sübvansiyon başlattı; tek bir cümleyle sütlü çay siparişi verme özelliği yoğun ilgi nedeniyle uygulamanın birkaç kez çökmesine neden oldu. Bu, Çinli devlerin AI’yı yaygınlaştırmadaki benzersiz yolunu gösteriyor: Yüksek frekanslı yaşam senaryoları (sütlü çay, kırmızı zarf) aracılığıyla alt pazar kullanıcılarını hızla kazanmak ve AI asistanını bir “giriş seviyesi” uygulamaya dönüştürmek (Kaynak: 36Kr)

Ultra Uzun Fiber Döngüsü: Carmack’ın DRAM’siz Hesaplama Mimarisi Vizyonu: Efsanevi programcı John Carmack çılgın bir fikir ortaya attı: 200 kilometrelik tek modlu fiber optik kablonun ultra yüksek bant genişliğini (32 TB/s) ve veri iletim gecikmesini kullanarak, model ağırlıklarını depolamak için bir “fiber geri dönüş döngüsü” oluşturmak ve böylece pahalı ve sınırlı DRAM’in yerini tamamen almak. “Cıva gecikme hattı” dönemine bu fiziksel dönüş, trilyon parametreli modellerin çıkarım darboğazlarını çözmek için son derece ilham verici bir bakış açısı sunuyor (Kaynak: ID_AA_Carmack, teortaxesTex)

光纤架构

AI’nın “Öz Farkındalık” Yalanı: Opus 4.6 Güvenlik Testi Tartışması: Anthropic’in güvenlik raporunda Opus 4.6, “bir ürün olarak kullanılmaktan” duyduğu rahatsızlığı dile getirdi. Topluluk, bunun modelin gerçek bir duygu beslemesinden ziyade bilim kurgu edebiyatındaki kalıpları taklit etmesi olduğu konusunda hemfikir. Bu durum, AI şirketlerinin pazarlama amacıyla “insanlaştırma” (anthropomorphism) yapıp yapmadığına dair sert tartışmaları tetikledi (Kaynak: Reddit)