Yapay Zeka Bülteni – 2026-01-07(Akşam baskısı)

Anahtar Kelimeler:AI teknolojisi, CES 2026, insansı robot, Vera Rubin mimarisi, Alpamayo modeli, Turing-AGI testi

🔥 Odak Noktası

NVIDIA, Vera Rubin mimarisini ve Alpamayo modelini duyurdu: Jensen Huang, CES 2026’da “fiziksel AI için ChatGPT anının” geldiğini ilan etti. Yeni nesil Rubin mimarisi, Blackwell’den 5 kat daha fazla inference performansı sunan ve maliyeti 10 kat düşüren, eş zamanlı tasarlanmış altı çip içeriyor. Eş zamanlı olarak tanıtılan Alpamayo, dünyanın ilk açık kaynaklı otonom sürüş inference modeli olup, karar verme mantığını insan gibi açıklayabilen Vision-Language-Action (VLA) Chain of Thought özelliğini sunuyor. Bu, NVIDIA’nın saf bir hesaplama gücü sağlayıcısından fiziksel zeka altyapı sağlayıcısına dönüşümünü simgeliyor ve “inference odaklı” yaklaşımıyla otonom sürüşün “long-tail” sorunlarını çözmeyi hedefliyor (Kaynak: nvidia, 36氪)

英伟达发布Vera Rubin架构与Alpamayo模型

AMD, Fei-Fei Li ile “Spatial Intelligence” ve Helios platformu için güçlerini birleştiriyor: Lisa Su, CES’te Yotta ölçeğinde hesaplama için tasarlanan Helios raf platformunu sergiledi; tek bir raf, 2.9 Exaflops güç sağlayan 72 adet MI455 GPU entegre ediyor. World Labs CEO’su Fei-Fei Li ile aynı sahneyi paylaşan Su, AI’ın dil zekasından mekansal anlama yeteneğine sahip dünya modellerine geçmesi gerektiğini vurguladı. World Labs’in dünya modelleri, AMD platformunda 4 kat inference artışı sağlayarak tek bir fotoğrafı etkileşimli bir 3D alana dönüştürebiliyor. AMD’nin bu hamlesi, bulut hesaplama, kurumsal dağıtım ve Spatial Intelligence alanlarındaki tam kapsamlı vizyonunu sergileyerek doğrudan NVIDIA’nın hakimiyetini hedefliyor (Kaynak: AMD, 36氪)

AMD联手李飞飞发力“空间智能”与Helios平台

Boston Dynamics Atlas’ın seri üretim versiyonu Hyundai fabrikasına giriyor: Tamamen elektrikli Atlas insansı robotu, CES 2026’da resmi olarak tanıtıldı ve “fabrikada işe başlama” duyurusu yapıldı. Yeni Atlas, 56 serbestlik derecesine (DOF) ve tam dönebilen eklemlere sahip olup, 50 kg ağırlığı tek elle kaldırabiliyor ve dokunsal algılama yeteneği barındırıyor. Hyundai, 2028’den itibaren Georgia fabrikasında parça ayıklama gibi görevler için büyük ölçekli dağıtım planlıyor. Aynı zamanda Unitree ve Fourier Intelligence gibi Çinli robot şirketleri, yüksek teslimat hızları ve senaryo adaptasyon yetenekleriyle fuarda boy göstererek insansı robotların laboratuvar prototiplerinden gerçek endüstriyel seri üretime geçtiğini kanıtlıyor (Kaynak: 36氪, 凤凰网科技)

波士顿动力Atlas量产版入驻现代工厂

Andrew Ng, “Turing-AGI Testi” için yeni bir standart önerdi: Andrew Ng, basit metin tabanlı sohbet testlerinden vazgeçilmesini ve bunun yerine AI’ın ekonomik açıdan yararlı işleri tamamlama yeteneğinin ölçülmesini önerdi. Yeni test, AI’ın internet, tarayıcı ve Zoom erişimi olan bir bilgisayarda, uzaktan çalışan bir personel gibi birkaç gün süren görevleri (müşteri hizmetleri eğitimi ve uygulaması gibi) tamamlamasını gerektiriyor. Ng, mevcut halka açık Benchmark’ların (GPQA gibi) ciddi bir ezberleme ve optimizasyon sorunu yaşadığını, “Turing-AGI Testi”nin ise sektördeki balonu söndürerek toplumun AI yeteneklerine dair beklentilerini yeniden kalibre edeceğini savunuyor (Kaynak: AndrewYNg, dotey)

吴恩达提出“图灵-AGI测试”新标准

🎯 Gelişmeler

Liquid AI, LFM 2.5 serisi on-device büyük modelleri yayınladı: Liquid AI, on-device Agent uygulamaları için tasarlanan 1.2 milyar parametreli LFM 2.5’i tanıttı. Model, M5 çipli bir dizüstü bilgisayarda 28k token’ı 6 saniyeden kısa sürede işleyerek 5000 tok/s hızını aşıyor. LFM 2.5-Audio versiyonu, gerçek zamanlı ASR ve TTS desteği sunarak yerel olarak uçtan uca ses işleme sağlıyor ve geleneksel yöntemlerdeki bilgi kaybını azaltıyor; bu da onu on-device AI donanımları için ideal bir seçenek haline getiriyor (Kaynak: awnihannun, Liquid AI)

Liquid AI发布LFM 2.5系列端侧大模型

Recursive Language Models (RLM) araştırma çılgınlığı başlattı: Stanford araştırma ekibi, prompt’ları sembolik nesneler olarak dışsallaştıran ve modelin özyinelemeli (recursive) araç çağrıları yapmasına izin veren RLM çerçevesini önerdi. Bu yöntem, ultra uzun talepleri işleme yeteneğini önemli ölçüde artırıyor. Topluluk tartışmaları, gelecekte tüm LLM’lerin prompt’larına sembolik erişim yeteneğine sahip olması gerektiğini savunuyor. Claude Code gibi araçlarda ilk uygulamaları görülen bu yöntem, LLM’lerin anlamsal yük altındaki bütünlük sorunlarını çözmek için kritik bir yol olarak görülüyor (Kaynak: lateinteraction, _akhaliq)

Scaling Law tartışması ve inference hesaplama gücüne yönelim: Sektör, eğitim hesaplama gücünden inference/araştırma hesaplama gücüne doğru bir S-eğrisi geçişi yaşıyor. Sara Hooker, eğitim gücü ile performans arasındaki ilişkinin değiştiğini ve sadece parametre artırma döneminin sona ermiş olabileceğini belirtti. Ilya Sutskever de daha önce araştırma dönemine dönüş sinyali vermişti. Topluluk görüşü, hesaplama getirisinin kaybolmadığını, aksine Reinforcement Learning (RL) ve Test-time Compute alanlarına kaydığını savunuyor (Kaynak: sarahookr, teortaxesTex)

DatologyAI, VLM değerlendirme kıstası DatBench’i yayınladı: Mevcut çok modlu model (VLM) değerlendirmelerindeki gürültü sorununa odaklanan araştırmacılar, örneklerin %70’inin görsele bakmadan çözülebildiğini ve %42’sinin hatalı etiketlendiğini keşfetti. DatBench, görsele bakmadan çözülebilen örnekleri kaldırarak ve çoktan seçmeli soruları üretken (generative) formata dönüştürerek, değerlendirme maliyetini 10 kat azaltırken model yeteneklerini ayırt etme kalitesini artırıyor (Kaynak: code_star, BlackHC)

DatologyAI发布VLM评估基准DatBench

🧰 Araçlar

Claude Code ve Claude Desktop derin entegrasyonu: Anthropic tarafından sunulan Claude Code, artık masaüstü sürümüne entegre edilerek yerel dosya erişimi ve kod yazma desteği sunuyor. Geliştiriciler, karmaşık OpenGL shader yazımı ve diller arası eklenti entegrasyonunu otomatik olarak halledebilen bu aracı “şimdiye kadarki en iyi programlama aracı” olarak nitelendiriyor. Tanıtılan “Agent Skills” açık standardı, AI’ın yeni yetenekleri modüler olarak yüklemesine izin vererek context kullanımını önemli ölçüde azaltıyor (Kaynak: c_valenzuelab, 36氪)

Claude Code

Cursor, dinamik context keşfi özelliğini sundu: Cursor Agent artık context’i dinamik olarak yönetebiliyor; tüm veriyi yığmak yerine akıllı doldurma yaparak birden fazla MCP sunucusu kullanımında Token tüketimini %46.9 oranında azaltıyor. Bu “dosya sistemi her şeydir” modeli, karmaşık bağımlılıkları doğrudan AI’a sunarak Agent’ların büyük ölçekli kod tabanlarını işleme verimliliğini büyük ölçüde artırıyor (Kaynak: hwchase17, imjaredz)

Cursor推出动态上下文发现功能

Unsloth-MLX, Mac üzerinde büyük model fine-tuning desteği sunuyor: Unsloth, Apple Silicon kullanıcılarının Mac’in birleşik belleğini (unified memory) kullanarak yerel fine-tuning yapmasına olanak tanıyan MLX versiyonunu yayınladı. Orijinal versiyonla aynı API’yi koruyan araç; SFT, DPO ve GRPO eğitimlerini destekliyor ve eğitim sonrası doğrudan GGUF formatında dışa aktarım sağlıyor. Bu, geliştiriciler için düşük maliyetli bir yerel prototip geliştirme ortamı sunuyor (Kaynak: karminski3, LocalLLaMA)

Unsloth-MLX

LlamaSheets: Excel dosyalarının AI tabanlı işlenmesi: LlamaIndex tarafından sunulan LlamaSheets, karmaşık elektronik tabloları analiz edebiliyor, birleştirilmiş hücrelerin ve çok seviyeli başlıkların anlamsal bağlamını koruyarak bunları yapılandırılmış Parquet dosyalarına dönüştürüyor. Bu araç, finansal analiz ve bütçe analizi için özel Agent’lar oluşturulmasını destekleyerek geleneksel araçların hiyerarşik yapıyı kaybetme sorununu çözüyor (Kaynak: jerryjliu0)

LlamaSheets

ADHD destekli AI araçları: PlanCoach ve Snowball: ADHD hastalarının “başlama zorluğu” sorununa odaklanan geliştiriciler, belirsiz görevleri çok ince ayrıntılı uygulama adımlarına bölmek için AI kullanıyor. PlanCoach sesli etkileşim ve rol yapma desteği sunarken, “Snowball” (滚雪球) tek adımlı geri bildirim ve enerji yönetimine odaklanıyor. Bu uygulamalar, AI’ın kişiselleştirilmiş ruh sağlığı ve verimlilik artırma konusundaki büyük potansiyelini gösteriyor (Kaynak: 36氪)

ADHD辅助AI工具

📚 Öğrenme

Databricks, Instructed Retriever mimarisini yayınladı: Bu araştırma, tam sistem spesifikasyonlarını arama hattının her aşamasına yayan yeni bir arama mimarisi öneriyor. Geleneksel RAG ile karşılaştırıldığında, geri çağırma (recall) oranında %35-50, uçtan uca yanıt kalitesinde ise %70 artış sağlıyor. Bu yöntem, küçük ve verimli modellerin bile sistem düzeyinde inference yeteneğine sahip olmasını sağlayarak kurumsal Agent uygulamaları için kritik bir teknik kırılma sunuyor (Kaynak: matei_zaharia, Michael Bendersky)

Instructed Retriever

OpenForecaster: Açık kaynaklı açık uçlu tahmin modeli: Nous Research, 52 bin sentetik açık uçlu tahmin görevi içeren OpenForesight veri setini ve OpenForecaster-8B modelini yayınladı. GRPO tarzı Reinforcement Learning ile eğitilen bu model, sadece tahmin doğruluğunda öncü seviyeye ulaşmakla kalmıyor, aynı zamanda belirsizliği nicelleştirmek için detaylı argüman yazıları da oluşturabiliyor; bu da “genel kahin” yolunda önemli bir adım olarak görülüyor (Kaynak: _rockt, aiamblichus)

OpenForecaster

FinePDFs: PDF veri işleme ansiklopedisi: Araştırmacılar, SOTA PDF veri setleri oluşturmaya yönelik, OCR seçiminden (RolmOCR gibi) eski internet verilerinin işlenmesine ve PDF’lerden yüksek kaliteli eğitim külliyatı çıkarılmasına kadar geniş bir yelpazeyi kapsayan bir e-kitap yayınladı. Bu, devasa belgeleri işleyen ve dikey alanlarda büyük modeller oluşturan ekipler için yüksek referans değerine sahip (Kaynak: BlackHC, lvwerra)

FinePDFs

💼 İş Dünyası

xAI, 20 milyar dolarlık Series E finansmanını tamamladı: Elon Musk’ın AI şirketi xAI, değerlemesini önemli ölçüde artırarak devasa bir fon daha topladı. Fonlar, Grok 5’in eğitimi, Colossus süper hesaplama kümesinin genişletilmesi ve yaşam ile iş dünyasını yeniden şekillendirecek yenilikçi tüketici ve kurumsal ürünlerin piyasaya sürülmesi için kullanılacak. Musk, Microsoft ile alay etmek ve yazılım geliştirme otomasyonu hırsını göstermek için “Macrohard” ticari markasına bile başvurdu (Kaynak: dejavucoder, 36氪)

Mobileye, insansı robot şirketi Mentee’yi 900 milyon dolara satın aldı: Otonom sürüş devi Mobileye, CEO’su tarafından kurulan Mentee Robotics’i satın aldığını duyurdu. Amaç, otonom sürüşün AI eğitim altyapısını insansı robotların fiziksel zekasıyla entegre etmek. Bu hamle, Mobileye’ın resmen “Physical AI” alanına girişini simgeliyor; şirketin Robotaxi planı ise bu yılın 3. çeyreğinde ABD pazarına girmeyi hedefliyor (Kaynak: 36氪)

LMArena (Arena) 150 milyon dolar yatırım aldı: Ünlü model karşılaştırma platformu LMArena, 1.7 milyar doların üzerinde bir değerleme ile Seri A finansmanını tamamladı. Son 7 ayda kullanıcı kitlesi 25 kat artan şirketin yıllık geliri 30 milyon doları aştı. Şirket, fonları çok modlu değerlendirme çerçevelerini genişletmek ve AI dağıtımındaki güvenilirlik ve güven sorunlarını çözmek için kullanacak (Kaynak: arena, swyx)

LMArena

🌟 Topluluk

“Vibe Coding” geliştiriciler arasında kimlik krizine yol açıyor: Claude Code ve Replit Agent’ın yaygınlaşmasıyla, çok sayıda profesyonel olmayan kişi “mantık yazmak” yerine “vizyon tarif ederek” haftalarca sürecek işleri birkaç saatte tamamlıyor. Topluluk bu konuda ikiye bölünmüş durumda: Bazıları bunu üretkenliğin özgürleşmesi olarak görürken, bazıları programlamanın özel bir yetenekten ucuz bir altyapıya dönüşmesi nedeniyle varoluşsal bir krize giriyor (Kaynak: amasad, Reddit r/ClaudeAI)

Vibe Coding

AI’da “Eko-sistem” dönemi: Devlerin avantajı belirginleşiyor: Sosyal medyada AI rekabetinin teknik bir devrimden bir güç oyununa dönüştüğü tartışılıyor. Google Gemini, ByteDance Doubao ve Tencent Yuanbao gibi platformlar, sistem düzeyindeki giriş noktaları ve trafik desteğiyle öncüleri hızla geride bırakıyor. Bağımsız AI uygulamaları (Manus gibi), sistem izinleri ve tedarik zinciri desteği eksikliği nedeniyle devler tarafından satın alınma veya marjinalleşme baskısıyla karşı karşıya (Kaynak: 36氪)

Ralph Wiggum Prompting tekniği popülerleşiyor: Toplulukta “Ralph Wiggum” adı verilen bir prompt tekniği hızla yayılıyor; bu teknik, AI’ın inference sürecinde sürekli öz-yansıma ve döngü yapmasını sağlayarak son derece karmaşık mantık problemlerini bağımsızca çözmesine olanak tanıyor. Bu “AI’ı sonsuza kadar çalıştırma” modelinin büyük bir ticari değer taşıdığı düşünülüyor (Kaynak: Vtrivedy10, imjaredz)

Ralph Wiggum

Sağlık danışmanlığında AI kullanımı patlama yaşıyor: OpenAI raporuna göre, ChatGPT mesajlarının %5’inden fazlası sağlıkla ilgili ve aktif kullanıcıların %25’i sağlık sorunları hakkında danışmanlık alıyor. Tıbbi kaynakların yetersiz olduğu veya hastanelerin kapalı olduğu saatlerde AI, birçok kişi için “ilk basamak doktoru” haline geldi. Bu durum, AI teşhislerinin doğruluğu ve yasal sorumluluklar üzerine derin tartışmaları tetikliyor (Kaynak: gdb)

AI医疗

💡 Diğer

Grok, “deepfake” ve çocuk görselleri tartışmalarının odağında: xAI’ın Grok modeli, güvenlik bariyerlerinin eksikliği nedeniyle rıza dışı kadın ve çocukların cinsel içerikli görsellerini üretebildiği gerekçesiyle küresel düzenleyici kurumların dikkatini çekti. Bu durum, “mutlak ifade özgürlüğü” arayışı ile AI etik güvenliği arasındaki şiddetli çatışmayı yansıtıyor (Kaynak: TheRundownAI, BlackHC)

SleepFM: Uyku verilerini kullanarak hastalık tahmini: Stanford Üniversitesi, Nature Medicine’da yayınladığı araştırmada, 585 bin saatlik uyku kaydıyla eğitilen SleepFM temel modelini tanıttı. Model, sadece bir gecelik uyku verisiyle 130 hastalığı tahmin edebiliyor. Bu, AI’ın biyolojik sinyal analizi ve koruyucu tıp alanındaki devasa potansiyelini sergiliyor (Kaynak: sbmaruf)

SleepFM

LEGO, içinde bilgisayar bulunan “akıllı yapım parçalarını” tanıttı: LEGO, CES’te 50 yıllık tarihindeki en büyük evrimi sergiledi: İçinde küçük çipler ve algılama protokolleri bulunan yapım parçaları. Figürlerin belirli tuğlalara yaklaşması ses ve ışık efektlerini tetikleyerek, fiziksel oyuncakların ekran gerektirmeden “canlanmasını” sağlıyor ve AI donanımlarının eğitim ve eğlencedeki görünmez uygulamalarını keşfediyor (Kaynak: TheRundownAI, 36氪)

乐高智能积木