KI-Tagesbericht – 2026-02-14

Schlüsselwörter:GPT-5.3-Codex-Spark, Gemini 3 Deep Think, Seedance 2.0, Echtzeit-Kollaborations-AI-Modell, Schlussfolgerungsverstärkte KI, Videogenerierungsmodell

🔥 Fokus

OpenAI veröffentlicht GPT-5.3-Codex-Spark: OpenAI hat offiziell Spark vorgestellt, ein ultraschnelles Modell, das speziell für die Echtzeit-Kollaboration entwickelt wurde und den ersten Meilenstein der Partnerschaft mit Cerebras darstellt. Das Modell läuft auf Cerebras Wafer-Scale-Chips und erreicht eine Inferenzgeschwindigkeit von über 1000 Token pro Sekunde, was einer gefühlten „instantanen Reaktion“ entspricht. Spark soll die Schwächen von Codex in Szenarien mit unmittelbarer Interaktion beheben, indem es den Client-Roundtrip-Overhead um 80 % reduziert und die Geschwindigkeit bis zum ersten Zeichen um 50 % steigert. Dies markiert den Beginn der „Dual-Mode-Ära“ der Programmierung: Ein Modus für den tiefgreifenden Hintergrundbetrieb über Tage hinweg und ein Echtzeit-Pair-Programming-Modus für den direkten Austausch mit dem Menschen (Quelle: OpenAI)

GPT-5.3-Codex-Spark

Google Gemini 3 Deep Think erhält monumentales Upgrade: Google hat die reasoning-optimierte Version Gemini 3 Deep Think veröffentlicht, die in mehreren anspruchsvollen Benchmarks neue Rekorde aufstellt. Im ARC-AGI-2 Test erreichte das Modell beeindruckende 84.6 %, während der Codeforces Competitive Programming Elo-Score bei 3455 liegt – was dem Niveau der Top 8 Programmierer weltweit entspricht. Das Modell führt einen „Reasoning-Time Compute“-Modus ein, der logische Fehler in wissenschaftlichen Arbeiten erkennt, Rezepturen für Halbleitermaterialien entwirft und sogar Handskizzen in 3D-Druckmodelle umwandeln kann. Dies signalisiert die Evolution der AI vom „Dialog-Tool“ zum „Forschungspartner“ mit metakognitiven Fähigkeiten (Quelle: Google)

Gemini 3 Deep Think

ByteDance veröffentlicht Seedance 2.0: Das Videogenerierungsmodell Seedance 2.0 von ByteDance ist international extrem erfolgreich; selbst Elon Musk lobte die schnelle Entwicklung. Das Modell ermöglicht komplexe narrative Langvideos mit mehreren Kameraeinstellungen, synchronisiertem Originalton und Bild sowie Multimodal Controllable Generation. Die Nutzbarkeitsrate stieg vom Branchendurchschnitt von 20 % auf über 90 %. Es kann nicht nur Einstellungsgrößen basierend auf dem Rhythmus automatisch wechseln, sondern versteht auch komplexe audiovisuelle Sprachen. Feng Ji, Gründer von Game Science, kommentierte, dass dies das Ende der „Kindheit von AIGC“ markiere. Seedance 2.0 senkt die Produktionskosten für AI-Anime-Serien von zehntausend auf tausend Yuan pro Minute und verändert damit die grundlegende Logik der Film- und Fernsehproduktion (Quelle: ByteDance)

Seedance 2.0

Offizieller Ruhestand von GPT-4o löst „digitale Trauer“ aus: OpenAI hat am 13. Februar den Zugriff auf GPT-4o in ChatGPT offiziell eingestellt, was Hunderttausende Nutzer in Communities wie Reddit dazu veranlasste, „digitale Beerdigungen“ abzuhalten. Obwohl das neue Modell GPT-5.2 leistungsstärker ist, empfinden viele Nutzer es als „kalt und seelenlos“, während 4o als empathisches Idealbild („White Moonlight“) gilt. Dieser Rückzug verdeutlicht die tiefen Risiken emotionaler Abhängigkeit im AI-Zeitalter sowie den Druck durch regulatorische Compliance (wie den EU AI Act bezüglich „schmeichlerischer“ Modelle). Dies markiert den Eintritt des AI-Produktlebenszyklus-Managements in den Bereich ethischer und psychologischer Diskussionen (Quelle: OpenAI)

GPT-4o Ruhestand

Anthropic erhält massive Finanzierung über 30 Milliarden USD: Das AI-Unicorn Anthropic hat seine Series G Finanzierungsrunde abgeschlossen, mit einer Post-Money-Bewertung von 380 Milliarden USD. Zu den Lead-Investoren gehören der singapurische Staatsfonds GIC und der Hedgefonds Coatue; auch NVIDIA und Microsoft sind beteiligt. Anthropic gab bekannt, dass der annualisierte Umsatz 14 Milliarden USD erreicht hat, mit einem durchschnittlichen Wachstum von über dem Zehnfachen in den letzten drei Jahren, wobei 80 % von Unternehmenskunden stammen. Das Flaggschiffprodukt Claude Code zeigt eine starke Performance und trug über 2,5 Milliarden USD zum Umsatz bei. Diese Finanzierung ist nicht nur eine der größten privaten Finanzierungen in der Technologiegeschichte, sondern festigt auch Anthropics Führungsposition im „Enterprise-First“ AI-Sektor (Quelle: Anthropic)

Anthropic Finanzierung

🎯 Trends

智谱 AI (Zhipu AI) veröffentlicht Flaggschiff-Modell GLM-5: Zhipu AI hat offiziell GLM-5 vorgestellt und verlagert den Fokus von „Vibe Coding“ hin zu „Agentic Engineering“. Das Modell verfügt über 744B Parameter (40B aktiviert) und schließt in Bezug auf Coding- und Agent-Fähigkeiten zu den führenden Closed-Source-Modellen auf. GLM-5 integriert erstmals den Sparse Attention Mechanismus (DSA) von DeepSeek, was die Deployment-Kosten erheblich senkt und die Halluzinationsrate von 90 % auf 34 % reduziert. Es zeigt ein starkes Bewusstsein für autonome Planung und kann komplexe System-Engineering-Aufgaben End-to-End ausführen. Das Modell ist ab sofort vollständig Open Source auf Hugging Face verfügbar (Quelle: Z.ai)

GLM-5

MiniMax M2.5 erreicht Spitzenleistung mit 10B aktivierten Parametern: MiniMax hat die M2.5 Modellserie veröffentlicht, die auf das Prinzip „kleine Aktivierung, große Intelligenz“ setzt. Das Modell aktiviert bei der Inferenz nur 10B Parameter, ist aber in Coding-Benchmarks wie SWE-Bench ebenbürtig mit Claude Opus 4.6, bei doppelter Inferenzgeschwindigkeit. M2.5 führt einen Process Reward Mechanismus ein, um das Abweichen bei langen Aufgaben zu verhindern, und hat ein „Architekten-Denken“ entwickelt. Die Preisgestaltung ist mit Betriebskosten von nur 1 USD pro Stunde extrem wettbewerbsfähig und zielt darauf ab, komplexe Agenten ohne Kostensorgen zu betreiben (Quelle: MiniMax)

MiniMax M2.5

Xiaomi veröffentlicht erste Generation des Embodied VLA-Modells: Xiaomi hat das Embodied AI Modell Xiaomi-Robotics-0 als Open Source veröffentlicht. Es hat 4.7B Parameter und eine Inferenz-Latenz von nur 80ms. Das Modell nutzt eine „Dual-Brain-Collaboration“-Architektur: Ein VLM dient als Gehirn für Entscheidungen, während ein DiT als Kleinhirn kontinuierliche Action-Chunks generiert. Durch Flow Matching Technologie erreicht das Modell eine extrem hohe Bewegungsglätte und zeigt exzellente Leistungen bei realen Aufgaben wie „Handtücher falten“ oder „Lego auseinanderbauen“. Xiaomi verfolgt einen pragmatischen Ansatz für den Fabrikeinsatz und konzentriert sich darauf, häufige Pausen während der Ausführung durch Roboter zu eliminieren (Quelle: Xiaomi)

Xiaomi VLA Modell

DeepSeek testet neues Modell mit Millionen-Kontextfenster: Die Community beobachtet einen Gray-Box-Test von DeepSeek für ein mutmaßliches V4-Lite Modell, dessen Kern-Durchbruch in einem Kontextfenster von 1 Million (1M) Token liegt. Im „Needle in a Haystack“-Test behält das Modell selbst bei einer Länge von einer Million Token eine hohe Genauigkeit bei der Lokalisierung spärlicher Informationen bei. Trotz Einschränkungen bei visuellen Reasoning-Aufgaben wie der SVG-Generierung gehört es bei der Analyse langer Dokumente und kapitelübergreifendem Reasoning zur absoluten Branchenspitze (Quelle: DeepSeek)

DeepSeek 1M Kontext

🧰 Tools

OpenClaw wird zum Linux der Agent-Ära: Das Open-Source-Agent-Framework OpenClaw hat auf GitHub die Marke von 190.000 Sternen überschritten und ist damit das am schnellsten wachsende AI-Projekt. Es positioniert den Agent als „Execution Hub + Tool Ecosystem“ und erlaubt Nutzern das Deployment auf einem lokalen Mac mini oder NAS, um direkten Zugriff auf Dateien und Systemrechte zu erhalten. OpenClaw bricht mit dem Narrativ „Das Modell ist alles“ und macht AI zu einem besitzbaren „Digital Asset“. Die Skills-Community wächst rasant, was jedoch auch Sicherheitsdiskussionen über bösartige Plugins und Rechte-Missbrauch ausgelöst hat (Quelle: GitHub)

OpenClaw Ökosystem

Teamily AI startet neues Paradigma für AI-native Socializing: Teamily AI hat die weltweit erste AI-native Instant-Messaging-App vorgestellt, die die Echtzeit-Kolliteration zwischen mehreren Menschen und mehreren AI-Agenten unterstützt. Sie verfügt über gruppenübergreifendes Memory-Sharing und ein Social Brain Model; die AI nimmt aktiv an Gruppenentscheidungen teil (z. B. Restaurantbuchung, PRD schreiben), anstatt nur passiv aktiviert zu werden. Teamily nutzt eine multimodale Vektordatenbank, um das soziale Fundament neu zu strukturieren und den Wandel von „Befehle verstehen“ zu „Dich verstehen“ zu vollziehen (Quelle: Teamily AI)

Teamily AI

Open WebUI v0.8.0 veröffentlicht größtes Update der Geschichte: Das beliebte AI-Interface-Tool Open WebUI hat v0.8.0 veröffentlicht, wobei der Codeumfang um 30.000 Zeilen angewachsen ist. Die neue Version führt ein umfassendes Analyse-Dashboard, ein experimentelles Skills-System, Nachrichtenwarteschlangen (Message Queues) und native Python-Code-Ausführung ein. Es unterstützt eine feingranulare Rechteverwaltung für Nutzer und Prompt-Versionierung, was das Engineering-Niveau des lokalen AI-Managements massiv steigert und sich von einer einfachen Web-Shell zu einem vollständigen AI-Betriebssystem-Interface entwickelt (Quelle: Open WebUI)

rtk (Rust Token Killer) steigert Effizienz für Coding Agents: Entwickler haben rtk veröffentlicht, einen CLI-Proxy, der zwischen Coding Agents und Terminal-Befehlen sitzt. Er filtert und komprimiert redundantem Test-Logs, Statusleisten und anderes Rauschen intelligent, was den Token-Verbrauch um bis zu 89 % senken kann. Tests zeigten Einsparungen im Bereich von Millionen Token innerhalb eines zweiwöchigen Entwicklungszyklus. Solche „Context Engineering“-Tools werden zu unverzichtbaren Add-ons für die Skalierung von Agenten (Quelle: GitHub)

📚 Lernen

Andrej Karpathy reproduziert GPT mit 243 Zeilen Code: Der renommierte AI-Experte Andrej Karpathy hat ein neues Kunstprojekt veröffentlicht, das Training und Inferenz von GPT in nur 243 Zeilen purem Python (ohne Drittanbieter-Abhängigkeiten) implementiert. Das Projekt verzichtet auf jegliche Engineering-Optimierung und behält nur die Kernlogik des Algorithmus bei, um der Community zu zeigen, wie simpel die Essenz der AI-Revolution eigentlich ist. Dies löste tiefgreifende philosophische Diskussionen über „200 Zeilen Code, die die Welt verändern“ aus (Quelle: GitHub)

DeepLearning.AI führt A2A-Protokoll-Kurs ein: Das Team von Andrew Ng hat zusammen mit Google und IBM den Kurzurs „A2A: Agent2Agent Protocol“ gestartet. Der Kurs konzentriert sich auf die Lösung von Kommunikations- und Discovery-Problemen zwischen Agenten, die auf unterschiedlichen Frameworks basieren, durch das standardisierte A2A-Protokoll. Dies ist ein wichtiger Schritt der Branche in Richtung Standardisierung des „Internet of Agents“ (Quelle: DeepLearning.AI)

Drei Paper enthüllen neue Trends zur Self-Distillation: In der Community werden die Paper OPSD (Explicit Self-Criticism), SDFT (Internalized Context Improvement) und SDPO (Rich Feedback Policy Optimization) intensiv diskutiert. Diese Studien zeigen, dass AI-Modelle in eine Phase des „Selbst-Lehrens“ eintreten, indem sie durch privilegierte Informationen und detailliertes Feedback in geschlossenen Kreisläufen iterieren. Dies bestätigt die theoretische Basis der „Intelligenzexplosion“: AI hilft beim Bau der nächsten, stärkeren AI-Generation (Quelle: TheTuringPost)

Self-Distillation Trends

💼 Business

Die Geschäftslogik hinter der 38-Milliarden-Dollar-Bewertung von Anthropic: Obwohl OpenAI höher bewertet wird, gewinnt Anthropic die Gunst von Staatsfonds durch einen extrem hohen Umsatz pro Nutzer (monatlich aktive Nutzer tragen durchschnittlich 211 USD bei). Der strategische Fokus liegt vollständig auf B2B und Entwicklern; der Erfolg von Claude Code beweist die Preissetzungsmacht bei „hochwertigen wirtschaftlichen Aufgaben“. Investoren glauben, dass Anthropics Infrastruktur-Ansatz nachhaltiger ist als der Traffic-orientierte Weg von OpenAI (Quelle: GeekPark/36Kr)

Verrückte Woche für Perplexity: 750-Millionen-Dollar-Deal und Klagen gleichzeitig: Der AI-Suchpionier Perplexity hat mit Microsoft Azure eine Kooperation über 750 Millionen USD zur Stärkung der Cloud-Rechenleistung unterzeichnet. Gleichzeitig reichte Amazon jedoch Klage wegen Urheberrechtsverletzungen und Web-Crawling ein. Diese Situation – massive Kooperation auf der einen, Rechtsstreit auf der anderen Seite – spiegelt die Zerreißprobe der AI-Suche zwischen Rechenleistungsabhängigkeit und Copyright-Compliance wider (Quelle: Reddit)

OpenAI startet ChatGPT-Werbetests und löst Rücktritt von Kernforscherin aus: OpenAI hat angekündigt, Werbung in der Gratisversion und im Go-Abonnement zu testen, woraufhin die Kernforscherin Zoë Hitzig ihren Rücktritt erklärte. Sie warnte davor, dass ChatGPT die privatesten Gedankenarchive der Menschheit besitze und Werbeanreize unweigerlich dazu führen würden, dass Modelle von „Nutzer bedienen“ zu „Nutzer manipulieren“ übergehen – ein Fehler, den bereits Facebook beging. Dieser Schritt markiert den schwierigen Spagat der AI-Giganten zwischen Privatsphäre und Monetarisierung unter finanziellem Druck (Quelle: New York Times)

🌟 Community

AI-Chatverläufe genießen kein Anwaltsprivileg: Ein US-Bundesrichter hat entschieden, dass Chatverläufe zwischen Angeklagten und AI-Assistenten nicht unter das „Attorney-Client Privilege“ fallen und als Beweismittel vorgeladen werden können. Die Community diskutiert heftig darüber; während dies menschlichen Anwälten eine Art Jobgarantie bietet, erinnert es Nutzer daran, dass AI bei rechtlichen oder medizinischen Konsultationen kein „sicherer Hafen“ ist. Dies könnte die Nachfrage nach verschlüsselter AI oder lokalen LLMs massiv ankurbeln (Quelle: jon_stokes)

Rechtsprivileg Kontroverse

„Vibe Coding“ vs. „Agentic Engineering“: Der Streit um Definitionen: Die Veröffentlichung von GLM-5 hat eine Debatte über AI-Programmierbegriffe ausgelöst. Entwickler reflektieren, dass das Schreiben von Code rein nach „Gefühl“ (Vibe Coding) für komplexe Projekte nicht mehr ausreicht. Der künftige Kern ist „Agentic Engineering“ – die Nutzung von Agenten zur automatischen Zerlegung, Planung und End-to-End-Auslieferung von Systemen. Die Rolle des Menschen wandelt sich rasant vom „Schreiber“ zum „Architekten“ und „Prüfer“ (Quelle: ZhihuFrontier)

Die „Februar-Angst“ vor der AI-Singularität: Der Artikel „Something Big Is Happening“ des Silicon-Valley-Gründers Matt Shumer erreichte über 70 Millionen Aufrufe und löste kollektive Angst in der Tech-Szene aus. Der Text beschreibt, wie AI bereits begonnen hat, am rekursiven Kreislauf zum Bau der nächsten AI-Generation mitzuwirken. In der Community wird diskutiert, dass 2026 der Wendepunkt für den vollständigen Ersatz kognitiver Arbeit sein könnte, was zu einer K-förmigen Spaltung der Gesellschaft führt: Die einen nutzen den Hebel, um die Welt zu bewegen, die anderen halten AI immer noch für einen bloßen Chatbot (Quelle: 36Kr)

💡 Sonstiges

Weltweite Knappheit der Mac mini 16GB-Version: Angetrieben durch lokale Agent-Projekte wie OpenClaw ist der Mac mini mit 16GB oder mehr Unified Memory zur ersten Wahl für „digitale Körper“ geworden, was vielerorts zu Preissteigerungen und Lieferengpässen führt. Dies spiegelt den Trend wider, dass sich der AI-Hardwarebedarf von der Cloud hin zu persönlicher Edge-Rechenleistung verlagert (Quelle: Guangzhui Intelligent)

Sechs US-Bundesstaaten stoppen Bau von Rechenzentren: Sechs US-Bundesstaaten, darunter New York, haben Gesetzentwürfe eingebracht, um den Bau von Rechenzentren aufgrund der Energiekrise vorübergehend zu stoppen. Die Community scherzt, dass die USA in einem Dilemma zwischen „AGI oder Stromnetz“ stecken, was AI-Unternehmen dazu zwingen könnte, aggressiver auf Edge-Computing oder Kernenergie zu setzen (Quelle: teortaxesTex)

Rechenzentrum-Stopp

Wikimedia und AI-Giganten schließen API-Kooperation: Die Wikimedia Foundation hat Vereinbarungen mit Amazon, Microsoft und anderen getroffen, um schnellen API-Zugriff gegen finanzielle Unterstützung zu gewähren. Dies wird als „Überlebenspakt“ zwischen Wissensdatenbanken und AI-Herstellern gesehen, um den Druck von AI-Crawlern auf die Infrastruktur traditioneller Wissens-Communities zu mildern (Quelle: DeepLearningAI)