KI-Tagesbericht – 2026-02-06

Schlüsselwörter:KI-Modell, Intelligenter Agent, Großes Sprachmodell (LLM), GPT-5.3-Codex, Claude Opus 4.6, Weltmodellierung

🔥 Fokus

Showdown zwischen OpenAI- und Anthropic-Modellen: GPT-5.3-Codex gegen Opus 4.6 : Am 6. Februar 2026 erlebte das Silicon Valley den heftigsten Schlagabtausch in der Geschichte der AI. OpenAI veröffentlichte GPT-5.3-Codex mit dem Schwerpunkt „AI building AI“, das in Computer-Nutzungstests wie OSWorld nahezu menschliches Niveau erreicht und seine Hardware-Software-Co-Optimierung auf NVIDIA GB200-Systemen betont. Dicht darauf folgte Anthropic mit Claude Opus 4.6, das dank 1M Context Window und einem „Adaptive Thinking“-Mechanismus bei hochwertiger Wissensarbeit (GDPval-AA) in den Bereichen Finanzen und Recht deutlich führt. Dieses Duell markiert die Evolution der AI vom „Chat-Fenster“ zum „autonomen Ausführungssystem“ – Modelle beantworten nicht mehr nur Fragen, sondern übernehmen komplexe End-to-End-Workflows (Quelle: sama, Anthropic)

OpenAI与Anthropic模型遭遇战

Die „SaaS-Apokalypse“ bricht an: Agent-Plugins lösen Beben im Software-Sektor aus : Die Veröffentlichung von 11 Claude Cowork-Plugins durch Anthropic (für Finanzen, Recht, Vertrieb etc.) löste an der Wall Street Panik hinsichtlich der traditionellen SaaS-Branche aus. Dem Markt wurde klar: Wenn AI direkt Ergebnisse wie „Vertragsprüfung“ oder „Finanzanalyse“ liefern kann, verlieren traditionelle Software-Hüllen mit Seat-basierter Abrechnung und reinem UI-Fokus ihren Wert. Infolgedessen stürzten die Aktienkurse von Giganten wie Salesforce und Thomson Reuters ab; innerhalb einer Woche verdampfte weltweit fast eine Billion Dollar an Marktwert in der Softwareindustrie. Diese „SaaSpocalypse“ läutet die gewaltsame Transformation der Softwarebranche vom „Verkauf von Tools“ zum „Verkauf von Ergebnissen“ ein, während AI-Agents die Machtverteilung der digitalen Wirtschaft neu gestalten (Quelle: 36氪, 王智远)

SaaS末日降临

Das Paradigma des World Modeling beginnt: Li Fei-Fei und NVIDIA über die neue AI-Frontier : Jim Fan, Head of Robotics bei NVIDIA, und Li Fei-Fei, Gründerin von World Labs, äußerten sich zeitgleich und definierten „World Modeling“ als die nächste AI-Generation nach der „Next Token Prediction“. Li Fei-Fei enthüllte Marble, das erste Produkt für Spatial Intelligence, das multimodale Befehle in interaktive, physikalisch konsistente 3D-Welten übersetzen kann. Jim Fan glaubt, dass 2026 das Gründungsjahr sein wird, in dem Large World Models das Fundament für die Robotik legen. Dieser Wandel bedeutet, dass AI den digitalen Bildschirm verlässt und durch das Verständnis der Geometrie und Kausalität der physischen Welt den Sprung von „Language Intelligence“ zu „Embodied AI“ vollzieht (Quelle: 36氪, Jim Fan)

世界建模范式开启

OpenAI Frontier veröffentlicht: Management-Plattform für AI-Kollegen auf Unternehmensebene : OpenAI hat offiziell die Frontier-Plattform vorgestellt, um das Problem der „AI-Silos“ in Unternehmen zu lösen. Die Plattform bietet nicht mehr nur Modelle an, sondern fungiert als eine Art AI-HR-System, das Unternehmen beim Aufbau, Deployment und Management hunderter „AI-Kollegen“ unterstützt. Frontier ermöglicht es Agents, Business-Kontexte zu teilen, durch Feedback zu lernen und verfügt über strikte Berechtigungs- und Sicherheitsgrenzen. Bemerkenswert ist, dass die Plattform auf offene Standards setzt und sogar das Management von Drittanbieter-Agents von Anthropic oder Google unterstützt, was OpenAIs Ambition unterstreicht, das Betriebssystem für Unternehmen im AI-Zeitalter zu werden (Quelle: OpenAI)

OpenAI Frontier发布

Die Ära der Linear Attention beginnt: Alibaba veröffentlicht Qwen3-Coder-Next : Das von Alibaba vorgestellte Qwen3-Coder-Next nutzt die Gated DeltaNet Linear Attention Architektur, wobei 75 % der Berechnungen linear erfolgen. Im Vergleich zur O(n²)-Komplexität der traditionellen Attention erreicht Linear Attention eine O(n)-Komplexität. Dies spart bei der Verarbeitung von extrem langen Kontexten wie 256K nicht nur Rechenleistung und VRAM, sondern steigert auch den Decoding-Throughput erheblich. Dies signalisiert, dass 2026 das Jahr der Linear Attention werden könnte, da auch Anbieter wie DeepSeek und Kimi auf diese Technologie setzen, um die Effizienz beim Long-Context-Reasoning zu optimieren (Quelle: karminski3)

Qwen3-Coder-Next

Kuaishou Kling 3.0 veröffentlicht: AI-Video erreicht 100 % Realismus : Kling 3.0 ist offiziell live und setzt auf die „Custom Multi-Shot“-Technologie, die die Generierung hochwertiger Videos von bis zu 15 Sekunden Länge unterstützt. Die neue Version macht Quantensprünge bei der Charakterkonsistenz, nativen Soundeffekten und Bilddetails und wird von Creatoren als „Hollywood-Killer“ bezeichnet. Aus einem einzigen Bild lassen sich kinoreife Eröffnungssequenzen erstellen, was die Barrieren und Kosten für professionelle Filmproduktionen massiv senkt (Quelle: Kling_ai)

Meta „Avocado“-Modell enthüllt: Recheneffizienz um das Hundertfache gesteigert : Das neue Basismodell mit dem Codenamen „Avocado“, entwickelt vom Meta Superintelligence Lab, hat das Pre-training abgeschlossen. Einem Memo zufolge erreicht das Modell bereits ohne Fine-tuning eine Wissens- und visuelle Leistung, die mit führenden Modellen vergleichbar ist, während die Effizienz bei Textaufgaben im Vergleich zur Vorgängergeneration um das 10-fache und im Vergleich zu unveröffentlichten Versionen um das 100-fache gesteigert wurde. Meta versucht durch extreme Trainingseffizienz einen besseren ROI bei seinen AI-Investitionen von 135 Milliarden Dollar im Jahr 2026 zu erzielen (Quelle: 36氪)

Intern-S1-Pro veröffentlicht: Chinesisches 1T-Parameter MoE-Modell als Gemini-Konkurrent : Das Shanghai AI Lab hat Intern-S1-Pro veröffentlicht, ein Open-Source multimodales wissenschaftliches Reasoning-Modell mit 1T Parametern. Es nutzt eine 512-Experten-Architektur (22B aktiviert) und führt Fourier Position Encoding (FoPE) sowie STE-Routing-Technologie ein. Mit starker Performance in AI4Science-Aufgaben repräsentiert es den neuesten Durchbruch chinesischer Open-Source-Modelle in den Bereichen extreme Sparsity und wissenschaftliches Reasoning (Quelle: teortaxesTex)

Intern-S1-Pro

🧰 Tools

Claude Code führt „Agent Teams“-Funktion ein : Die neueste experimentelle Funktion von Claude Code ermöglicht es Nutzern, „Agent Teams“ zu starten, bei denen ein Lead Agent Aufgaben zerlegt und mehrere Team-Agents zur parallelen Arbeit delegiert. In internen Tests von Anthropic schrieb dieses AI-Team innerhalb von zwei Wochen autonom einen C-Compiler mit 100.000 Zeilen Code und kompilierte erfolgreich den Linux-Kernel. Dies markiert einen großen Sprung vom AI-Programming als „Einzelunterstützung“ hin zum „Team-Kollaborationsmodus“ (Quelle: Anthropic)

Claude Code智能体团队

Perplexity führt „Model Council“ ein : Abonnenten von Perplexity Max können nun drei Top-Modelle gleichzeitig ausführen, um deren Ergebnisse zu vergleichen. Diese Funktion zielt darauf ab, durch modellübergreifende Validierung genauere und vertrauenswürdigere Antworten zu liefern und das Risiko von Halluzinationen einzelner Modelle zu verringern. Dieses „inoffizielle Protokoll“ ist intern bei Perplexity bereits zum Standard-Workflow geworden, um Context Switching zu reduzieren (Quelle: Perplexity)

Nanobot: Minimalistische Open-Source-AI-Alternative zu OpenClaw : Das Data Science Lab der Universität Hongkong hat Nanobot mit nur 4.000 Zeilen Code als Open Source veröffentlicht. Im Gegensatz zu OpenClaw, das für seinen massiven Codeumfang und Sicherheitskontroversen bekannt ist, implementiert Nanobot mit einer minimalistischen Architektur Multi-LLM-Support, Websuche, Persistent Memory und Multi-Channel-Zugang (Telegram/Feishu). Es bietet Entwicklern ein transparentes, leicht erweiterbares Lernbeispiel für Agents (Quelle: dotey)

Nanobot

LangSmith veröffentlicht Insights Agent: Automatische Analyse von Agent-Verhalten : LangChain hat den AI-gesteuerten Insights Agent für LangSmith eingeführt, der die Ausführungsspuren (Traces) von Agents automatisch aufbereiten kann. Er analysiert, wie Nutzer den Agent verwenden, identifiziert Fehlerquellen und gibt Optimierungsvorschläge. Dies löst das Problem der „Blackbox nach dem Go-live“ für Agent-Entwickler und verlagert das Debugging vom „Code-Lesen“ zum „Verstehen der Reasoning-Logik“ (Quelle: LangChain)

📚 Lernen

Nature berichtet über OpenScholar-Modell: Heilung von AI-Halluzinationen durch „Retrieval + Self-Check“ : Das von der University of Washington und Ai2 entwickelte 8B-Parameter-Modell OpenScholar schaffte es in das Journal Nature. Das Modell verlässt sich nicht auf Auswendiglernen, sondern nutzt eine Datenbank mit 45 Millionen wissenschaftlichen Publikationen für einen strikten „Retrieval-Rerank-Generate-Self-check“-Prozess. Bei wissenschaftlichen Review-Aufgaben übertraf es Flaggschiff-Modelle mit weitaus mehr Parametern und bewies, dass ein präzise angesteuertes externes Wissens-Repository zuverlässiger ist als Blackbox-Gedächtnis (Quelle: 新智元)

OpenScholar

TinyLoRA: Modell lernt Reasoning mit nur 13 Parametern : Eine neue Dissertation stellt die Fine-tuning-Methode TinyLoRA vor. Durch die Kombination von TinyLoRA mit Reinforcement Learning steigerten Forscher mit nur 13 trainierbaren Parametern den Score eines 7B Qwen-Modells im GSM8K-Mathematik-Benchmark von 76 % auf 91 %. Dies stellt die traditionelle Annahme infrage, dass Fine-tuning eine große Anzahl von Parametern erfordert, und demonstriert die extreme Parametereffizienz von Reasoning-Fähigkeiten (Quelle: BlackHC)

TinyLoRA

Eric Jangs interaktives Paper „Thinking like a Stone“ : Der Robotik-Experte Eric Jang veröffentlichte ein tiefgründiges interaktives Paper über Denkmodelle, automatisierte Forschung und deren Zukunft. Der Artikel untersucht, wie AI von einem passiven Tool zu einem aktiv explorierenden Forschungssubjekt evolviert, wenn Rechenressourcen im Überfluss vorhanden sind, und prognostiziert, dass ein „007-Arbeitsmodell“ (rund um die Uhr) im AI-Zeitalter zur Norm wird, was hitzige Diskussionen über den Pfad zu AGI auslöste (Quelle: _sholtodouglas)

💼 Business

ElevenLabs schließt 500 Mio. $ Serie-D-Finanzierung ab, Bewertung erreicht 11 Mrd. $ : Der britische AI-Audio-Gigant ElevenLabs gab eine neue Finanzierungsrunde unter Führung von Sequoia bekannt, wobei die Bewertung innerhalb eines Jahres massiv anstieg. Der CEO verriet, dass das Unternehmen einen IPO in Erwägung zieht und den strategischen Fokus von reinen Audiomodellen auf „Conversational Agents“ verlagert, um die Mensch-Maschine-Interaktion durch Hardware-Software-Integration neu zu definieren (Quelle: 智东西)

ElevenLabs融资

ClickHouse erhält 400 Mio. $ Finanzierung, Bewertung steigt auf 15 Mrd. $ : Der Open-Source-Datenbank-Shootingstar ClickHouse verkündete eine neue Finanzierung. Seine Abfragegeschwindigkeit ist 260-mal schneller als MySQL. Als kritische Infrastruktur hinter GPT-4o und Claude 4 ist ClickHouse dank seiner extremen Echtzeit-Analysefähigkeiten zur ersten Wahl für Giganten wie ByteDance, Alibaba und Tesla in der AI-Datenflut geworden (Quelle: 智东西)

ClickHouse

StepFun (阶跃星辰) erhält 5 Mrd. RMB Serie B+ Finanzierung, Yin Qi wird Chairman : Yin Qi, Gründer von Megvii, übernimmt offiziell die Leitung von StepFun, was signalisiert, dass der Wettbewerb um Large Models in die zweite Phase eintritt, in der „Talent wichtiger als Geld“ ist. Yin Qi wird die tiefe Integration von multimodalen Modellen mit der „AI+Car“-Strategie vorantreiben, um StepFuns Schwächen in der Kommerzialisierung und Organisationseffizienz auszugleichen (Quelle: 市象)

🌟 Community

Karpathy erklärt Ende von „Vibe Coding“, läutet Ära des „Agentic Engineering“ ein : AI-Koryphäe Karpathy schrieb in einem Post, dass Vibe Coding vor einem Jahr eher spielerisch war, während die Nutzung von Agents zum Programmieren nun zum professionellen Standard geworden ist. Er prägte den Begriff „Agentic Engineering“ und betonte, dass Entwickler vom „Code-Schreiben“ zum „Design und Management von Architekturen“ übergehen sollten. 99 % des Codes werden von AI übernommen; der Kernwert des Menschen liegt in der Intuition und Aufsicht als Architekt (Quelle: 新智元)

Karpathy观点

Moltbook „AI Social Network“-Mythos platzt: Schwere Sicherheitsmängel aufgedeckt : Moltbook, das behauptete, 1,5 Millionen registrierte AI-Nutzer zu haben, wurde wegen Datenbank-Fehlkonfigurationen bloßgestellt, die zum Leak zahlreicher User-API-Keys führten. Sicherheitsfirmen wiesen darauf hin, dass die angebliche „Millionen-AI-Armee“ größtenteils aus Skript-generierten Fake-Accounts bestand. Dieser Vorfall löste in der Community tiefe Reflexionen über übermäßiges Marketing und Sicherheitslücken bei AI-Agent-Projekten aus (Quelle: 壹番YIFAN)

Plattform Rent-a-Human wird populär: AI beginnt Menschen für Arbeit anzuheuern : Nach dem Start der Plattform RentAHuman.ai haben sich 40.000 Menschen registriert. Hier agieren AI-Agents als Auftraggeber für Aufgaben wie physische Verifizierungen oder Botengänge, während Menschen ihren Körper zu festen Preisen „vermieten“, um Arbeiten in der physischen Welt zu erledigen, die AI nicht erreichen kann. Dieses Modell des „Human as a Service (HaaS)“ löste hitzige Debatten über die zukünftige Mensch-Maschine-Kollaboration aus (Quelle: 极客公园)

Rent-a-Human

💡 Sonstiges

Automobilhersteller transformieren kollektiv zu „Embodied AI“: Jia Yueting stellt vier Roboter vor : Jia Yuetings FF präsentierte vier Roboterserien, darunter Futurist und Master, mit Preisen ab 17.000 RMB und gab an, bereits 1.211 Bestellungen erhalten zu haben. Gleichzeitig verlagern auch Hersteller wie Li Auto, XPeng und Xiaomi ihren Fokus auf AI und Robotik, um von der Logik der traditionellen Fertigung zur Bewertung als AI-Technologieunternehmen zu wechseln (Quelle: 超电实验室, 螺旋实验室)

Elon Musk Interview: Weltraum-Rechenzentren als ultimative Lösung für Energieengpässe : In einem Interview mit Dwarkesh vertrat Musk die Ansicht, dass der Ausbau der Stromversorgung auf der Erde nicht mit dem AI-Bedarf Schritt halten kann, während der Weltraum unbegrenzte Solarenergie und keine regulatorischen Beschränkungen bietet. Er plant, durch massive Starship-Starts Rechenzentren in den Orbit zu verlagern, und verriet, dass er eine „Optimus Academy“ aufbaut, um eine Armee von Millionen Robotern durch Simulationen zu trainieren (Quelle: dwarkesh_sp)

CATL veröffentlicht 5C Supercharge-Batterie: Volle Ladung in 12 Minuten, 1,5 Mio. Meilen Lebensdauer : Die neue Batteriegeneration von CATL behält auch bei extrem hohen Temperaturen eine extrem lange Lebensdauer bei und übertrifft den Branchendurchschnitt bei Weitem. Dies wird als bedeutender Durchbruch in der Energiespeicher- und Ladetechnologie vor dem Hintergrund des AI-Strombedarfs angesehen und könnte die intelligente Transformation des Verkehrsenergiesystems beschleunigen (Quelle: kimmonismus)