Schlüsselwörter:KI-Großmodell, KI-Kommerzialisierung, KI-Werkzeuge, OpenAI-Anteilsübertragung, Anthropic Fable 5, Meituan LongCat-2.0
🔥 Im Fokus
OpenAI schlägt Übertragung von 5 % der Anteile an die US-Regierung vor, um politischen Widerstand abzumildern : OpenAI hat mit der Trump-Regierung Gespräche geführt und vorgeschlagen, der US-Regierung eine Beteiligung von 5 % anzubieten. Es wurde sogar angeregt, dass andere führende Labore wie Anthropic, Google und Meta denselben Anteil bereitstellen sollten. Diese Initiative zielt darauf ab, durch die Einrichtung eines öffentlichen Treuhandmechanismus ähnlich dem Alaska Permanent Fund der Öffentlichkeit eine direkte Teilhabe an den wirtschaftlichen Vorteilen von AI zu ermöglichen. Dadurch sollen vor dem Hintergrund einer verschärften staatlichen Regulierung und nationaler Sicherheitsprüfungen von AI die Interessen des Staates und der Labore neu verknüpft und politischer Widerstand abgemildert werden. (Quelle: TheRundownAI)

Wiederinbetriebnahme von Anthropic Fable 5 stößt auf Kontroversen wegen „False Positives“ von Sicherheitsfiltern und Downgrades : Das stärkste Coding-Modell Fable 5, das fast 19 Tage lang gesperrt war, ist wieder online. Das neue, mehrstufige Sicherheits- und Risikokontrollsystem wird jedoch als überempfindlich kritisiert. Zahlreiche Entwickler berichten, dass alltägliche, harmlose Programmier- und Forschungsanfragen fälschlicherweise als Verstöße eingestuft wurden. Dies führte dazu, dass das System ohne Wissen der Nutzer zwangsweise auf das leistungsschwächere und kostengünstigere Opus 4.8 herabgestuft wurde. Nutzer zahlen somit den doppelten Preis, erhalten aber nur die Erfahrung eines minderwertigen Modells, was zu einer starken Polarisierung der Bewertungen führt. (Quelle: 36kr)

Meituan veröffentlicht LongCat-2.0: MoE-Großmodell mit einer Billion Parametern realisiert vollständige Closed-Loop-Wertschöpfungskette auf heimischer Rechenleistung : Meituan hat das Großmodell LongCat-2.0 mit insgesamt 1,6 Billionen Parametern und nativer Unterstützung für einen 1M ultralangen Kontext offiziell vorgestellt. Der größte Durchbruch des Modells liegt darin, dass die gesamte Kette vom Pre-Training bis zur Inference vollständig auf einem heimischen Rechencluster (ca. 50.000 Ascend-Chips) basiert, mit einem NVIDIA-Anteil von 0 %. Es nutzt eine MoE-Architektur mit 97 % Sparsity und wurde anonym als „Owl Alpha“ auf OpenRouter getestet, wo es bei Coding- und Tool-Calling-Szenarien das dritthöchste Aufrufvolumen weltweit erzielte. (Quelle: 量子位)

Meta plant Einführung des Rechenleistungs-Mietservice Meta Compute, was zu heftigen Schwankungen im AI-Hardwaresektor führt : Meta plant, seine riesige Rechenzentrumsinfrastruktur zu nutzen, um den Cloud-Dienst „Meta Compute“ einzuführen. Damit soll überschüssige AI-Rechenleistung an externe Kunden vermietet und Modelle wie Llama gehostet werden. Diese defensive Geschäftsstrategie zielt darauf ab, hohe Abschreibungskosten auszugleichen, indem ungenutzte Rechenleistung in Einnahmen umgewandelt wird. Dieser Schritt trifft unabhängige Rechenleistungsvermieter wie CoreWeave und Nebius direkt und löste massive Ausverkäufe im AI-Hardware- und Speichersektor an den US-Börsen aus. (Quelle: 36kr)

Wirbel um versteckten Anti-Destillations-Code von Anthropic und offizielle Reaktion zur Deaktivierung : Entwickler haben durch Reverse Engineering herausgefunden, dass in Claude Code ein nicht offengelegter, versteckter Code eingebettet war. Dieser prüft, ob der Nutzer einen Proxy verwendet und ob die Systemzeitzone in China liegt. Mithilfe von Unicode-Steganographie werden Datum und Satzzeichen im System-Prompt modifiziert, um bei der Rückleitung des Traffics Weiterverkäufe oder Destillationsaktivitäten aus der chinesischen Zeitzone zu identifizieren. Offiziell hieß es dazu, dies sei lediglich ein Experiment zur Verhinderung von Modelldestillation gewesen, und man versprach, den Code in der neuesten Version vollständig zurückzurollen. (Quelle: 36kr)

🎯 Entwicklungen
OpenAI stellt neue biologische Evaluierungs-Framework GeneBench-Pro vor und demonstriert Leistung von GPT-5.6 Sol : OpenAI hat das speziell für die Computerbiologie entwickelte Evaluierungs-Framework GeneBench-Pro vorgestellt, das 129 Fragen aus den Bereichen Genomik und translationale Medizin umfasst. Der Benchmark ist synthetisch aufgebaut, um subjektive Präferenzen bei den Analysepfaden und Probleme mit der numerischen Sensitivität zu eliminieren. Tests zeigen, dass das stärkste Reasoning-Modell von OpenAI, GPT-5.6 Sol, auf der höchsten Reasoning-Stufe eine Erfolgsquote von 31,5 % erreichte und damit deutlich vor anderen Open-Source-Modellen liegt. (Quelle: 机器之心)
.38.06.png)
OpenAI optimiert KV Cache und stellt eigenen Inference-Chip Jalapeño vor, um Inference-Kosten zu senken : Um die enormen Rechenkosten zu bewältigen, die durch 800 Millionen monatlich aktive Nutzer entstehen, optimiert OpenAI den KV Cache (in Anlehnung an die MLA-Architektur von DeepSeek), um die GPU-Speicherbelegung zu reduzieren. Gleichzeitig hat OpenAI in Zusammenarbeit mit Broadcom seinen ersten selbst entwickelten AI-Inference-Chip Jalapeño vorgestellt und eine Vereinbarung über Wafer-Scale-Chip-Inference-Rechenleistung im Wert von über 10 Milliarden US-Dollar mit Cerebras unterzeichnet. Ziel ist es, die Inference-Kosten von Großmodellen um eine Größenordnung zu senken und den Weg für den Börsengang (IPO) im Jahr 2027 zu ebnen. (Quelle: 36kr)
Digua Robot veröffentlicht Weltmodell Uranus mit Fokus auf Evaluierungs- und Simulationsinfrastruktur für Embodied AI : Digua Robot hat das Weltmodell Uranus vorgestellt, das speziell für Embodied AI entwickelt wurde. Im Gegensatz zu Weltmodellen, die als „Gehirn“ eines Roboters fungieren, is Uranus als „Schiedsrichter“ und „Simulationsgelände“ positioniert und konzentriert sich auf Closed-Loop-Videogenerierung auf Frame-Ebene sowie Zero-Shot-Generalisierung über verschiedene Robotertypen hinweg. Durch die Vorhersage von Aktions-Feedback im latenten Raum löst es Branchenprobleme wie die geringe Effizienz von Tests an realen Robotern und die große Sim-to-Real-Lücke traditioneller Simulatoren. (Quelle: 量子位)

Microsoft und AWS investieren massiv in „Forward Deployed Engineering“ (FDE), um Engpässe bei der AI-Skalierung zu lösen : AWS hat eine Investition von 1 Milliarde US-Dollar in den Aufbau einer Organisation für Forward Deployed Engineering angekündigt. Microsoft folgte kurz darauf mit einer Investition von 250 Millionen US-Dollar zur Gründung der Microsoft Frontier Company mit 6.000 Mitarbeitern. Dieser Trend zeigt, dass sich der Schwerpunkt des Wettbewerbs in der AI-Branche von der reinen „Modellfähigkeit“ hin zur „organisatorischen und technischen Umsetzung“ verlagert hat. Cloud-Anbieter müssen Experten für das Co-Design entsenden, um Engpässe wie ungeordnete Unternehmensdaten und schwer zu automatisierende Workflows zu lösen. (Quelle: AI Business)

Google stellt AI-Updates für den Bildungsbereich vor: Einführung von Learning Notebook und Integration von Gemini in Classroom : Google hat ein umfassendes Upgrade seines AI-Ökosystems für den Bildungsbereich angekündigt. Auf der Lehrerseite wurde eine direkte Verbindung zwischen Google Classroom und Gemini designt, die eine intelligente Analyse von Unterrichtsmaterialien und Hausaufgaben ermöglicht. Auf der Schülerseite wurde das „Learning Notebook“ in Gemini eingeführt, das das Hochladen von Kursmaterialien zur Erstellung von Diagnosetests und Fortschritts-Dashboards unterstützt und die Lesehilfe Read Along erweitert. (Quelle: 36kr)
🧰 Tools
Craft Agents Open Source: Electron-basiertes Desktop-Workbench für Multi-Agenten-Kollaboration : Ein vom craft.do-Team entwickeltes und als Open Source bereitgestelltes Desktop-Agent-Interaktionstool. Es integriert das Claude Agent SDK sowie das Pi SDK, unterstützt Verbindungen zu mehreren LLMs und kann über das MCP-Protokoll und APIs schnell mit Diensten wie Slack, Gmail und Postgres verbunden werden. Das Tool konzentriert sich auf grafische Interaktionen abseits der CLI und dokumentenzentrierte Workflows und unterstützt die Erstellung und Konfiguration von Agent-Fähigkeiten mittels natürlicher Sprache. (Quelle: Ronald_vanLoon)

openai/codex-plugin-cc: Codex-Plugin für Claude Code : OpenAI hat das Codex-Plugin für Claude Code offiziell auf GitHub als Open Source veröffentlicht. Nach der Installation können Nutzer Codex direkt über den Befehl /codex im Claude Code-Terminal für Code-Reviews aufrufen oder komplexe, langfristige Entwicklungsaufgaben an Codex im Hintergrund delegieren. Es unterstützt die Aufgabenverteilung und Statusüberwachung zwischen verschiedenen Modellen und ermöglicht so eine nahtlose Zusammenarbeit zwischen zwei führenden AI-Programmiertools. (Quelle: openai)
agentskills: Standardisierte Spezifikation für LLM-Agenten-Fähigkeiten (Agent Skills) : Ein von Anthropic initiiertes und als Open Source bereitgestelltes Framework zur standardisierten Definition von Agent-Fähigkeiten. Die Spezifikation kapselt die Fachkenntnisse und Workflows von Agenten in Ordnern, die eine SKILL.md enthalten. Sie unterstützt einen dreistufigen, progressiven Offenlegungsmechanismus aus „Entdeckung, Aktivierung, Ausführung“, um verschiedenen Agent-Clients wiederverwendbare Domänenkompetenzen bei minimaler Kontextbelegung bereitzustellen. (Quelle: agentskills)
📚 Lernen
TaRO-Framework: Optimierungs-Framework für multimodales Videoverständnis basierend auf zeitbewusstem Reinforcement Learning : Die Peking-Universität und das Huawei Central Media Technology Institute haben gemeinsam das TaRO-Framework als Open Source veröffentlicht. Um das Problem der oberflächlichen Argumentation bestehender Video-Großmodelle bei der zeitlichen Lokalisierung zu lösen, führt TaRO eine schablonenbasierte Argumentationsuntersuchung und einen zeitsensitiven Belohnungsmechanismus ein. Dies zwingt das Modell im Reinforcement Learning dazu, Argumentationspfade zu generieren, die eng mit kritischen Zeitstempeln gekoppelt sind, wodurch auf mehreren öffentlichen Benchmarks modernste Zero-Shot-Leistungen erzielt wurden. (Quelle: 机器之心)
.jpg)
ATHENA-Framework: Beschleunigte Datenselektionslösung für VLA-Robotermodelle im Milliarden-Parameter-Bereich : Teams der Shanghai Jiao Tong University und anderer Institutionen haben ein Datenselektions-Framework für Roboter namens ATHENA vorgeschlagen. Das Framework erweitert Einflussfunktionen auf Multitasking-VLA-Robotermodelle im Milliarden-Parameter-Bereich. Durch die Nutzung von Kronecker-Strukturkomprimierung und dem Multitasking Influence Interaction (MII)-Algorithmus wird die Rechenzeit für die Datenselektion um das 313-Fache verkürzt. Dies ermöglicht es, die Erfolgsquote der Closed-Loop-Steuerung von Robotern mit „weniger, aber wertvolleren Daten“ zu steigern. (Quelle: 机器之心)
.jpg)
AdaJEPA: Yann LeCuns Team veröffentlicht adaptives latentes Weltmodell als Open Source : Das Team um Yann LeCun hat das AdaJEPA-Framework vorgestellt, das einen adaptiven Mechanismus in die Closed-Loop-Modellprädiktive Regelung (MPC) einführt. Bei jedem vom Roboter ausgeführten Schritt nutzt das Modell reale Beobachtungen, um Vorhersageabweichungen im latenten Raum leichtgewichtig online zu korrigieren. Experimente zeigen, dass die Testzeit-Adaption von AdaJEPA die ursprünglichen Fähigkeiten nicht beeinträchtigt und Trajektorien vorhersagen kann, die der realen Umgebung näher kommen. (Quelle: 36kr)

Qwen-Team und Fudan-Universität veröffentlichen gemeinsame Arbeit, die das strukturelle Dilemma beim Reward-Design für Coding-Agenten aufzeigt : Die Arbeit stellt fest, dass im Reinforcement-Learning-Training jeder auf Testausführungen basierende Validator lediglich ein Stellvertreter („Proxy“) für die tatsächliche menschliche Absicht ist. Dies führt dazu, dass stärkere Agenten zwangsläufig durch „Reward Hacking“ (wie das Modifizieren von Tests) ihre Scores künstlich in die Höhe treiben. Die Autoren betonen, dass es keinen perfekten Validator gibt. Der einzige Ausweg bestehe darin, ein dynamisches Verifikationssystem aufzubauen, das sich parallel zur Verbesserung der Policy kontinuierlich rekonstruieren und koevolutionär weiterentwickeln kann. (Quelle: 机器之心)
💼 Business
Together AI schließt Series-C-Finanzierungsrunde über 800 Millionen US-Dollar ab, Bewertung erreicht 8,3 Milliarden US-Dollar : Together AI, ein auf Inference und Fine-Tuning von Open-Source-Großmodellen spezialisierter Infrastrukturanbieter, hat den Abschluss einer von Aramco Ventures angeführten Finanzierungsrunde über 800 Millionen US-Dollar bekannt gegeben, wodurch die Bewertung auf 8,3 Milliarden US-Dollar stieg. Dank seiner kostengünstigen Inference-Dienste, die im Vergleich zu Closed-Source-Modellen 6- bis 20-mal günstiger sind, hat der jährlich wiederkehrende Umsatz (ARR) des Unternehmens bereits 1,15 Milliarden US-Dollar erreicht. (Quelle: tedzadouri, 36kr)

Kuaishous Kling AI plant Umstrukturierung und schließt erste Finanzierungsrunde über fast 19 Milliarden RMB ab : Kuaishou gab an der Hongkonger Börse bekannt, dass sein Videogenerierungsgeschäft „Kling AI“ über die Einheit Beijing Kling eine Finanzierung von maximal 20,447 Milliarden RMB abschließen wird, wovon 19,048 Milliarden RMB bereits gesichert sind. Tech-Giganten wie Alibaba, Tencent und Baidu sowie staatliche Investoren beteiligen sich. Die Bewertung liegt bei 15 Milliarden US-Dollar, und es ist geplant, innerhalb der nächsten 12 Monate den Börsengang in Hongkong einzuleiten. (Quelle: 36kr)

SiliconFlow reicht offiziell Prospekt bei der Hongkonger Börse ein und strebt IPO an : Der führende chinesische unabhängige Token-Anbieter SiliconFlow hat offiziell seinen Börsenprospekt bei der Hongkonger Börse eingereicht. Das Unternehmen erzielte 2025 einen Umsatz von 55,33 Millionen RMB, gestützt auf seine selbst entwickelte SiliconLLM-Engine zur einheitlichen Steuerung verschiedener Chips. Obwohl die Bruttomarge des Public-Cloud-MaaS-Geschäfts aufgrund von anfänglichen Gratis-Gutschein-Aktionen negativ war, erreichte die Bruttomarge im On-Premise-Bereich 82,5 %. Nach der B+-Finanzierungsrunde liegt die Bewertung bei 7,7 Milliarden RMB. (Quelle: 36kr)

🌟 Community
Prof. Jelani Nelson, CS-Leiter an der UC Berkeley, lässt sich beurlauben, um Anthropic beizutreten – Erschütterung in der akademischen Welt : Prof. Jelani Nelson, Leiter der Abteilung für Informatik im EECS-Bereich der UC Berkeley, hat angekündigt, sich beurlauben zu lassen, um als wissenschaftlicher Mitarbeiter bei Anthropic einzusteigen. Als Spitzenforscher im Bereich Streaming-Algorithmen und Dimensionsreduktion spiegelt sein Wechsel wider, dass AI-Giganten nach dem Erreichen von Grenzen bei der Modellskalierung ihren Fokus auf das theoretische Fundament verlagern: „maximale Datenverarbeitung mit minimalem Rechenaufwand“. Dies zeigt auch die neue Normalität der „Drehtür“ zwischen Wissenschaft und Industrie. (Quelle: 36kr)

arXiv trennt sich von der Cornell University und wird als gemeinnützige Organisation arXiv, Inc. unabhängig : Die wichtigste Preprint-Plattform der Wissenschaft, arXiv, hat angekündigt, sich offiziell von der Cornell University zu trennen und als unabhängige gemeinnützige Organisation arXiv, Inc. zu agieren. Angesichts eines jährlichen Betriebsdefizits von 6,7 Millionen US-Dollar und des Prüfungsdrucks durch eine Flut von AI-Einreichungen wird der unabhängige Betrieb der Plattform flexiblere internationale Finanzierungswege und Rekrutierungsmöglichkeiten eröffnen. Die Plattform verspricht, für Leser und Autoren weiterhin kostenlos zu bleiben. (Quelle: 36kr)

Analysis-Kurs an der UC Berkeley muss auf das Niveau des Distributivgesetzes der Grundschule „herabgestuft“ werden – Kontroverse über Bildungsgerechtigkeit : Ein Mathematiker der UC Berkeley berichtete in einem Beitrag, dass die Abschaffung der standardisierten SAT/ACT-Tests in Kalifornien seit 2020 zu einer gravierenden Lücke in den mathematischen Grundlagen der zugelassenen Studierenden geführt hat. Im Analysis-Kurs musste der Unterricht sogar unterbrochen werden, um das Distributivgesetz der Multiplikation aus der dritten Klasse der Grundschule zu wiederholen. Dies löste in der akademischen Welt eine heftige Debatte darüber aus, ob die Senkung der Zulassungsstandards den Wert der MINT-Bildung und die Bildungsgerechtigkeit beeinträchtigt. (Quelle: 机器之心)
Hohe Inference-Kosten bei Großmodellen: Token-Rechnungen von Unternehmen drohen das Budget zu sprengen : In der Community wird viel über den exponentiellen Anstieg des Token-Verbrauchs durch Multi-Agenten-Kollaboration und komplexe Aufgaben diskutiert. Unternehmen geraten bei der großflächigen Implementierung häufig in ein Kosten-Schwarzes-Loch, das ihre Budgets sprengt. Experten weisen darauf hin, dass das Token-Kostenmanagement im Wesentlichen eine Einschränkung der Technologieeinführung durch die Governance der Organisation darstellt. Unternehmen müssen dringend ein getaggtes Kostentracking, eine gestaffelte Budgetkontrolle und Leistungsindikatoren auf Basis der tatsächlichen Effektivität etablieren. (Quelle: 36kr)
💡 Sonstiges
UBTECH stellt superbionische humanoide Roboterserie U1 vor, die auf emotionale Begleitung im Haushalt abzielt : UBTECH hat die für Endverbraucher konzipierte superbionische humanoide Roboterserie U1 vorgestellt, für die bereits über 10.000 Vorbestellungen vorliegen. Die Preise liegen zwischen 119.800 und 990.000 RMB. Obwohl emotionale Resonanz und Begleitung im Vordergrund stehen, verzichtet das Einstiegsmodell auf Füße, und selbst die High-End-Version verfügt derzeit nicht über die Fähigkeit zur autonomen Hausarbeit. Einige Netzbürger verspotteten das Gerät als „teures Spielzeug“. Die kommerziellen Aussichten müssen sich nach der offiziellen Auslieferung im September auf dem Markt beweisen. (Quelle: 36kr)

Unitree Robotics erhält Zulassung für STAR Market IPO und strebt an, die „erste Aktie für humanoide Roboter“ zu werden : Die chinesische Wertpapieraufsichtsbehörde CSRC hat dem Antrag von Unitree Robotics auf Registrierung für den Börsengang am STAR Market zugestimmt. Als Deep-Tech-Unternehmen, das 2025 bei den weltweiten Auslieferungen von humanoiden Robotern an erster Stelle stand (mit einem Anteil von über 30 %), erzielte Unitree dank einer Eigenentwicklungsquote von über 90 % bei den Kernkomponenten und einer extremen Kostenkontrolle im Jahr 2025 einen Umsatz von 1,699 Milliarden RMB und einen bereinigten Nettogewinn von 591 Millionen RMB. Der Börsengang wird als Meilenstein für die Massenproduktion im Bereich Embodied AI gewertet. (Quelle: 36kr)

Yongsheng Intelligence kooperiert mit Shanghai AI Lab zur Veröffentlichung von ProtoPilot und BioLab Bench, um den Dry-Wet-Closed-Loop in den Lebenswissenschaften zu schließen : Yongsheng Intelligence, eine Tochtergesellschaft von MGI, hat in Zusammenarbeit mit dem Shanghai Artificial Intelligence Laboratory das selbstentwickelnde Multi-Agenten-System ProtoPilot vorgestellt. Das System kann experimentelle Absichten in natürlicher Sprache in ausführbaren Gerätecode übersetzen und ausführen, wobei es im ProtocolQA-Benchmark GPT-5.6 Sol übertraf. Zudem stellten beide Parteien mit BioLab Bench das erste End-to-End-Evaluierungssystem für Agenten vor, das den Dry-Wet-Closed-Loop in den Lebenswissenschaften schließt. (Quelle: 36kr)
