KI-Tagesbericht – 2025-12-18(Abendausgabe)

Schlüsselwörter:Gemini 3 Flash, GPT-5.2, KI-Modell, SAM Audio, humanoider Roboter, MiMo-V2-Flash, Tencent-Großmodell, multimodale Inferenz, KI für Audio-Bearbeitung, Produktionskapazität für verkörperte Roboter, Open-Source-Großmodell, KI-Gesundheitsgroßmodell

🔥 Fokus

Google veröffentlicht Gemini 3 Flash: Google hat Gemini 3 Flash veröffentlicht, das modernste Intelligenz zu extrem niedrigen Kosten (nur 25% der Pro-Version) bietet, aber in wichtigen Benchmarks wie MMMU-Pro und SWE-bench Verified Gemini 3 Pro übertrifft und dreimal schneller ist. Das Modell wurde speziell für die iterative Entwicklung konzipiert, bietet eine Programmierleistung nahe an Gemini 3 Pro und geringe Latenz. Es unterstützt multimodales Inferencing und kann für Videoanalyse, Datenextraktion und visuelle Fragenbeantwortung eingesetzt werden. Gemini 3 Flash ist jetzt vollständig verfügbar; normale Nutzer können es in der Gemini-App und im Google Search AI-Modus verwenden, Entwickler können es über die API integrieren. Dies soll die breitere Integration von KI in alltägliche Anwendungen und Geschäftssysteme vorantreiben. (Quelle: 36氪, 36氪)

谷歌甩出“价格屠夫”,Gemini 3 Flash超Pro,成本仅1/4,速度如“闪电”

OpenAI veröffentlicht GPT-5.2 Modellreihe: OpenAI hat die GPT-5.2 Modellreihe, bestehend aus Pro, Thinking und Instant, veröffentlicht, um der Konkurrenz durch Googles Gemini 3 zu begegnen. GPT-5.2 erreichte neue Höchstwerte in abstrakten visuellen Rätsel-Benchmarks wie ARC-AGI-1 und ARC-AGI-2 und zeigte eine signifikante Steigerung der Recheneffizienz, wobei die Kosten auf 1/390 von GPT-5.1 gesenkt wurden. Das Modell bietet anpassbare Inferenzstufen (einschließlich x-high) und unterstützt Kontextzusammenfassungen zur Erweiterung der Eingabebeschränkungen. Diese Veröffentlichung zielt darauf ab, die Effizienz bei professionellen Aufgaben wie Code-Generierung, Tabellenkalkulationen und Präsentationen zu verbessern und betont die erheblich gestiegene Wirtschaftlichkeit bei komplexen Denkaufgaben. (Quelle: DeepLearning.AI Blog)

OpenAI’s Answer to Gemini 3, Runway’s Interactive Worlds, Disney’s Alliance With OpenAI, Adapting LLMs for Low-Data Domains

KI-Modell löst eigenständig offenes mathematisches Problem: GPT-5 hat erstmals eigenständig ein offenes mathematisches Problem, das im IMProofBench-Benchmark eingereicht wurde, gelöst und einen vollständigen und korrekten Beweis geliefert, ohne menschliche Aufforderung oder Intervention. Dieser Durchbruch ist ein kleiner, aber neuartiger Beitrag zur enumerativen Geometrie und markiert einen bedeutenden Fortschritt in der Fähigkeit von KI-Modellen zu komplexem mathematischem Denken und Problemlösen. Dieses Ereignis hat in der Community eine breite Diskussion über das Potenzial von KI in der mathematischen Forschung ausgelöst und deutet darauf hin, dass KI in Zukunft eine aktivere Entdeckerrolle in weiteren wissenschaftlichen Bereichen spielen könnte. (Quelle: SebastienBubeck, kevinweil, gdb, OfirPress, SebastienBubeck)

AI模型自主解决开放数学问题

Meta veröffentlicht SAM Audio: Meta hat SAM Audio vorgestellt, das erste einheitliche KI-Modell, das es Nutzern ermöglicht, Klänge aus komplexen Audiomischungen zu isolieren und zu bearbeiten. Das Modell kann wie beim “Freistellen” in Photoshop Klänge “ausschneiden”, indem es Text-, visuelle und zeitliche Hinweise verwendet, um beispielsweise eine Gitarre in einem Lied zu isolieren, Verkehrslärm herauszufiltern oder Hundegebell aus einem Podcast zu entfernen. Diese Innovation verspricht, den Audiobearbeitungsprozess zu revolutionieren, ihn so einfach wie die Bearbeitung von Text und Bildern zu machen, die Hürde für professionelles Mischwissen zu senken und die Popularisierung und Effizienz der Audioinhaltserstellung zu fördern. (Quelle: ylecun, ylecun, dotey)

Yunpeng Technology veröffentlicht neue KI+Gesundheitsprodukte: Yunpeng Technology hat in Zusammenarbeit mit Shuaikang und Skyworth neue KI+Gesundheitsprodukte vorgestellt, darunter das “Digitalisierte Zukunftsküchenlabor” und intelligente Kühlschränke, die mit einem großen KI-Gesundheitsmodell ausgestattet sind. Das große KI-Gesundheitsmodell kann Küchendesign und -betrieb optimieren, während der intelligente Kühlschrank über den “Gesundheitsassistenten Xiaoyun” personalisiertes Gesundheitsmanagement bietet. Dies markiert die tiefgreifende Anwendung von KI im täglichen Gesundheitsmanagement und im Smart Home-Bereich und verspricht, durch intelligente Geräte maßgeschneiderte Gesundheitsdienste anzubieten und die Lebensqualität zu verbessern. (Quelle: 36氪)

云澎科技发布AI+健康新品

Humanoiden-Roboterbranche steht vor Kapazitätsengpässen: Die Branche der Humanoiden-Roboter erlebte 2025 einen Wandel von einem Hype zu einer Abkühlung. Der Auftragswert überstieg 3,5 Milliarden CNY, aber die Liefermenge lag unter tausend Einheiten, was die Kapazitätsengpässe verdeutlicht. Führende Unternehmen wie Zhiyuan und UBTECH verzeichneten einen starken Anstieg der Bestellungen, aber ihre Massenproduktionskapazität befindet sich noch in der Phase des Hochfahrens von Hunderten auf Tausende von Einheiten. Der C-End-Markt ist schwer zu erschließen, die praktischen Anwendungsszenarien sind begrenzt, die Preise hoch und die Verkaufszahlen stagnieren unter tausend Einheiten. Die Branche steht vor dem Dilemma, mehr Show als Nutzen zu bieten, wie die Stabilitätsprobleme von Robotern bei Marathonläufen zeigen. Trotz zahlreicher Herausforderungen deuten politische Unterstützung und Kapitalinteresse darauf hin, dass sich die Branche von der “technischen Machbarkeit” zum “zuverlässigen Produkt” wandelt. (Quelle: 36氪, 36氪)

人形机器人的尴尬生意:订单超35亿,交付不足千台

Meitu Companies KI-Transformation und Herausforderungen: Meitu Company kehrt im Zuge der KI-Welle zu ihren Kern-Tools zurück und vollzieht eine Transformation durch C-End-Produkte wie Meitu Xiuxiu und Meiyan Camera sowie B-End-Produktivitätstools wie Meitu Design Studio und Kaipai. RoboNeo, eine AI Agent-Plattform, integriert Drittanbieter-Modelle und das selbst entwickelte Miracle Vision, um die Herausforderungen der KI-Implementierung durch “AI-Generierung + manuelle Korrektur” zu lösen. Allerdings ist die Nutzerbindung bei RoboNeo schlecht, insbesondere unter dem Druck von Konkurrenzprodukten wie Google Nano Banana, was die Wachstumsaussichten im Übersee-B-End-Markt verschärft. Trotzdem hat Meitu mit einer Traffic-Basis von 200 Millionen MAU und der Innovationskraft seines Teams weiterhin Überlebensraum im vertikalen SaaS-Bereich. Das Unternehmen wird sich in Zukunft auf die Integration von Technologie und Produkten konzentrieren, um dem Wettbewerb der großen Modelle zu begegnen. (Quelle: 36氪)

美图:AI席卷,“垂类SaaS”有活路吗?”

Xiaomi veröffentlicht MiMo-V2-Flash Large Model: Xiaomi hat offiziell das MiMo-V2-Flash Large Model als Open Source freigegeben, das mit 309B Parametern in die erste Liga der Open-Source-Modelle aufsteigt. Es erreicht eine 2,6-fache Inferenzbeschleunigung und kombiniert die Effekte von Spitzenmodellen mit geringen Bereitstellungskosten. Das Modell erzielte im SWE-Bench Verified Code-Benchmark einen hohen Wert von 73,4%, übertraf damit DeepSeek-V3.2 und Kimi-K2 Thinking und zeigte herausragende Agent-Fähigkeiten. Es verwendet Technologien wie einen 5:1 Mixed Attention-Mechanismus, Learnable Attention Pooling Bias, MTP Multi-Layer Token Prediction und MOPD Multi-Teacher Online Policy Distillation, um Effizienz und Langtextverständnis signifikant zu verbessern. MiMo-V2-Flash zeigt in realen Programmierszenarien eine extrem hohe Vollständigkeit und besitzt eine hohe emotionale Intelligenz in der menschlichen Interaktion, was Xiaomis Ambition für eine “AGI in der physischen Welt” unterstreicht. (Quelle: 36氪)

小米大模型“杀”进第一梯队:代码能力开源第一,智商情商全在线

Tencent passt Large Model R&D-Architektur an: Tencent hat seine Large Model R&D-Architektur angepasst und Yao Shunyu, einen ehemaligen OpenAI-Forscher, zum Chief AI Scientist des “CEO/President’s Office” ernannt. Er berichtet direkt an Präsident Liu Chiping und ist gleichzeitig Leiter der Abteilungen AI Infra und Large Language Model. Dieser Schritt zielt darauf ab, Tencents umfassende Wettbewerbsfähigkeit in Bezug auf Rechenleistung, Daten und Engineering-Fähigkeiten zu stärken und die zuvor relativ verzögerte Entwicklung von Large Models zu ändern. Die Ernennung von Yao Shunyu und die Einrichtung neuer Abteilungen signalisieren, dass Tencent KI zu einer zentralen Unternehmensstrategie erhebt und sich dem Aufbau eines F&E-Systems widmet, das auf grundlegenden Modellen basiert, um den Herausforderungen von Wettbewerbern wie ByteDance und Alibaba in Bezug auf KI-Anwendungen und Modellfähigkeiten zu begegnen. (Quelle: 36氪, 36氪, 36氪)