Alibaba hat Qwen3 eingeführt, eine neue Familie von KI-Schlussfolgermodellen, die nach Angaben des Unternehmens mit den Spitzenmodellen von Google und OpenAI konkurrieren und diese sogar übertreffen können. Die Qwen3-Modelle umfassen zwischen 0,6 Milliarden und 235 Milliarden Parameter. Die meisten stehen unter einer offenen Lizenz auf Plattformen wie Hugging Face und GitHub zum Download bereit. Diese Modelle sind als hybride Systeme konzipiert, die sowohl zu schnellen Antworten als auch zu komplexen Schlussfolgerungen fähig sind, was es ihnen ermöglicht, sich selbst effektiv auf Fakten zu überprüfen.
Qwen3 verwendet eine Mixed-Experts-Architektur (MoE) zur Verbesserung der Berechnungseffizienz, unterstützt 119 Sprachen und wurde auf einem Datensatz mit fast 36 Billionen Token trainiert. Die Qwen3-Modelle übertreffen zwar nicht durchgängig die neuesten Modelle von Mitbewerbern, zeigen aber eine starke Leistung in verschiedenen Benchmarks, z. B. bei Codierungs- und Matheaufgaben. Das Vorzeigemodell, Qwen-3-235B-A22B, hat bei bestimmten Programmierwettbewerben und mathematischen Bewertungen hervorragende Ergebnisse erzielt, obwohl es noch nicht öffentlich verfügbar ist.
Alibaba hebt die Fähigkeiten des Qwen3 hervor, Werkzeuge aufzurufen und Anweisungen zu befolgen, was durch die Integration von Denk- und Nicht-Denk-Modi noch verstärkt wird. Im Zuge der Verschärfung des Wettbewerbs üben Modelle wie Qwen3 Druck auf amerikanische KI-Labore aus, Innovationen zu entwickeln, während die US-Politik den Zugang der Chinesen zu den notwendigen Trainingschips einschränkt. Insgesamt stellt Qwen3 einen bedeutenden Fortschritt in den KI-Fähigkeiten von Alibaba dar.
