Alibaba predstavila Qwen3, novú rodinu modelov uvažovania s umelou inteligenciou, o ktorej spoločnosť tvrdí, že môže konkurovať špičkovým modelom od spoločností Google a OpenAI a dokonca ich prekonať. Modely Qwen3 majú rozsah od 0,6 miliardy do 235 miliárd parametrov, pričom väčšina z nich je k dispozícii na stiahnutie pod otvorenou licenciou na platformách ako Hugging Face a GitHub. Tieto modely sú navrhnuté ako hybridné systémy schopné rýchlo reagovať aj komplexne uvažovať, čo im umožňuje efektívne overovať fakty.
Qwen3 obsahuje architektúru zmesi expertov (MoE) na zvýšenie výpočtovej efektívnosti, podporuje 119 jazykov a je vycvičený na súbore údajov s takmer 36 biliónmi tokenov. Hoci modely Qwen3 neprekračujú konzistentne najnovšie modely konkurencie, vykazujú vysoký výkon v rôznych porovnávacích testoch, napríklad v úlohách kódovania a matematiky. Vlajkový model Qwen-3-235B-A22B preukázal vynikajúce výsledky v konkrétnych programátorských súťažiach a matematických hodnoteniach, hoci zatiaľ nie je verejne dostupný.
Alibaba zdôrazňuje možnosti vyvolávania nástrojov a funkcie sledovania inštrukcií Qwen3, ktoré sú ďalej vylepšené integráciou režimov myslenia a nemyslenia. S rastúcou konkurenciou vyvíjajú modely ako Qwen3 tlak na americké laboratóriá umelej inteligencie, aby inovovali, zatiaľ čo politika USA obmedzuje čínsky prístup k potrebným tréningovým čipom. Celkovo Qwen3 predstavuje významný pokrok v schopnostiach AI zo strany spoločnosti Alibaba.
