Alibaba predstavuje Qwen3, rodinu ‘hybridných’ modelov uvažovania s umelou inteligenciou | TechCrunch

Create an illustration of a scene demonstrating the concept of Alibaba's new 'hybrid' AI reasoning models, Qwen3, in a light-hearted, Pixar-style representation. The image should lay emphasis on the mixture of experts architecture representing 119 languages, the datasets of nearly 36 trillion tokens, and the model's capability to fact-check itself. Highlight also the hybrid system generating both quick responses and complex reasoning with a family of models ranging in size. Use a positive, light color scheme and make sure to capture the advance in AI technology it represents. The illustration has to be in a 3:2 aspect ratio.

Alibaba predstavila Qwen3, novú rodinu modelov uvažovania s umelou inteligenciou, o ktorej spoločnosť tvrdí, že môže konkurovať špičkovým modelom od spoločností Google a OpenAI a dokonca ich prekonať. Modely Qwen3 majú rozsah od 0,6 miliardy do 235 miliárd parametrov, pričom väčšina z nich je k dispozícii na stiahnutie pod otvorenou licenciou na platformách ako Hugging Face a GitHub. Tieto modely sú navrhnuté ako hybridné systémy schopné rýchlo reagovať aj komplexne uvažovať, čo im umožňuje efektívne overovať fakty.

Qwen3 obsahuje architektúru zmesi expertov (MoE) na zvýšenie výpočtovej efektívnosti, podporuje 119 jazykov a je vycvičený na súbore údajov s takmer 36 biliónmi tokenov. Hoci modely Qwen3 neprekračujú konzistentne najnovšie modely konkurencie, vykazujú vysoký výkon v rôznych porovnávacích testoch, napríklad v úlohách kódovania a matematiky. Vlajkový model Qwen-3-235B-A22B preukázal vynikajúce výsledky v konkrétnych programátorských súťažiach a matematických hodnoteniach, hoci zatiaľ nie je verejne dostupný.

Alibaba zdôrazňuje možnosti vyvolávania nástrojov a funkcie sledovania inštrukcií Qwen3, ktoré sú ďalej vylepšené integráciou režimov myslenia a nemyslenia. S rastúcou konkurenciou vyvíjajú modely ako Qwen3 tlak na americké laboratóriá umelej inteligencie, aby inovovali, zatiaľ čo politika USA obmedzuje čínsky prístup k potrebným tréningovým čipom. Celkovo Qwen3 predstavuje významný pokrok v schopnostiach AI zo strany spoločnosti Alibaba.

Celý článok

Pridaj komentár