Alibaba, ‘hibrit’ yapay zeka muhakeme modelleri ailesi Qwen3’ü tanıttı | TechCrunch

Create an illustration of a scene demonstrating the concept of Alibaba's new 'hybrid' AI reasoning models, Qwen3, in a light-hearted, Pixar-style representation. The image should lay emphasis on the mixture of experts architecture representing 119 languages, the datasets of nearly 36 trillion tokens, and the model's capability to fact-check itself. Highlight also the hybrid system generating both quick responses and complex reasoning with a family of models ranging in size. Use a positive, light color scheme and make sure to capture the advance in AI technology it represents. The illustration has to be in a 3:2 aspect ratio.

Alibaba, şirketin Google ve OpenAI’nin en iyi modelleriyle rekabet edebileceğini ve hatta onları geçebileceğini iddia ettiği yeni bir yapay zeka akıl yürütme modelleri ailesi olan Qwen3’ü tanıttı. Qwen3 modelleri 0,6 milyar ila 235 milyar parametre arasında değişiyor ve çoğu Hugging Face ve GitHub gibi platformlarda açık bir lisans altında indirilebiliyor. Bu modeller, hem hızlı yanıtlar verebilen hem de karmaşık muhakeme yapabilen hibrit sistemler olarak tasarlanmıştır, bu da kendilerini etkili bir şekilde kontrol etmelerini sağlar.

Qwen3, 119 dili destekleyen ve yaklaşık 36 trilyon belirteçten oluşan bir veri kümesi üzerinde eğitilen gelişmiş hesaplama verimliliği için bir uzmanlar karışımı (MoE) mimarisi içerir. Qwen3 modelleri rakiplerin en yeni modellerinden sürekli olarak daha iyi performans göstermese de, kodlama ve matematik görevleri gibi çeşitli kıyaslamalarda güçlü performans göstermektedir. Amiral gemisi modeli Qwen-3-235B-A22B, henüz halka açık olmasa da belirli programlama yarışmalarında ve matematik değerlendirmelerinde üstün sonuçlar göstermiştir.

Alibaba, Qwen3’ün düşünme ve düşünmeme modlarını entegre etmesiyle daha da geliştirilmiş olan araç çağırma yeteneklerini ve talimat takip özelliklerini vurguluyor. Rekabet yoğunlaştıkça, Qwen3 gibi modeller Amerikan yapay zeka laboratuvarları üzerinde yenilik yapma baskısı oluştururken, ABD politikaları Çin’in gerekli eğitim çiplerine erişimini kısıtlıyor. Genel olarak Qwen3, Alibaba’nın yapay zeka yeteneklerinde önemli bir ilerlemeyi temsil ediyor.

Makalenin tamamı

Bir yanıt yazın