Alibaba meluncurkan Qwen3, sebuah keluarga dari model penalaran AI yang terdiri dari ‘hybrid & #8217; | TechCrunch

Create an illustration of a scene demonstrating the concept of Alibaba's new 'hybrid' AI reasoning models, Qwen3, in a light-hearted, Pixar-style representation. The image should lay emphasis on the mixture of experts architecture representing 119 languages, the datasets of nearly 36 trillion tokens, and the model's capability to fact-check itself. Highlight also the hybrid system generating both quick responses and complex reasoning with a family of models ranging in size. Use a positive, light color scheme and make sure to capture the advance in AI technology it represents. The illustration has to be in a 3:2 aspect ratio.

Alibaba telah memperkenalkan Qwen3, sebuah keluarga baru dari model penalaran AI yang diklaim oleh perusahaan dapat bersaing dan bahkan melampaui model teratas dari Google dan OpenAI. Model Qwen3 berkisar dari 0,6 miliar hingga 235 miliar parameter, dengan sebagian besar tersedia untuk diunduh di bawah lisensi terbuka di platform seperti Hugging Face dan GitHub. Model-model ini dirancang sebagai sistem hibrida yang mampu memberikan respons cepat dan penalaran yang kompleks, yang memungkinkan mereka untuk memeriksa fakta secara efektif.

Qwen3 menggabungkan arsitektur campuran para ahli (MoE) untuk meningkatkan efisiensi komputasi, mendukung 119 bahasa dan dilatih dengan kumpulan data hampir 36 triliun token. Meskipun model Qwen3 tidak secara konsisten mengungguli model terbaru dari para pesaing, model ini menunjukkan kinerja yang kuat dalam berbagai tolok ukur, seperti tugas-tugas pengkodean dan matematika. Model andalannya, Qwen-3-235B-A22B, telah menunjukkan hasil yang unggul dalam kontes pemrograman tertentu dan evaluasi matematika, meskipun belum tersedia untuk umum.

Alibaba menekankan kemampuan pemanggilan alat dan fitur-fitur yang mengikuti instruksi dari Qwen3, yang semakin ditingkatkan dengan integrasi mode berpikir dan tidak berpikir. Ketika persaingan semakin ketat, model seperti Qwen3 memberikan tekanan pada laboratorium AI Amerika untuk berinovasi, sementara kebijakan AS membatasi akses China ke chip pelatihan yang diperlukan. Secara keseluruhan, Qwen3 mewakili kemajuan yang signifikan dalam kemampuan AI dari Alibaba.

Artikel lengkap

Tinggalkan Balasan