Alibaba ha presentado Qwen3, una nueva familia de modelos de razonamiento de IA que, según la empresa, puede competir e incluso superar a los mejores modelos de Google y OpenAI. Los modelos Qwen3 van de 0,6 mil millones a 235 mil millones de parámetros, y la mayoría están disponibles para su descarga bajo licencia abierta en plataformas como Hugging Face y GitHub. Estos modelos están diseñados como sistemas híbridos capaces tanto de respuestas rápidas como de razonamientos complejos, lo que les permite autocomprobarse eficazmente.
Qwen3 incorpora una arquitectura de mezcla de expertos (MoE) para mejorar la eficiencia computacional, es compatible con 119 idiomas y se ha entrenado con un conjunto de datos de casi 36 billones de tokens. Aunque los modelos Qwen3 no superan sistemáticamente a los últimos modelos de la competencia, muestran un gran rendimiento en varias pruebas comparativas, como tareas de codificación y matemáticas. El modelo estrella, Qwen-3-235B-A22B, ha demostrado resultados superiores en concursos específicos de programación y evaluaciones matemáticas, aunque todavía no está disponible públicamente.
Alibaba destaca las capacidades de llamada de herramientas y las funciones de seguimiento de instrucciones de Qwen3, que se ven reforzadas por su integración de modos de pensamiento y no pensamiento. A medida que se intensifica la competencia, modelos como Qwen3 ejercen presión sobre los laboratorios de IA estadounidenses para que innoven, mientras que las políticas de Estados Unidos restringen el acceso de China a los chips de entrenamiento necesarios. En general, Qwen3 representa un avance significativo en las capacidades de IA de Alibaba.
