1321 shaares
Alibaba annonce une nouvelle version de son modèle Qwen (QwQ-32B-Preview) qui dépasserait les performances de Claude 3.5 Sonnet sur certains benchmarks.
Ces résultats sont à prendre avec des pincettes car je remarque que par exemple ils ont pris des résultats de LiveCodeBench qui datent d'août et les scores des autres modèles se sont améliorés depuis.
Par contre sa fenêtre de contexte n'est que de 32 768 tokens donc c'est peu comparé à ce qui se fait dans l'industrie actuellement.
Sinon le modèle et ses poids sont sous licence Apache 2 donc ça reste quand même un très bon modèle Open Source !