Tencent a récemment dévoilé son modèle de raisonnement avancé, Hunyuan-T1. Ce modèle a obtenu d'excellents résultats sur plusieurs benchmarks clés de l'intelligence artificielle, ce qui le place parmi les modèles les plus performants au niveau mondial.
Des évaluations récentes montrent que Hunyuan-T1 a enregistré un score de 87,2 sur MMLU-Pro, un ensemble de données qui évalue les capacités de raisonnement fondamentales des grands modèles de langage. Ce score le positionne en seconde place, juste derrière le modèle d'OpenAI dénommé o1.
D'autre part, Hunyuan-T1 a également brillé sur des benchmarks publics tels que CEval, AIME et Zebra Logic. Ces évaluations mesurent les connaissances générales ainsi que les capacités de raisonnement tant en chinois qu'en anglais.