通义千问大模型测评得分还不低
中国权威的大型模型评估平台OpenCompass最近更新其排名,通义千问72B模型以67.1的高分荣登榜首。
OpenCompass是由上海人工智能实验室推出的开源大型模型评估平台,其评估范围涵盖学科、语言、知识、理解和推理五个维度,能够全面评估大型模型的能力。
在OpenCompass的中文数据集评测中,Qwen-72B基础大型模型和对话大型模型(Qwen-72B-Chat)分别占据了前两名,显著优于其他模型。
OpenCompass是由上海人工智能实验室推出的开源大型模型评估平台,其评估范围涵盖学科、语言、知识、理解和推理五个维度,能够全面评估大型模型的能力。
在OpenCompass的中文数据集评测中,Qwen-72B基础大型模型和对话大型模型(Qwen-72B-Chat)分别占据了前两名,显著优于其他模型。