CMMLU CMMLU 是综合性中文评估基准,涵盖 67 个主题,评估语言模型中文知识与推理能力。含排行榜展示模型表现,提供数据集,适用于科研、开发等场景。 40 AI模型测评# CMMLU# 中文多任务语言理解评估# 排行榜