MMBench MMBench 是专注评估视觉语言模型能力的平台,有约 3000 道选择题,覆盖 20 多个细粒度评估维度。采用稳健评估方法和可靠输出提取方法,确保评估准确。由多机构团队贡献。 40 AI模型测评# MMBench# 多模态模型评估# 视觉语言模型