MMLU全称MassiveMultitaskLanguageUnderstanding是一种针对大模型的语言理解能力的测评是目前最著名的大模型语义理解测评之一由UCBerkeley大学的研究人员在2020年9月推出。该测试涵盖57项任务包括初等数学、美国历史、计算机科学、法律等。任务涵盖的知识很广泛语言是英文用以评测大模型基本的知识覆盖范围和理解能力。
相似站点
暂无讨论,说说你的看法吧
MMLU全称MassiveMultitaskLanguageUnderstanding是一种针对大模型的语言理解能力的测评是目前最著名的大模型语义理解测评之一由UCBerkeley大学的研究人员在2020年9月推出。该测试涵盖57项任务包括初等数学、美国历史、计算机科学、法律等。任务涵盖的知识很广泛语言是英文用以评测大模型基本的知识覆盖范围和理解能力。
之前