中文通用大模型综合性评测基准
目前最著名的英语大模型语义理解测评之一,评测大模型基本的知识覆盖范围和理解能力。
基于指令微调对视觉语言模型的排行
中文开放问答为主观评测结果,仅对支持中文的SFT模型进行评测。
表示该模型结果由 C-Eval 团队测试得到,而其他结果是通过用户提交的模型预测计算分数得到