👁️ 383
👍 91
📅 2026-02-21 收录
🔄 2026-04-10 更新
C-Eval 是一个多层次、多学科的中文评估工具,专为基础模型设计

C-Eval 是一个多层次、多学科的中文评估工具,专为基础模型设计

🤖 AI大模型AI企业服务AI编程工具
C-Eval 是一个多层次、多学科的中文评估工具,专为基础模型设计 网站截图

正文内容

C-Eval产品介绍

C-Eval的封面图

C-Eval是一款全面的中文评估套件,专为基础模型设计,涵盖了多达13948道多项选择题,涉及52个不同学科和四个难度等级。以下是C-Eval的主要特点:

  • 多学科覆盖:C-Eval的题库包含多个学科,适用于不同领域的评估需求,确保用户能够在多样化的知识背景下进行测试。
  • 多难度级别:题目分为四个难度等级,用户可以根据自身需求选择适合的难度进行评估,帮助更好地了解模型的能力。
  • 数据下载:用户可以直接在Huggingface datasets上下载数据,方便进行本地使用和研究。
  • 使用指导:在GitHub上提供详细的使用说明,帮助用户快速上手,了解如何读取和使用数据。
  • 研究论文:C-Eval的相关研究论文已在《神经信息处理系统进展》上发表,用户可以通过阅读论文获取更深入的理解。

C-Eval不仅适合研究人员和开发者使用,也为教育工作者提供了一个评估工具,帮助他们在教学中应用基础模型的评估。若有任何疑问或需要进一步的信息,用户可以通过电子邮件或在GitHub上创建问题进行联系。