👁️ 430

👍 91

📅 2026-02-21 收录

🔄 2026-07-16 更新

C-Eval 是一个多层次、多学科的中文评估工具，专为基础模型设计

C-Eval 是一个多层次、多学科的中文评估工具，专为基础模型设计

🔗 打开网站

🤖 AI大模型AI企业服务AI编程工具

AI基础模型 AI评估工具 AI数据集

C-Eval 是一个多层次、多学科的中文评估工具，专为基础模型设计网站截图

🚀 访问网站 📁 查看更多

正文内容

C-Eval产品介绍

C-Eval的封面图

C-Eval是一款全面的中文评估套件，专为基础模型设计，涵盖了多达13948道多项选择题，涉及52个不同学科和四个难度等级。以下是C-Eval的主要特点：

多学科覆盖：C-Eval的题库包含多个学科，适用于不同领域的评估需求，确保用户能够在多样化的知识背景下进行测试。
多难度级别：题目分为四个难度等级，用户可以根据自身需求选择适合的难度进行评估，帮助更好地了解模型的能力。
数据下载：用户可以直接在Huggingface datasets上下载数据，方便进行本地使用和研究。
使用指导：在GitHub上提供详细的使用说明，帮助用户快速上手，了解如何读取和使用数据。
研究论文：C-Eval的相关研究论文已在《神经信息处理系统进展》上发表，用户可以通过阅读论文获取更深入的理解。

C-Eval不仅适合研究人员和开发者使用，也为教育工作者提供了一个评估工具，帮助他们在教学中应用基础模型的评估。若有任何疑问或需要进一步的信息，用户可以通过电子邮件或在GitHub上创建问题进行联系。