创建评测集
1.进入目标工作空间,在评测与对比下选择评测集,点击创建评测集
2.填写评测集名称或评测集描述
3.创建完成后,可以在评测集管理的页面列表中,看到该评测集
4.需要点击发布,才可在创建评测任务时使用
配置项 |
说明 |
评测集名称 |
•必填 •评测集名称进行命名,用于标识该评测集 •由中文、字母、数字、连接符(-、_)组成 •不能以连接符(-、_)开头或结尾 •字符限制:【2,128】字符 •工作空间内名称唯一 |
描述 |
•必填 •评测集的描述说明 •字符限制:【1,500】 |
数据导入 |
•非必填 •可支持下载模板和本地上传数据集文件 •支持本地上传xls、xlsx、csv格式的文件 |
下载模板 |
•模板表单,包含字段 ○group:组序列号 ○input:需要评测的输入内容 ○output:需要评测的期望输出内容。与智能体对比时,智能体的回复与期望输出的内容是否一致 [评测集模板.xlsx] |
管理评测集
管理评测集列表页
1.进入目标工作空间,在评测与对比下选择评测集,进入评测集列表页
2.支持未发布的评测集发布操作
3.支持评测集的导入、删除操作
4.支持通过评测集关键词模糊搜索、支持按发布、未发布筛选评测集
•导出:点击导出icon,可导出当前评测集的表格数据,文件格式为xlsx
•发布:默认创建的评测集为未发布状态。点击导出icon,可将未发布的评测集发布,发布后,可通过创建评测任务使用
•删除:点击后,可删除当前评测集
管理评测集详情页
1.进入目标工作空间,在评测与对比下选择评测集,点击目标评测集,进入评测集详情页
2.支持对未发布的评测集数据导入,添加评测集组,删除等操作;已发布评测集查阅操作
未发布:
•数据导入:点击后可本地上传xls、xlsx、csv格式的文件
•添加组:点击后,填写组序列号,可添加新的输入和期望输出的数据
添加组:一组代表对话的一轮 |
•添加行:可在当前组下添加新的行数据
•删除:点击后,浮窗确认是否删除,点击确定后,即可删除当前行数据
•编辑:点击编辑后,可修改评测集描述信息
已发布:
•仅可查阅已发布的评测集的输入和期望输出数据
•编辑:点击编辑后,可修改评测集描述信息