Agent建设助手

评测与对比概述

评测与对比是一种用于评估和比较不同变量输入后,智能体输出的结果与期望对比,是否符合预期的功能。它可以帮助智能体管理员了解智能体不同答复的耗时、Token,智能体输出与期望内容是否符合预期,针对评测后的对比进行优化调整,使其智能体输出的内容更能满足实际使用

评测任务:

•支持创建评测类型为模型、提示词、智能体的评测任务

•支持评测方式可选择手动或自动

•支持评测任务的编辑、删除,运行评测任务操作

•支持通过评测任务关键词模糊搜索、支持按模型、提示词、智能体筛选评测集

评测集:

•支持创建评测集,支持本地上传xls、xlsx、csv格式的文件

•支持在线添加评测集数据

•支持对评测集的导出、发布、删除

•支持通过评测集关键词模糊搜索、支持按发布、未发布筛选评测集