首页 > AI头条  > 正文

微软推出大语言模型评估工具库PromptBench

2023-12-27 16:36 · 来源: AIbase基地
微软近日发布了专为评估大语言模型而设计的PromptBench工具库。该工具库支持多种模型和任务,提供标准、动态和语义评估方法,并集成了多种提示工程方法和对抗性测试。支持多种数据集和模型,提供可视化分析和词频分析等解释评估结果的工具。PromptBench的简便界面允许快速构建模型、加载数据集,并评估模型性能,为研究人员提供全面的性能测试和分析支持。
  • 相关推荐

今日大家都在搜的词: