11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
纽约人工智能创业公司Arthur发布了开源工具ArthurBench,用于评估和比较大型语言模型的性能。ArthurBench可以帮助企业在特定用例上测试不同语言模型的性能,并提供准确性、可读性、避险等指标进行比较。Arthur还与亚马逊网络服务和Cohere合作举办黑客马拉松,鼓励开发人员为ArthurBench构建新的指标。