11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
VQAScore是一个利用视觉问答模型来评估由文本提示生成的图像质量的新方法;GenAI-Bench是一个包含复杂文本提示的基准测试集,用于挑战和提升现有的图像生成模型。两个工具可以帮助研究人员自动评估AI模型的性能能通过选择最佳候选图像来实际改善生成的图像。他的研究成果对视觉识别、自动驾驶、和人机交互等应用产生了深远影响,是该领域极具影响力的科学家之一。
多模态大模型初创企业“智子引擎”宣布完成千万元天使轮融资,旗下拥有参数规模约150亿的大模型“元乘象+ChatImg”,关注微信公众号“元乘象”即可体验。该模型的训练集主要包括图文对数据和视觉问答数据,已经在图文匹配、图文检索、图像描述生成和文本描述生成等多个任务上进行了训练,表现出了出色的多模态处理能力。文本描述生成能力使得该模型能够基于输入的