11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
智源研究院发布面向中英文语义向量模型训练的大规模文本对数据集MTP。这是全球最大的中、英文文本对训练数据集,数据规模达3亿对,希望推动解决中文模型训练数据集缺乏问题。作为中国大模型开源生态圈的代表机构,智源持续进行包括数据在内的大模型全栈技术开源,推动人工智能协同创新。
智源发布最强开源可商用中英文语义向量模型BGE,在中英文语义检索精度与整体语义表征能力均超越了社区所有同类模型,如OpenAI的textembedding002等。BGE保持了同等参数量级模型中的最小向量维度,使用成本更低。BGE的各项能力都显著超越社区中最为流行的选项:OpenAITextEmbedding002。