首页 > 热点 > 关键词  > 正文

智源开源中英文语义向量模型BGE 支持免费商用

2023-08-07 15:52 · 稿源:站长之家

站长之家(ChinaZ.com)8月7日 消息:近日,智源发布最强开源可商用中英文语义向量模型BGE(BAAI General Embedding),在中英文语义检索精度与整体语义表征能力均超越了社区所有同类模型,如OpenAI 的text embedding002等。

此外,BGE 保持了同等参数量级模型中的最小向量维度,使用成本更低。

据介绍,中文语义向量综合表征能力评测 C-MTEB 的实验结果显示,BGE中文模型(BGE-zh)在对接大语言模型最常用到的检索能力上领先优势尤为显著,检索精度约为 OpenAI Text Embedding002的1.4倍。

与中文能力相类似,BGE 英文模型(BGE-en)的语义表征能力同样出色。根据英文评测基准 MTEB 的评测结果(Table2),尽管社区中已有不少优秀的基线模型,BGE 依然在总体指标(Average)与检索能力(Retrieval)两个核心维度超越了此前开源的所有同类模型。

同时,BGE 的各项能力都显著超越社区中最为流行的选项:OpenAI Text Embedding002。

微信截图_20230807155429.png

BGE 模型链接:

https://huggingface.co/BAAI/

BGE 代码仓库:

https://github.com/FlagOpen/FlagEmbedding

C-MTEB 评测基准链接:

https://github.com/FlagOpen/FlagEmbedding/tree/master/benchmark

举报

  • 相关推荐
  • 开源中英文语义向量模型训练数据集MTP

    智源研究院发布面向中英文语义向量模型训练的大规模文本对数据集MTP。这是全球最大的中、英文文本对训练数据集,数据规模达3亿对,希望推动解决中文模型训练数据集缺乏问题。作为中国大模型开源生态圈的代表机构,智源持续进行包括数据在内的大模型全栈技术开源,推动人工智能协同创新。

  • 开源大模型正在“杀死”闭

    “OpenAI不足为惧,开源会慢慢赶上来。”彼时HuggingFace创始人ClemDelangue的一句预言,正在迅速成为现实。这也足以说明,开源还是闭源,或许只是阶段和位置的不同,但可以肯定的是,大模型时代,已经加速进入下一赛段。

  • 元象开源70亿参数通用大模型 XVERSE-7B 免费商用

    元象宣布开源70亿参数通用大模型XVERSE-7B底座与对话版,这是一款全开源、免费可商用的模型。相比之前的XVERSE-13B,7B版本更小巧,可以在单张消费级显卡上运行,并且推理量化后最低只需6GB显存,大大降低了开发门槛和推理成本。●XVERSE-7B-Chat是底座模型经SFT指令精调后的中英文对话模型,大幅提升了理解和生成内容的准确度,也更符合人类的认知偏好。

  • 支付宝上线境外租车服务:提供24小时中英文客服服务

    快科技9月27日消息,中秋与国庆双节假期即将来临,不少游客选择自驾游,支付宝为此上线了境外租车”服务,联合租租车为用户提供全球近200个国家和地区的租车服务。用户上支付宝搜支付宝租车”,选择境外租车”即可预定,租车服务地包含了国人热门出境游目的地国家,如:泰国、韩国、意大利、美国、澳大利亚、新西兰等。并由租租车提供24小时的中英文客服服务,帮助用户的用车答疑、事故跟进处理等,保证了租车用户去到任何时区的国家和地区,都能享受到全天候客服保障。据了解,9月28日前,用户还可在页面免费办理国际驾照认证件(TIDL)?

  • 开源标杆!最强中英双语大模型来了,340亿参数,超越 Llama2-70B等所有开源模型

    开源界最强的中英双语大模型,悟道·天鹰34B,来了!有多强?一言蔽之:不仅模型够大够能打还一口气送上整套“全家桶”级豪华周边。能有如此大手笔的,正是中国大模型开源派先锋——智源研究院。Aquila2模型全系开源地址:https://github.com/FlagAI-Open/Aquila2https://model.baai.ac.cn/https://huggingface.co/BAAIAquilaSQL开源仓库地址:https://github.com/FlagAI-Open/FlagAI/tree/master/examples/Aquila/Aquila-sqlFlagAttenti

  • 智源研究院开源中英双语大模型悟道·天鹰340亿Aquila2-34B

    智源研究院发布了最强开源中英双语大模型——悟道・天鹰340亿。这个新模型在推理、泛化等方面表现出色,在智能体、代码生成、文献检索等场景方面取得了一系列成绩。智源研究院还发布了FlagScale高效并行训练框架和FlagAttention高性能Attention算子集,进一步推动大模型研究的发展。

  • 团队推出「生长策略」 解决大模型训练算力成本过高问题

    智源研究院联合中科院计算所、南洋理工大学、电子科技大学、哈尔滨工业大学的研究团队共同提出了一种「生长策略」,以解决大模型算力成本极高的问题。研究团队基于「生长策略」逐步构建了一个具有1010亿参数的FLM-101B大模型。实验结果显示,FLM-101B在这些评测任务上表现出了非常好的能力。

  • 融资1亿美元的类ChatGPT模型开源啦!可商用,8个模型

    「AIGC开放社区」为大家介绍了融资1亿美元的生成式AI平台Writer。该企业能在短短3年时间获得1.26亿美元总融资成为ChatGPT的主要竞争对手之一,与其精湛的技术密不可分,同时充分证明其模型有成功的应用案例并获得资本、用户的认可。Palmyra非常值得那些希望将大语言模型实现商业化的开发者们,研究其模型架构和功能借鉴其成功经验。

  • 挑战GPT-4V!清华唐杰&开源国产多模态模型CogVLM-17B

    清华大学与智谱AI合作开发的CogVLM-17B是一款国产多模态模型,具有卓越的性能。该模型不仅可以识别图像中的对象能分辨完整可见和部分可见的物体。其深度融合方法的创新性标志着多模态模型训练范式的改变,为未来的研究和应用提供了新的思路和可能性。

  • 清华等开源多智能体框架AgentVerse 可让多个模型之间进行协作

    AgentVerse是一个旨在促进多个大型语言模型之间协作的多智能体框架。虽然单个LLM在各种任务上表现出色,但面对复杂任务或需要提高效率的情况,多个智能体之间的协作变得至关重要。这一框架的发展对于推动自然语言处理和人工智能领域的研究和应用具有重要意义。