首页 > 业界 > 关键词  > 模型最新资讯  > 正文

Jina AI 推出“jina-embeddings-v2”:全球首个8k 开源文本嵌入模型

2023-11-02 14:55 · 稿源:站长之家

站长之家(ChinaZ.com)11月2日 消息:Jina AI 公布了其第二代文本嵌入模型最新进展:jina-embeddings-v2。这个最先进的模型是唯一支持8K(8192个token)上下文长度的开源解决方案。这一成就使其在功能和在大规模文本嵌入基准 (MTEB) 排行榜上的性能方面与 OpenAI 的专有模型 text-embedding-ada-002相当。

Jina-embeddings-v2是开源文本嵌入模型的一大步,在容量和基准性能方面可与已建立的专有对应物相媲美。它的性能优于 OpenAI 的8K 模型 jina-embeddings-v2。值得注意的是,与 OpenAI 相比,Jina-embedding-v2在分类平均值、重新排名平均值、检索平均值和摘要平均值等关键指标上表现出更出色的性能。

研究人员表示,Jina-embeddings-v2以其先进的功能彻底改变了各种应用程序。在法律文件分析中,它捕捉和分析大量法律文本中的每一个错综复杂的细节。对于医学研究,它嵌入了科学论文,促进了整体分析并促进了突破性的发现。该模型深入研究文学分析中的长篇内容,捕捉主题元素以进行更丰富的理解。财务预测使用户能够从详细的财务报告中获得卓越的洞察力,从而增强决策过程。在对话式 AI 中,Jina Embeddings V2显著改善了聊天机器人对复杂用户查询的响应。凭借其多功能和强大的功能,Jina Embeddings V2站在改变我们处理各个领域复杂数据集和从中获取见解的方式的最前沿。

image.png

测试表明,这种支持上下文的 jina-embeddings-v2优于其他领先的基础嵌入模型,强调了更长上下文功能的实际优势。

研究人员表示,他们计划发表一篇学术论文,详细介绍Jina-embeddings-v2的技术复杂性和基准,为AI社区提供更深入地探索该模型能力的机会。该团队正在开发一个类似于 OpenAI 的嵌入 API 平台,该平台已进入高级阶段,可确保用户根据他们的需求量身定制的嵌入模型的无缝可扩展性。此外,Jina AI正在通过涉足多语言嵌入来扩大其语言能力,并打算引入德语-英语模型。此次扩张旨在增强他们的产品组合,并巩固他们作为人工智能创新领导者的地位。

该模型可以在 Hugging Face 上轻松免费下载。基础模型专为需要高精度的苛刻任务而制定,适用于学术研究或商业分析等领域。相比之下,小型型号的体积仅为0.07G,专为轻量级任务而设计,非常适合计算资源有限的移动应用程序或设备上的应用程序。认识到人工智能社区的不同需求,Jina AI提出了这两种不同的模型选项,允许用户选择最适合其计算需求并符合其应用偏好的模型。

项目地址:https://huggingface.co/jinaai/jina-embeddings-v2-base-en?ref=jina-ai-gmbh.ghost.io

官方介绍网址:https://jina.ai/news/jina-ai-launches-worlds-first-open-source-8k-text-embedding-rivaling-openai/

举报

  • 相关推荐
  • 九四智能大模型联络中心:重塑教育行业运营逻辑

    文章分析了教培行业面临的获客成本高、人工客服效率低、用户画像不清晰等痛点,指出九四智能通过AI交互引擎提供全场景智能运营服务,覆盖获客、用户运营、业务通知等环节,结合语音识别、大数据分析等技术实现降本增效,并通过典型案例展示了实际应用效果。

  • 最高提效8倍!腾讯游戏发布专业游戏AI大模型,美术师做动画不用辣么“肝”了

    在最近与科隆国际游戏展同期举办的Devcom开发者大会上,AI再次赚足了脸面。 微软、腾讯、谷歌、Meta等国际巨头带来超过20场AI相关议题,“AI如何提升游戏美术生产效率”、“AI工具如何与传统工作流无缝集成”、“AI在动画生成、场景构建等具体环节的应用案例”成为开发者们探讨的重点内容。 近年来,游戏美术对精细度的要求呈现指数级增长。随之而来的是几何级增长的

  • 寒武纪智能芯片赋能多模态大模型应用

    大模型快速发展推动人工智能技术迈向新阶段,从解决特定任务的弱人工智能向处理通用复杂任务的强人工智能演进。IDC报告显示,2024年中国大模型开发平台市场规模达16.9亿元,人工智能算力市场约190亿美元,预计2025年将达259亿美元。寒武纪等企业专注AI芯片研发,推出多款处理器及加速卡产品,支持大模型训练推理及多模态任务,并与产业链合作共同推进人工智能产业发展。

  • 如何精准计算AI大模型调用成本?复杂参数太多,预算总超支怎么办?

    文章探讨了AI模型调用成本管理的痛点,包括GPT-4等模型复杂的计费规则(如Token分级、上下文溢价、多模态叠加收费)导致实际成本常超预算40%。提出AIbase计算器三步解决方案:自动匹配场景参数、实时联动报价、明细成本拆解。通过跨境电商客服和高校实验室案例验证工具有效性,强调数据溯源、用量预警和预算缓冲功能,帮助开发者实现精准成本控制,告别手动制表与定�

  • AI大模型计费器如何精准比价?38款模型隐藏费用一键预警,三步告别超支

    文章揭示了AI项目成本失控的三大痛点:1)计费维度分裂,如输入/输出token分开计价;2)参数迷雾,如文心一言4.0增强模式成本是基础版3.2倍;3)汇率陷阱,海外模型美元报价波动导致实际成本偏差超15%。通过AIbase费用计算器可精准测算:支持38个主流API对比,包含隐藏费用提醒,提供四大维度的决策矩阵(百万token成本/长文本溢价/月度总价/性价比评分)。案例显示某团队发现自研模型成本比通义千问高27%后及时调整采购策略。该工具能帮助开发者避免"成本黑箱",实现零成本预算推演。

  • 将AI大模型费用计算器作为战略工具:企业如何规避AI项目的成本陷阱

    AI项目规模化应用面临不可预测的运营成本挑战,尤其是大模型API调用费用难以精准预测,导致项目ROI计算失效。成本失控源于计费维度复杂、价格变动频繁及用户行为影响。领先企业通过成本管控前移,在项目可行性分析阶段引入AIbase等成本计算工具,实现成本可视化,支持技术选型和预算建模,从被动应对转向主动管理,提升AI应用的经济性和可持续竞争力。

  • 昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

    中国科学技术大学张燕咏团队在昇腾算力支持下,成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略,有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题,显著提升推理性能。实验显示,该方案在多项指标上较主流方案提升超30%,为昇腾技术优化MoE模型推理提供了宝贵借鉴,将加速其在各领域的落地应用。

  • AI日报:即梦上线智能多帧功能;可灵2.1首尾帧升级;钉钉推语音识别大模型Fun-ASR

    AI日报栏目汇总近期AI领域重要进展:腾讯元宝接入DeepSeek V3.1提升智能助手能力;即梦AI推出多帧功能简化视频制作;可灵AI首尾帧功能升级效果提升235%;钉钉与通义实验室联合发布Fun-ASR语音识别大模型;腾讯CodeBuddy IDE国内版公测;Vercel发布AI Gateway简化模型调用;Anthropic整合Claude Code强化企业开发;阿里发布Mobile-Agent-v3突破GUI自动化;Qoder平台革新编程模式;清华团队GUAVA框架实现0.1秒3D化身生成;谷歌搜索新增AI Agent功能;VAST推出Tripo 3.0推动3D内容创作。

  • 如何快速精准计算AI大模型费用?试试这个三步完成的免费工具!

    文章讲述AI项目预算失控的普遍现象:李工团队因手动计算GPT-4等大模型调用成本复杂,最终预算比实际支出少25%。行业调查显示73%团队曾因模型成本失控被迫调整项目。AIbase推出三步极速成本计算器解决痛点:1)集成50+主流大模型参数库;2)用自然语言描述需求即可生成预算;3)10秒输出详细成本对比报告。该工具已帮助电商企业节省40%预算,其优势在于实时追踪官方定价、智能匹配场景规则、自动生成多模型对比报告,让晦涩的token计价变得直观透明。目前已有超12万开发者使用该工具优化AI项目成本。

  • 如何用3分钟精准计算AI大模型成本?避免生成一篇万字文章就超支?

    AI大模型成本控制指南:实测三步预算法+企业级避坑方案。文章揭露行业痛点:1)价格迷雾:各厂商计费规则差异大,长文本/多模态存在隐藏溢价;2)团队实测GPT-4生成20篇行业分析(50万字)实际账单超预算4倍。解决方案:通过AIbase计算器实现精准预测:①场景化选择自动加载计费规则;②输入需求实时生成动态成本矩阵;③智能规避四大隐性成本(长文本衰减补偿/区域差价预警等)。跨境电商案例显示,使用工具后成本降低60%。核心观点:在AI时代,成本控制能力已成为企业核心竞争力。

今日大家都在搜的词:

热文

  • 3 天
  • 7天