Jina AI 推出“jina-embeddings-v2”:全球首个8k 开源文本嵌入模型

2023-11-02 14:55 · 稿源：站长之家

站长之家（ChinaZ.com）11月2日消息:Jina AI 公布了其第二代文本嵌入模型的最新进展:jina-embeddings-v2。这个最先进的模型是唯一支持8K（8192个token）上下文长度的开源解决方案。这一成就使其在功能和在大规模文本嵌入基准 (MTEB) 排行榜上的性能方面与 OpenAI 的专有模型 text-embedding-ada-002相当。

Jina-embeddings-v2是开源文本嵌入模型的一大步，在容量和基准性能方面可与已建立的专有对应物相媲美。它的性能优于 OpenAI 的8K 模型 jina-embeddings-v2。值得注意的是，与 OpenAI 相比，Jina-embedding-v2在分类平均值、重新排名平均值、检索平均值和摘要平均值等关键指标上表现出更出色的性能。

研究人员表示，Jina-embeddings-v2以其先进的功能彻底改变了各种应用程序。在法律文件分析中，它捕捉和分析大量法律文本中的每一个错综复杂的细节。对于医学研究，它嵌入了科学论文，促进了整体分析并促进了突破性的发现。该模型深入研究文学分析中的长篇内容，捕捉主题元素以进行更丰富的理解。财务预测使用户能够从详细的财务报告中获得卓越的洞察力，从而增强决策过程。在对话式 AI 中，Jina Embeddings V2显著改善了聊天机器人对复杂用户查询的响应。凭借其多功能和强大的功能，Jina Embeddings V2站在改变我们处理各个领域复杂数据集和从中获取见解的方式的最前沿。

测试表明，这种支持上下文的 jina-embeddings-v2优于其他领先的基础嵌入模型，强调了更长上下文功能的实际优势。

研究人员表示，他们计划发表一篇学术论文，详细介绍Jina-embeddings-v2的技术复杂性和基准，为AI社区提供更深入地探索该模型能力的机会。该团队正在开发一个类似于 OpenAI 的嵌入 API 平台，该平台已进入高级阶段，可确保用户根据他们的需求量身定制的嵌入模型的无缝可扩展性。此外，Jina AI正在通过涉足多语言嵌入来扩大其语言能力，并打算引入德语-英语模型。此次扩张旨在增强他们的产品组合，并巩固他们作为人工智能创新领导者的地位。

该模型可以在 Hugging Face 上轻松免费下载。基础模型专为需要高精度的苛刻任务而制定，适用于学术研究或商业分析等领域。相比之下，小型型号的体积仅为0.07G，专为轻量级任务而设计，非常适合计算资源有限的移动应用程序或设备上的应用程序。认识到人工智能社区的不同需求，Jina AI提出了这两种不同的模型选项，允许用户选择最适合其计算需求并符合其应用偏好的模型。

项目地址:https://huggingface.co/jinaai/jina-embeddings-v2-base-en?ref=jina-ai-gmbh.ghost.io

官方介绍网址:https://jina.ai/news/jina-ai-launches-worlds-first-open-source-8k-text-embedding-rivaling-openai/

（举报）

相关推荐

关键词：

易鑫正式发布汽车金融行业首个Agentic大模型

易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿，响应延迟低于200毫秒，支持语音实时交互，单卡吞吐达370 tokens/秒，可提升获客、风控与运营效率，解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台，研发投入超20亿元，率先实现AI全场景应用，将持续推动智能汽车金融生态建设。

汽车金融大模型易鑫
登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM，实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用，通过统一“视频流+文本指令→动作轨迹”范式，融合800万条跨任务导航数据，在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施，为规模化商业落地奠定关键基础。

机器狗导航大模型 TrackVLA
大模型+反诈+算力三重突破腾讯云三项成果闪耀金融科技应用场景大赛

10月30日，2025金融街论坛年会金融科技大会公布“金融科技应用场景大赛”终评结果。腾讯云“金融反电诈治理方案”与“基于TCS的AI异构算力管理平台”凭借技术创新性与场景落地能力，从全国89家机构的280个项目中脱颖而出，双双荣获“十佳应用奖”。腾讯混元大模型信贷助手方案获“探索实践奖”。三大方案在金融风控、算力基座及大模型应用三个关键领域展现突出优势，获专家团高度认可。大赛自2021年启动，已成为金融科技领域极具影响力的赛事平台。

金融科技应用场景大赛腾讯云
何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

小鹏汽车在2025科技日发布第二代VLA大模型，颠覆传统“视觉-语言-动作”架构，实现端到端直接输出动作指令，开创物理模型新范式。该模型具备动作生成与物理世界理解能力，参数规模达数十亿级，训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载，推动智驾技术显著进化，同步发布“小径NGP”功能，复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示，大模型将成为物理AI世界的操作系统，并宣布与大众汽车达成战略合作，共同推进智能出行发展。

小鹏汽车 VLA大模型智能出行
免费 GEO品牌可见度查询——让大模型信得过就这么玩

本文探讨在AI时代如何成为大模型信赖的信息源。关键点包括：可信信息源需具备数据来源清晰、内容结构化、可验证追踪等能力；提出五大实操要点——确保数据干净可追溯、采用RAG等技术增强可检索性、保持内容更新与时效性、强化品牌可见度、建立反馈优化机制。同时推荐使用AIBase平台的GEO排名查询工具免费监测内容可见度，通过持续优化提升在大模型入口的推荐概率。

文章搜索核心标签可信信息源
如何检查你的网站是否被大模型引用？AI排名查询工具推荐

本文探讨AI搜索时代网站流量获取新逻辑：传统SEO因Google搜索"零点击"现象失效，而71%用户通过AI工具研究购买决策。文章指出被大语言模型引用成为新流量入口，并推荐使用AIBase等GEO工具监测网站在豆包、DeepSeek等国内主流AI平台的曝光情况。提出三步操作法和三个优化建议：建立监控基线、定期检查变化、聚焦高转化场景。强调在AI搜索时代，内容被LLM引用已成为新的流量生命线。
寒武纪：构建大模型开发到部署的全流程开放服务能力

华鑫证券研报显示，寒武纪2025年上半年业绩亮眼，营收28.81亿元，同比增长4347.82%；归母净利润10.38亿元，增长295.82%。公司募资39.85亿元，重点投向大模型芯片及软件平台建设，以增强AI算力芯片综合实力。凭借云边端一体、软硬协同等技术优势，其产品已获多领域客户认可，覆盖金融、互联网等行业。未来随着技术迭代与生态完善，业绩有望持续提升。

寒武纪 AI算力芯片大模型芯片
新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

苹果因自研大模型项目遇瓶颈，决定引入谷歌Gemini大模型升级Siri，计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数，将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能，支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送，后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

苹果谷歌Gemini Siri升级
简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案，标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑，该模型围绕用户兴趣成长周期设计，提供个性化学习支持：可为未明确兴趣方向的用户智能推荐内容，为入门用户规划学习路径，为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖，并通过社群互动增强学习动力。公司未来将持续优化模型能力，联合行业伙伴构建完整培养体系，推动兴趣教育向个性化、高质量方向发展。

简智AI大模型生成式人工智能兴趣教育

今日大家都在搜的词：

热文

3 天
7天

Jina AI 推出“jina-embeddings-v2”:全球首个8k 开源文本嵌入模型

易鑫正式发布汽车金融行业首个Agentic大模型

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

大模型+反诈+算力三重突破腾讯云三项成果闪耀金融科技应用场景大赛

何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

免费 GEO品牌可见度查询——让大模型信得过就这么玩

如何检查你的网站是否被大模型引用？AI排名查询工具推荐

寒武纪：构建大模型开发到部署的全流程开放服务能力

新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

今日大家都在搜的词：

热文

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

华为Mate 70 Air维修备件价格公布：换主板2499元

OPPO Reno15系列定档11月17日发布

鸿蒙智行：智界R7累计交付量破10万台

真我GT8 Pro阿斯顿马丁F1限量版正式开售售价5499元

特斯拉Model Y L上线外放电功能最高可输出2200瓦功率

小米手表S4 eSIM/Sport宣布支持开通中国移动一号双终端

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

OPPO Reno15系列官宣11月10日发布

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

华为路由X3 Pro今日开启预售：售价1299元起

站长商机