首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

姚班斯隆奖马腾宇正式宣布大模型创业

2023-11-01 16:46 · 稿源:站长之家

要点

1. 清华姚班校友、斯坦福助理教授马腾宇宣布创办Voyage,一个专注于嵌入模型的创业项目,其嵌入模型在MTEB数据集上表现超越OpenAI,成为SOTA。

2. Voyage的嵌入模型强调高检索精度,使用自监督损失函数和多领域训练数据,具有出色的性能,尤其在工业领域数据集上表现明显。

3. Voyage提供标准版和轻量版两个版本,价格为每100万token0.4美元,新用户可以免费试用5000次,未来还将推出XL规模和代码金融领域版本。

站长之家(ChinaZ.com)11月1日 消息:清华姚班校友兼斯坦福大学助理教授马腾宇宣布了一个引人注目的创业项目,名为Voyage,旨在提供卓越的嵌入模型。这个嵌入模型在MTEB数据集上表现超越OpenAI,成为SOTA。该项目的成功也得益于三位知名教授,包括斯坦福人工智能实验室主任Christopher Manning和AI领域著名华人学者李飞飞,他们担任了Voyage的学术顾问。

image.png

Voyage的嵌入模型强调高检索精度,用于将文本向量化。与生成式模型相比,嵌入模型更注重语义理解,利用神经网络(通常是Transformer架构)来捕获和压缩语义上下文。该团队花费了五年时间收集海量训练数据和开发预处理和后处理方法,最终打造出SOTA的嵌入模型。测试结果显示,Voyage在MTEB数据集上超过OpenAI,且在工业领域数据集上表现更出色。此外,Voyage承诺未在MTEB上作弊,并提出了9个真实世界数据集,其中大部分取得了最佳成绩,有些甚至表现出色。

技术上,Voyage采用了自监督损失函数和多领域的训练数据,同时使用了新的微调技术,无需人工标注。该嵌入模型可通过API或Python库调用,支持最大窗口长度为4096个token。Voyage目前提供标准版和轻量版两个版本,价格为每100万token0.4美元,新用户可以免费试用5000次,未来还将推出更多版本,包括XL规模和金融领域版本。

总的来说,Voyage的创始人兼CEO马腾宇是清华姚班校友,斯坦福大学助理教授,他的团队致力于提供高质量的嵌入模型,为检索增强生成(RAG)应用和搜索领域提供更先进的解决方案。这一创业项目在嵌入模型领域取得了巨大的成功,展现了创新技术的潜力。

举报

  • 相关推荐
  • 大模型时代:内容产业智变新浪潮

    腾讯研究院院长司晓在第15届中国(深圳)国际文化产业博览交易会上发表演讲,指出大模型技术正推动文化内容生产从"专业主导"转向"全民共创"。大模型已从工具赋能升级为生态重构,显著提升内容生产效率和质量,如腾讯混元模型支持实时图像生成与调整。AI技术加速影视、音乐等内容创作,如上海民族乐团与腾讯音乐合作的AI音乐会《零·壹 | 中国色》。同时,大模型在理解与交互能力上取得突破,如GPT-4o能准确识别物体细节。腾讯通过"探元计划"推动科技与文化融合,如"云游敦煌"等项目。未来,AI将实现"智力即服务",大幅提升创作效率和质量,推动文化内容产业进入"千人千面"新时代。

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • 智能体时代,还得看豆包大模型

    火山引擎,又有大动作了。 2025年6月11日,火山引擎Force原动力大会发布豆包大模型1.6、视频生成模型Seedance1.0pro等重磅新模型,以及迭代了一站式AI云原生全栈服务。 对此,字节跳动CEO梁汝波表示:“做好火山引擎对字节跳动成为一家优秀的科技公司、保持技术竞争力很重要。未来,字节跳动会坚定长期投入,追求智能突破,服务产业应用。通过火山引擎,持续把新模型、新�

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 真学霸!豆包大模型1.6正式发布:高考数学卷获144分 全国第一

    今日,字节跳动旗下火山引擎举办FORCE原动力大会,正式发布豆包大模型1.6。 新系列包括三个大模型,分别是Doubao-Seed-1.6-thinking、Doubao-Seed-1.6、Doubao-Seed-1.6-flash。 火山引擎总裁谭待表示,Doubao-Seed-1.6是首个支持256k长上下文的大模型。 以thinking模型为例,其思考能力强化,支持多模态,Doubao-Seed-1.6则支持on/off/auto三种思考模式。 在高考全国新一卷数学单科测试中,豆包大模�

  • 东风汽车奕派007接入豆包大模型

    东风汽车旗下电动品牌奕派推出2025款奕派007,全面接入豆包大模型,实现三大智能化创新:1)毫秒级响应的全场景语音交互,支持10个高频指令同时处理;2)"情绪管家"模式可主动提供娱乐内容调节驾乘情绪;3)结合AIGC技术实现旅途画面一键艺术化创作分享。该车型通过智能决策能力和个性化服务重构人车关系,定位为Z世代"AI搭子"。未来将与火山引擎合作探索更多智能出行场景,构建差异化竞争力。

  • 水滴信用惊艳亮相火山引擎原动力大会,展示企业大数据大模型成果

    6月11日,2025火山引擎春季FORCE原动力大会在北京国家会议中心举行。大会聚焦大模型与AI云原生等前沿技术,汇聚行业精英探讨AI转型机遇与创新产品落地路径。水滴信用作为合作伙伴惊艳亮相,展示其企业大数据MCP成果。火山引擎智能算法负责人吴迪发表主题演讲,介绍其MCP服务通过搭建三座桥梁连接开发者生态、大模型工具和云服务,助力构建复杂Agent系统。水滴信用凭借多年企业数据服务积累,整合全国超3.7亿市场主体信用信息,推出企业大数据MCP解决方案,实现企业信用信息一站式智能分析。此次合作不仅展示技术实力,更为企业信用信息服务行业智能化升级树立新标杆,推动行业迈向"数据驱动、智能决策"新时代。

  • 九四智能亮相大阪,AI大模型驱动全球企业实现智能化转型

    2025年5月28-29日,九四智能(94AI)将携自主研发的"大模型联络中心"解决方案亮相大阪"2025呼叫中心CRM演示和会议"。该方案通过AI Agent技术实现从用户触达、需求挖掘到服务闭环的全流程自动化,助力企业重构客户服务与运营效率。作为智能语音领域领军企业,九四智能已在金融、电商、保险等行业积累创新实践,其解决方案支持多语种与文化适配,满足GDPR等全球合规要求。会议重点探讨了数字化转型背景下AI与CRM系统的深度融合,展示了AI在跨境场景中的语言、文化及合规优势。未来,九四智能将持续推动全球企业智能化转型。

  • 大模型都能冲清北了?首个AI高考总分评测结果出炉

    7家国产大模型参加2025年辽宁高考模拟测试,结果显示:腾讯元宝在文科考试中以667.5分夺冠,接近清北录取线;豆包、讯飞星火分别以655分和652分紧随其后,均达985高校水平。理科方面,豆包以635分领先,元宝和Kimi分别获得632.5分和629分。测试发现大模型在文科表现优于理科,尤其在语文作文和数学解题能力突出,元宝数学获得149分高分。但在理科综合科目存在短板,物理化学的解题过程和知识点推导不够完整,图像符号理解不足。相比去年,今年大模型整体能力显著提升,已从"文科一本、理科二本"水平进步到冲击顶尖高校的水平,展现了国产AI的快速发展。

  • 加速产业智能化发展 每日互动“可信数据空间+可控大模型”数享会成功召开

    5 月 17 日,“瓯江论数数安未来” 2025 数据安全发展大会在温州开幕,行业大咖、专家学者、企业精英相聚瓯江之畔,共商数据要素市场化配置改革的“温州实践”,共绘数据安全与价值释放的“中国方案”。作为中国(温州)数安港“九个一”基本架构之一,本次数据安全发展大会旨在深入剖析数据产业发展新趋势、新挑战、新机遇,挖掘数据在数字经济时代的潜在价值,�