首页 > 业界 > 关键词  > 大模型最新资讯  > 正文

姚班斯隆奖马腾宇正式宣布大模型创业

2023-11-01 16:46 · 稿源:站长之家

要点

1. 清华姚班校友、斯坦福助理教授马腾宇宣布创办Voyage,一个专注于嵌入模型的创业项目,其嵌入模型在MTEB数据集上表现超越OpenAI,成为SOTA。

2. Voyage的嵌入模型强调高检索精度,使用自监督损失函数和多领域训练数据,具有出色的性能,尤其在工业领域数据集上表现明显。

3. Voyage提供标准版和轻量版两个版本,价格为每100万token0.4美元,新用户可以免费试用5000次,未来还将推出XL规模和代码金融领域版本。

站长之家(ChinaZ.com)11月1日 消息:清华姚班校友兼斯坦福大学助理教授马腾宇宣布了一个引人注目的创业项目,名为Voyage,旨在提供卓越的嵌入模型。这个嵌入模型在MTEB数据集上表现超越OpenAI,成为SOTA。该项目的成功也得益于三位知名教授,包括斯坦福人工智能实验室主任Christopher Manning和AI领域著名华人学者李飞飞,他们担任了Voyage的学术顾问。

image.png

Voyage的嵌入模型强调高检索精度,用于将文本向量化。与生成式模型相比,嵌入模型更注重语义理解,利用神经网络(通常是Transformer架构)来捕获和压缩语义上下文。该团队花费了五年时间收集海量训练数据和开发预处理和后处理方法,最终打造出SOTA的嵌入模型。测试结果显示,Voyage在MTEB数据集上超过OpenAI,且在工业领域数据集上表现更出色。此外,Voyage承诺未在MTEB上作弊,并提出了9个真实世界数据集,其中大部分取得了最佳成绩,有些甚至表现出色。

技术上,Voyage采用了自监督损失函数和多领域的训练数据,同时使用了新的微调技术,无需人工标注。该嵌入模型可通过API或Python库调用,支持最大窗口长度为4096个token。Voyage目前提供标准版和轻量版两个版本,价格为每100万token0.4美元,新用户可以免费试用5000次,未来还将推出更多版本,包括XL规模和金融领域版本。

总的来说,Voyage的创始人兼CEO马腾宇是清华姚班校友,斯坦福大学助理教授,他的团队致力于提供高质量的嵌入模型,为检索增强生成(RAG)应用和搜索领域提供更先进的解决方案。这一创业项目在嵌入模型领域取得了巨大的成功,展现了创新技术的潜力。

举报

  • 相关推荐
  • 大家在看
  • 大模型创业淘汰潮开始了:这是第一个估值 10 亿美元的祭品

    风雨飘摇中的StabilityAI还能走多远?近期,AI绘画神器StableDiffusion背后的开发公司StabilityAI发生一系列变动,包括CEOEmadMostaque在内的多名核心高管、技术人员离职,公司面临现金流危机。《福布斯》援引StabilityAI内部文件以及30多名现任和前任员工、投资者和行业专家的声明称,前StabilityAICEOEmadMostaque带领的管理层存在诸多问题:图源备注:图片由AI生成,图片授权服务商MidjourneyStabil

  • 李彦宏大模型创业”400天

    “过去这一年,我跟很多创业者、开发者交流,感觉大家都处在一种‘FOMO’状态,既兴奋、又害怕错过。”面对在生成式AI浪潮中正被彻底改变的开发者群体,4月16日对外演讲中,李彦宏率先谈起了他们所遭遇的选择迷茫问题。在文字、图片、语音、视频等多模态大模型的长期竞争中,留给李彦宏的新挑战之一便是,如何带领百度继续保持模型性能的领先优势。

  • 孟子3-13B大模型正式开源

    澜舟科技近日宣布,其研发的孟子3-13B大模型正式开源,并向学术研究领域全面开放,同时支持免费商用。这一轻量化大模型在多项基准测试中展现了优异的性能,特别是在参数量20B以内的模型中,其中英文语言能力尤为突出,数学和编程能力也位于行业前列。这一举措无疑将推动大模型技术的发展和应用,为AI产业的进步贡献力量。

  • 聚焦AI大模型 激发城市新活力 城市云数字领军人才研修·东莞站成功举办

    新一代人工智能发展如火如荼,大模型如何落地推动数字转型赋能城市发展?4月25日,以“AI大模型打造城市新质生产力”为主题的城市云数字领军人才研修班在东莞举办。国家信息中心信息化和产业发展部主任单志广、东莞市发展与改革局副局长魏亚东、中国信息通信研究院云计算与大数据研究所政企数字化转型部主任徐恩庆、广东工业大学机电工程学院院长刘强、华为云中国区副总裁刘少华,全国20多个省市城市数字化建设相关负责人等政府、高校、研究院以及企业的专家、学者参加了此次活动。“城市云数字领军人才研修班”将针对不同层级、领域、区域的数字化建设者,建立差别化的课程体系,紧扣智慧城市、数字政府、数字化转型实际需要,增强学员的数字思维和专业素质,为全面增强数字城市建设效能提供重要人才保障。

  • 百度正式发布文心大模型4.0工具版

    文心大模型4.0的工具版正式问世。这款大模型在通用能力上取得了显著进步,特别是在代码生成、解释和优化等方面,已经达到国际先进水平。文心大模型4.0的工具版的发布,将为广大用户带来更加便捷、高效的AI体验,助力各行各业实现智能化升级。

  • 聚焦AI大模型与城市新质生产力 全国城市云数字领军人才研修东莞站即将开班

    建设数字中国是数字时代推进中国式现代化的重要引擎,是构筑国家竞争新优势的有力支撑。当前,以大模型为代表的人工智能正加速数字经济与实体经济深度融合,推动新质生产力的形成,今年的政府工作报告首 次将开展“人工智能+”行动写入其中,人工智能已成为我国加快发展新质生产力的核心驱动力。当前,全国各大省市也正积极推进大模型的布局,探索智慧城市发展

  • 蚂蚁云科技集团正式发布以正教育大模型,专注因材施教

    4月12日,蚂蚁云科技集团成功举办“智以育人、慧正无界——以正教育大模型产品发布会”,该产品致力于智慧教育变革,让因材施教成为可能。上海科学技术交流中心科技企业服务处处长陈霖博士、中国信通院华东分院院长廖运发、上海市科协常委马慧民博士等出席并致辞;南威软件集团执行总裁洪创业、蚂蚁云科技集团董事长冯乔羽、蚂蚁云科技集团CEO蒋俊、蚂蚁云科技集�

  • 挑战拯救痴心“舔狗”,我和大模型都尽力了

    大模型化身为“痴情男大”,等待人类玩家的拯救。一款名为“拯救舔狗”的大模型原生小游戏出现了。大模型在学习这个世界,也在创造一个AINative的世界,无论是大模型原生小游戏是功能越来越全的大模型对话,都在展现世界内容的互动变革,随着尺度规律的不断发展,下一步会怎样?在这次技术交流日上,商汤最后放出了一段文生视频,一起来看看。

  • 巨头狂卷代码大模型

    让AI写代码正在越来越流行。今天蚂蚁集团智能研发平台CodeFuse推出了“图生代码”技术,这一技术集成在CodeFuse上,可将网页、App等设计图一键转化成前端代码。

  • 每日互动持续增强大模型能力,推出、升级多款大模型应用产品

    人工智能引领的"第四次工业革命"正在到来,特别是2023年以来,以大模型、多模态、生成式为特征的新一轮人工智能浪潮席卷全球,带来新的变革。在这机遇与挑战并存的时期,国内专业的数据智能服务商--每日互动快速响应、积极探索大模型、AIGC等先进数智技术,升级产品性能,驱动业务创新,并储备公司下一条S型曲线。每日互动本身就是优质数据资源的持有方,因此在未来,拥有海量鲜活的数据积累、深厚沉淀的数据治理能力、丰富多元的数据应用场景的每日互动将更有可为。

今日大家都在搜的词: