首页 > 业界 > 关键词  > 长文本最新资讯  > 正文

“大海捞针”out!“数星星”成测长文本能力更精准方法,来自鹅厂

2024-04-02 13:40 · 稿源: 量子位公众号

大模型长文本能力测试,又有新方法了!腾讯MLPD实验室,用全新开源的“数星星”方法替代了传统的“大海捞针”测试。相比之下,新方法更注重对模型处理长依赖关系能力的考察,对模型的评估更加全面精准。利用这种方法,研究人员对GPT-4和国内知名的Kimi Chat进行了“数星星”测试。结

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 为了让AI替你上班,我们实测了两款爆火的长文本AI工具

    AI的“记忆力”越来越好了!过去,如果你把一份长文本粘贴到ChatGPT对话框,或者忍不住和它多聊了两句,它会告诉你“文本过长,请开个对话框重新聊。”如今只需把文件传给AI,就能在几分钟之内完成多个长文本的总结、检索和提取。且KimiChat在支持上传的文档数量和格式方面提供了更多的可能性,让用户有更多探索的空间。

  • 卷完参数后,大模型公司又盯上了“长文本”?

    4000到40万token,大模型正在以“肉眼可见”的速度越变越“长”。“国内大模型市场格局会分为toB和toC两个不同的阵营,在toC阵营里,会出现super-app,这些超级应用是基于自研模型做出来的。长文本的“不可能三角”困境或许暂时还无解,但这也明确了大模型厂商在长文本的探索路径:在文本长短、注意力和算力三者之中做取舍,找到最佳的平衡点,既能够处理足够的信息,又�

  • 钉钉AI:好险,差点就被长文本卷到

    现在随便打开一个大模型应用,支持的文本都有那————么长。7亿人在用的钉钉也加入战局,一出手就是长文本、多模态和工作流三大能力升级,全是最热门的AI迭代方向。“AIGC一天,人间一年”,我们离真正的第一个AI超级应用,已经不远了。

  • 真假“长文本”,国产大模型混战

    Kimi有多火爆?凭一己之力搅乱A股和大模型圈。Kimi概念股连日引爆资本市场,多个概念股随之涨停。对大模型厂商,特别是创业公司来说试错的机会并不多,不能刚从技术的坑出来,又一头扎进投流的坑,跟风长文本不能解决所有问题,跑出商业化模式才是。

  • 3G版手机QQ空间升级 支持长文本新增好友问问

    登录手机QQ空间3G版之后,我发现3G版的UI更加绚丽,更加贴近PC版QQ空间的设计风格。在应用页面增加了“好友问问”,同时QQ农场、QQ牧场保留“一键”功能外,在UI设计上更加人性化。

  • 讯飞星火焕新,上线“超级知识助手”,跳出“长文本”混战

    2024年4月26日,科大讯飞的星火大模型V3.5春季上新,一句话声音复刻功能让科技更有温度;推出星火智能体平台,助企业解决大模型应用落地“最后一公里”难题;确定6月27日正式发布讯飞星火V4.0……这其中,讯飞星火成为业界首个支持“长文本、长图文、长语音”的大模型,成功抓住用户高效准确知识获取的痛点,尤为引人瞩目。长文文字长度“全球第一”的攀比变得索然无趣

  • 阿里、百度双双出手,大模型长文本时代终于到来?

    AGI时代,越来越近了。全民Long-LLM时代终于到来。在大模型长文本技术的支持下,AGI时代将在不久后真正到来。

  • Kimi首发“上下文缓存”技术,助推长文本大模型降本90%

    近日,月之暗面宣布Kimi开放平台正式公测新技术——上下文缓存,该技术在API价格不变的前提下,可为开发者降低最高90%的长文本大模型使用成本,并且显著提升模型的响应速度。据了解,月之暗面是国内首家面向开发者推出上下文缓存技术的大模型公司。Kimi开放平台陆续上线了工具调用、PartialMode、上下文缓存等能力,持续帮助开发者高效打造更有想象力的AI应用。

  • 匿名论文提出奇招,增强大模型长文本能力居然还能这么做

    一提到提高大模型长文本能力,就想到长度外推或者上下文窗口扩展?不行,这些都太费硬件资源了。来看一个奇妙新解:和长度外推等方法使用KV缓存的本质不同,它用模型的参数来存储大量上下文信息。不过从邮箱信息来看,可能来自港城大、港中文等学校。

  • Meta发布Llama 2-Long模型 处理长文本计算量需求减少40%

    Meta最新发布的Llama2-Long模型引领着处理长文本的革命。这个模型不仅处理长文本输入在不显著增加计算需求的情况下,保持了卓越性能。它不仅改进了处理长文本的性能通过创新策略为该领域注入了新的活力。

今日大家都在搜的词: