首页 > 业界 > 关键词  > 长文本最新资讯  > 正文

“大海捞针”out!“数星星”成测长文本能力更精准方法,来自鹅厂

2024-04-02 13:40 · 稿源: 量子位公众号

大模型长文本能力测试,又有新方法了!腾讯MLPD实验室,用全新开源的“数星星”方法替代了传统的“大海捞针”测试。相比之下,新方法更注重对模型处理长依赖关系能力的考察,对模型的评估更加全面精准。利用这种方法,研究人员对GPT-4和国内知名的Kimi Chat进行了“数星星”测试。结

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • 为打击 AI 视频乱象,YouTube开启了“去货币化”模式

    随着人工智能生成的内容片段涌入平台,人们最终会采取行动来使其失去货币化……

  • Checkout.com上海新址乔迁并宣布“支付++”战略:以模块化创新与生态协同驱动全球支付升级

    2024年5月16日,全球数字支付服务商Checkout.com在上海启用新办公室,并发布"支付++"战略。该战略通过模块化技术架构和多元化生态联盟,助力企业破解跨境支付难题。Checkout.com亚太区总经理施伯雄表示,大中华区是其重点战略市场,将帮助中国企业应对全球化过程中的支付本地化、风控等挑战。公司推出"模块化+生态化"双引擎,商户可自由组合支付产品,实现技术民主化。现场展示了与Visa、支付宝等30余家合作伙伴构建的跨境支付生态矩阵。上海办公室将承担商户成功引擎和生态协作枢纽两大职能,为中国出海企业提供定制化支付解决方案。

  • 从“烂脸急救”到“抗炎养成”:杜莎之谜去红瓶带来精准改善炎症方法

    文章指出抗泛红护肤需要科学方法而非简单使用网红产品。杜莎之谜品牌建议:1.保持温和清洁习惯,使用氨基酸洁面乳;2.做好"硬防晒+化学防晒"双重防护;3.普通抗红产品只能暂时缓解,建议配合微针疗法;4.推荐使用其去红瓶产品,含超微渗透工艺的抗炎修复成分,能快速抑制炎症并修复细胞。强调抗炎需要"预防-抗炎-修护-巩固"完整闭环,该产品作为核心武器可帮助实现从"烂脸急救"到"健康美肌"的蜕变。

  • 华擎官宣首款AMD极限超频OCF主板!Computex见

    快科技5月18日消息,华擎宣布将在2025年台北电脑展(Computex)上推出一系列新品,其中就包括了首款基于AMD平台的极限超频OCF主板X870E Taichi OCF。此前,华擎已经推出了基于英特尔Z890平台的OCF系列主板,并在DDR5内存超频记录中取得了不错的成绩,此次推出X870E Taichi OCF主板,将为AMD平台的超频爱好者带来新的选择。X870E Taichi OCF主板将配备两个DDR5内存DIMM插槽,这也算是超频主板�

  • 直击铭瑄COMPUTEX 2025(二):深度探秘铭瑄核心展品阵容!

    COMPUTEX 2025展会上,铭瑄科技携多款创新产品亮相,重点展示AI计算与硬件设计的最新成果。其MAXSUN Intel Arc Pro B60 Dual 48G Turbo显卡采用双GPU设计,配备48GB GDDR6显存,支持PCIe5.0接口,大幅降低大模型部署成本。同时推出全新"BKB"形态主板MS-Terminator B850BKB WIFI,采用背插式显卡设计,支持200W+供电能力。铭瑄还展示了Z890系列主板、iCraft B860M CROSS系列及搭载3.4英寸锐影LED显示屏的创新产品,并推出全新PTM UI BIOS系统,优化用户交互体验。通过与英特尔的深度合作,铭瑄持续推动硬件创新,为AI时代提供专业运算解决方案。

  • 端到端AEB正式上线!蔚来乐道Coconut椰子1.2.0版本开启推送

    5月29日,乐道汽车宣布端到端AEB系统正式上线,Coconut 1.2.0版本开启推送。本次升级重点包括:1)AEB系统防护范围扩展至240度,覆盖左侧60度高频盲区,基于海量实驾数据优化避险能力;2)车载AI语音上线麦当劳智能点餐服务,支持全程语音操作、随心换餐和到店时间预测;3)新增语音控制功能,可通过指令完成泊车影像开启、快速启动DeepSeek等操作;4)无麦K歌升级至2.0版本,新增AI伴唱、音效优化等功能。此次更新全面提升智能驾驶与车载娱乐体验。

  • 铭瑄 GeForce RTX 50 系列显卡重磅出击COMPUTEX 2025!

    COMPUTEX 2025第三天,铭瑄科技展台热度不减,重点展示了GeForce RTX 50系列显卡新品。该系列基于NVIDIA Blackwell架构,搭载第五代Tensor Core和第四代RT Core,配备16GB GDDR7显存,带宽达960GB/s,性能较上代提升34%。现场展出了RTX 5080 MGG OC16G等多款产品,其中iCraft系列采用全新珍珠白渐变设计,支持ARGB灯效同步,兼具科技美学。同时展出的还有半高尺寸RTX 5060 LP 8G和MGG水冷概念产品,后者�

  • 微星2025 COMPUTEX电脑展发布ITX主板及联名主机等系列新品!

    2025台北国际电脑展上,微星科技发布多款创新产品:1. AI虚拟助手MIA,采用大语言模型和3D交互技术;2. 全新主板系列,包括旗舰级MEG X870E ACE战神主板,支持Wi-Fi 7和USB 40Gbps;3. Mini-ITX规格主板MPG X870I EDGE TI WIFI;4. 背插式设计MAG X870E TOMAHAWK战斧导弹主板;5. 超频专用B850MPOWER主板;6. 旗舰机箱MEG MAESTRO 900系列,采用四面玻璃展示设计;7. 新一代水冷散热器MEG CORELIQUID E13系列;8. �

  • 宏碁Computex展示完整AIPC生态体系和最新创新科技成果

    在AIPC爆发拐点之际,宏碁以"打破AI藩篱"为主题亮相Computex2025,推出覆盖全产品线的AIPC生态体系。重点展示:1)非凡Edge AI轻薄本,仅0.99kg搭载Intel Core Ultra9处理器;2)掠夺者·刀锋14AI电竞本,融合创作与竞技功能,配备120Hz OLED触控屏;3)掠夺者QD-OLED电竞显示器,500Hz刷新率创行业新标杆。通过多元终端协同创新,宏碁构建了从学生到专业用户的完整AI应用场景,包括I

热文

  • 3 天
  • 7天