首页 > 业界 > 关键词  > 谷歌研究人员最新资讯  > 正文

谷歌AI推出新型评分器Cappy 助力多任务语言模型性能提升

2024-03-19 14:24 · 稿源:站长之家

站长之家(ChinaZ.com) 3月19日 消息:最新的研究论文中,谷歌研究人员引入了一种名为Cappy的预训练评分器模型,旨在增强和超越大型多任务语言模型的性能。这项研究旨在解决大型语言模型(LLM)所面临的挑战,其中包括高昂的计算资源成本和效率低下的训练和推理过程。

谷歌 (2)

目前,多任务法学硕士如T0、FLAN和OPT-IML等被广泛应用于各种自然语言处理任务,并在统一的指令跟踪框架下进行训练。然而,这些模型由于巨大的规模和硬件要求,使得它们在适应下游应用程序时面临着挑战。为了应对这些挑战,Cappy被引入作为一种轻量级的预训练评分器,旨在提高多任务法学硕士的性能和效率。

Cappy的架构基于RoBERTa,顶部有一个用于回归的线性层,利用多样化的数据集集合进行预训练,确保覆盖广泛的任务类型。研究人员还提出了一种数据构建方法,以满足预训练数据中标签多样性的需求,并生成一个大型有效的回归预训练数据集。Cappy的应用程序涉及一种候选者选择机制,可独立运行于分类任务,也可作为生成任务的辅助组件,增强现有多任务LLM的解码。

通过引入轻量级预训练评分器Cappy,这项研究解决了在多任务场景中有效利用大型语言模型的挑战,展示了其在各种任务上的参数效率和性能的优越性,同时强调了在实际应用中简化大型语言模型采用的潜力。

举报

  • 相关推荐
  • iPhone 17 Pro搭载满血版A19 Pro处理器 性能比iPhone 16 Pro提升40%

    今天凌晨,苹果召开秋季发布会,正式发布了iPhone 17系列。 全新发布的iPhone 17 Pro,凭借满血版A19 Pro处理器等亮点,再次成为行业焦点。 A19 Pro采用6核CPU、6核GPU架构,神经网络加速器的峰值算力是A18 Pro的4倍。 与iPhone 16 Pro所搭载的A18 Pro处理器相比,A19 Pro拥有更大的缓存和内存。更大的缓存意味着数据读取速度更快,能够让应用程序的启动和运行更加流畅;而更大的内存,�

  • Arm 全新 Lumex CSS 平台实现两位数性能提升,驱动消费电子设备“更智能、更高效、更个性化”

    Arm推出Lumex CSS平台,集成SME2技术CPU和Mali G1-Ultra GPU,实现端侧AI性能五倍提升。支持智能助手、语音翻译等实时应用,覆盖主流移动操作系统和AI框架。开发者可通过KleidiAI无缝调用SME2加速能力,无需修改代码。该平台专为旗舰设备设计,提供个性化、高隐私保护的本地AI体验,重新定义移动端交互与游戏性能。

  • 睡眠APP测评:谁能真正改善你的睡眠

    睡眠问题已成为全球健康难题,2021年中国超3亿人存在睡眠障碍。文章评测六款主流睡眠APP(AutoSleep、小睡眠、蜗牛睡眠、天悦康康、熊猫睡眠和潮汐),从监测技术、睡眠功能、数据分析、收费模式、用户体验和改善效果等维度进行深度测评。结果显示,依赖手机传感器或麦克风的应用虽便捷但准确性受限;结合智能穿戴设备的APP能提供更专业的睡眠分析和针对性改善方案。用户可根据自身需求,选择精准改善睡眠结构或仅作放松辅助的应用。

  • 苹果Apple Watch高血压通知功能上线

    苹果公司宣布将在全球150多个市场推出Apple Watch高血压通知功能,该功能将随watchOS 26和iOS 26系统更新正式推送。目前英国、法国、德国等地区用户已可体验,但加拿大等部分市场尚未开放,中国大陆地区仍需等待监管审批。该功能依托光学心率传感器,可实时监测用户血管对心跳的反应,识别慢性高血压迹象,并在检测到异常时发出提醒。系统会分析用户最近30天的数据,通过先进算法判断是否需要发出通知。

  • Kimi K2模型更新至0905版本:更强代码能力 更快API性能

    月之暗面科技有限公司宣布其Kimi K2模型更新至0905版本,带来更强的代码能力和更快的API性能。此次更新进一步提升了Kimi K2在真实编程任务中的表现,特别是在公开基准测试和实际编程任务中展现出更好的性能。 Kimi K2模型的Agentic Coding能力得到显著提升,这使得它在处理复杂的编程任务时更加高效。同时,前端编程体验也得到了升级,生成的代码不仅更加美观,而且更具实用

  • 字节跳动发布 Seedream 4.0 图像创作模型,豆包App可免费体验

    字节跳动Seed团队推出豆包图像创作模型Seedream4.0,支持文生图、图像编辑及多图参考等功能,在专业评测中达到业界领先水平。该模型已上线豆包App、即梦AI等平台供用户免费体验,并通过火山引擎开放给企业客户。Seedream4.0具备多模态创意能力,可生成4K分辨率商用图像,适用于教育、电商、广告设计等场景。团队表示将持续探索实时交互生成体验,深度融合多模态推理与世界知识。

  • 安卓平板性能天花板!荣耀MagicPad3 Pro首发第五代骁龙8至尊版

    日前,数码博主数码闲聊站”爆料称,荣耀MagicPad3 Pro基本确定是平板端首发骁龙8 Elite Gen5处理器(第五代骁龙8至尊版)。 该博主透露,荣耀MagicPad3 Pro将采用13.3英寸LCD超高刷大屏,电池容量将破万,预计将和荣耀Magic8系列一起发布。 从配置来看,荣耀MagicPad3 Pro是要冲击高端的节奏。

  • 旧款Apple Watch也将支持高血压警报:涉及这三款

    苹果在发布Apple Watch Series11与Ultra3两款新品之际,同步宣布了一项惠及旧款用户的重大更新——通过即将到来的watchOS26系统升级,Apple Watch Series9、Series10以及Ultra2三款旧机型也将新增高血压警报功能。这一举措意味着,部分持有旧款设备的用户无需更换新表,即可享受到这一前沿的健康监测服务。 watchOS26正式版定于9月15日正式向全球用户推送。新增的高血压警报功能依托于Appl

  • 元宝再次上新!一句话就能P人像,出图更快更自然了

    9月4日,腾讯元宝升级AI图片编辑功能,支持一句话指令实现一键美颜、肤色调整、智能美妆等操作,覆盖手机、电脑及网页端。该功能免费开放,可智能完成磨皮、美白、放大双眼等编辑,并支持全身肤色调整和定制化修图,满足个性化高效出图需求。腾讯表示将持续迭代,打造“好用的AI”。

  • 苹果Apple Watch Series 11发布:新增高血压检测提醒

    今日凌晨,苹果公司正式推出全新一代智能手表Apple Watch Series11。这款新品以“最薄、最舒适”为设计核心,同时显著提升了耐用性,起售价定为399美元。 Apple Watch Series11在材质上实现突破,采用全新玻璃材质并覆盖苹果特制陶瓷涂层,抗刮性能较前代提升两倍,为用户提供更可靠的日常使用体验。网络支持方面,该系列首次引入5G功能,中国电信、中国移动、中国联通三大运

今日大家都在搜的词: