谷歌AI推出新型评分器Cappy 助力多任务语言模型性能提升

2024-03-19 14:24 · 稿源：站长之家

站长之家(ChinaZ.com) 3月19日消息:在最新的研究论文中，谷歌研究人员引入了一种名为Cappy的预训练评分器模型，旨在增强和超越大型多任务语言模型的性能。这项研究旨在解决大型语言模型（LLM）所面临的挑战，其中包括高昂的计算资源成本和效率低下的训练和推理过程。

谷歌 (2)

目前，多任务法学硕士如T0、FLAN和OPT-IML等被广泛应用于各种自然语言处理任务，并在统一的指令跟踪框架下进行训练。然而，这些模型由于巨大的规模和硬件要求，使得它们在适应下游应用程序时面临着挑战。为了应对这些挑战，Cappy被引入作为一种轻量级的预训练评分器，旨在提高多任务法学硕士的性能和效率。

Cappy的架构基于RoBERTa，顶部有一个用于回归的线性层，利用多样化的数据集集合进行预训练，确保覆盖广泛的任务类型。研究人员还提出了一种数据构建方法，以满足预训练数据中标签多样性的需求，并生成一个大型有效的回归预训练数据集。Cappy的应用程序涉及一种候选者选择机制，可独立运行于分类任务，也可作为生成任务的辅助组件，增强现有多任务LLM的解码。

通过引入轻量级预训练评分器Cappy，这项研究解决了在多任务场景中有效利用大型语言模型的挑战，展示了其在各种任务上的参数效率和性能的优越性，同时强调了在实际应用中简化大型语言模型采用的潜力。

（举报）

相关推荐

关键词：

苹果M5芯片正式发布：CPU提升15%、图形性能提升30%！

苹果正式发布了其全新的M5处理器，这款芯片基于台积电的N3P制程工艺，配备了10核CPU和10核GPU。从CPU来看，M5采用了与M4相同的10核配置，不同的是采用了6个性能核心和4个效率核心，虽然核心数量没有变化，但苹果表示M5的CPU的多线程性能相比M4提高了15%。在GPU方面，M5配备了10核GPU

M5处理器台积电N3P制程 10核CPU
荐AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮融资；百度发布文档解析模型 PaddleOCR-VL

谷歌Gemini 3.0 Pro开始小范围推送，强化推理与多模态能力；百度发布全球领先文档解析模型PaddleOCR-VL，重塑OCR技术格局；爱诗科技完成亿元B+轮融资，ARR突破4000万美元；Anthropic推出Claude“skills”功能，提升AI工作效率；Pinterest推出AI内容限制工具，用户可自定义减少生成式图像；开源多模态模型LLaVA-OneVision-1.5超越Qwen2.5-VL；OpenAI视频生成模型Sora 2上线微软Azure平台，进入公共预览阶段；旅行搜索引擎Kayak推出“AI模式”，简化旅行规划与预订流程。

谷歌Gemini AI日报 DeepMind
知乎崩了上热搜：网页端完全无法进入 App端也未能幸免

10月17日上午，知乎遭遇大规模服务故障，全端瘫痪。网页端无法访问，App端问答详情、小说阅读及搜索功能失效，用户登录状态异常，被强制显示为匿名。大量用户误以为是设备或网络问题，尝试重启、重装应用等措施无效。故障引发全网关注，微博话题“知乎崩了”单日讨论量激增，成为网络热点。此次故障严重影响用户使用体验，暴露平台服务稳定性问题。

知乎故障服务瘫痪用户登录异常
小米推出短剧App围观短剧：主打无广告免费看

小米正式进军短剧领域，推出免费App“围观测短剧”，主打无广告、海量免费内容，覆盖都市、逆袭等20余种题材。该应用由小米关联公司开发，功能简洁支持手势切换。此前小米旗下Redmi品牌已试水短剧市场，推出《时空合伙人》并获好评。此次布局彰显小米在短剧领域的雄心，未来将为用户提供更多优质内容。

小米短剧围观短剧短剧App
更新功能、内测新App，抖音快手再战社交

抖音和快手又一次向社交领域发起进攻。近日，抖音、快手在站内密集更新了“日常”“说说”等一系列社交新功能;此外，抖音还被曝正在内测全新的社交App。当流量增长触及天花板，内容的稀缺性逐渐变弱，社交似乎成为了短视频巨头的“新叙事”。它们为何始终对“社交”念念不忘?这究竟是构筑护城河的必然选择，还是一场注定艰难的豪赌?

文章搜索核心标签社交功能
荐对话逗逗AI：猛涨千万用户背后，不抢屏幕时间，不做超级app，也不止于游戏了

当你在游戏里卡关半小时，烦躁地想切出去搜攻略；或者在开放世界里孤独“跑图”，无聊到只能听歌的时候，如果这屏幕上突然冒出一个“小可爱”，一边帮你找路，一边陪你吐槽，感觉会如何？这就是逗逗AI正在做的事。它不是一个需要你切换点开的APP，而是一个以虚拟形象或悬浮球形式，能看到你的游戏界面，听到你的声音，和你随时互动的AI玩伴。我们来看一个顶

游戏攻略 AI玩伴虚拟形象
京东11.11率先现货开启Apple产品大促 iPhone 17 国补低至5499元还免息

京东于10月17日启动Apple产品双11大促，覆盖iPhone、iPad、MacBook等多条产品线。iPhone 17系列最高减500元，以旧换新额外补贴500元；iPhone 16系列优惠高达2400元；新款MacBook Pro限时优惠2000元，以旧换新加补1500元。iPad、Apple Watch及配件同步推出大幅折扣，支持12期免息。消费者可通过京东APP搜索“苹果大额券”一键进入活动会场，轻松入手心仪新品。

11.11购物节苹果产品促销 iPhone优惠
V2版星舰谢幕！SpaceX星舰第11次试飞升空助推器已成功溅落

美国太空探索技术公司（SpaceX）新一代重型运载火箭星舰”，当地时间13日18时23分从美国得克萨斯州成功发射升空，实施第11次试飞。和以往星舰试飞任务不同，此次试飞将不再进行星舰回收。按照计划，火箭助推器将落入墨西哥湾附近海域，不返回发射场回收，星舰飞船最终将在印度洋溅落。美国当地媒体称，目前，超重型火箭助推器刚刚坠入水中，溅落在SpaceX发射设施�

SpaceX 星舰试飞火箭发射
小米米家智能电热毯单人款开启众筹：179元接入米家App

米家智能电热毯单人款在小米有品正式开启众筹，众筹价179元，建议零售价239元。这次与前两年推出的双人款设计保持一致，只是尺寸小一些，长宽为1.8*0.8m，功率是80W。采用610克加厚毯体，亲肤层做拉绒处理，触感柔软，加热线被多层无纺布固定，几乎无异物感。

米家智能电热毯众筹信息产品安全
949元！小米推出米家智能消毒机：消杀率99.999%、接入米家App

小米10月17日推出米家智能消毒机，专为母婴消毒设计，售价949元。配备25L大容量和304不锈钢置物篮，可消毒奶瓶、餐具、玩具等。采用紫外线+巴氏除菌双重系统，内置24颗灯珠，覆盖260-270nm波长，搭配75℃高温，有效杀灭35种微生物，杀菌率达99.999%。支持72小时长效抑菌，减少二次污染。提供75℃和45℃两种模式，适应不同物品。内置负离子和过滤网去除异味，运行噪音低于29.8dB，支持夜间模式。可通过小爱同学或米家App远程控制，自定义消毒程序，并与其他智能设备联动。

米家智能消毒机紫外线巴氏除菌母婴消毒

今日大家都在搜的词：

热文

3 天
7天

谷歌AI推出新型评分器Cappy 助力多任务语言模型性能提升

苹果M5芯片正式发布：CPU提升15%、图形性能提升30%！

荐AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮融资；百度发布文档解析模型 PaddleOCR-VL

知乎崩了上热搜：网页端完全无法进入 App端也未能幸免

小米推出短剧App围观短剧：主打无广告免费看

更新功能、内测新App，抖音快手再战社交

荐对话逗逗AI：猛涨千万用户背后，不抢屏幕时间，不做超级app，也不止于游戏了

京东11.11率先现货开启Apple产品大促 iPhone 17 国补低至5499元还免息

V2版星舰谢幕！SpaceX星舰第11次试飞升空助推器已成功溅落

小米米家智能电热毯单人款开启众筹：179元接入米家App

949元！小米推出米家智能消毒机：消杀率99.999%、接入米家App

今日大家都在搜的词：

热文

微信回应人去世了朋友圈会消失吗：长时间不使用账号已不再回收

AI日报：阿里发布紧凑型Qwen3-VL模型；科大讯飞AI翻译耳机全球

小米推出短剧App围观短剧：主打无广告免费看

AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；S

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

卢伟冰官宣REDMI K90系列下周发布：不排斥和小米竞争

王腾首次回应下一步计划：称在考虑些创业项目

AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮

苹果华为OPPO将推出eSIM手机 OPPO Find X9系列已确认将支持

微信回应出朋友圈访客功能：可能会让用户产生焦虑重申不会推出

站长商机