首页 > 业界 > 关键词  > 谷歌研究人员最新资讯  > 正文

谷歌AI推出新型评分器Cappy 助力多任务语言模型性能提升

2024-03-19 14:24 · 稿源:站长之家

站长之家(ChinaZ.com) 3月19日 消息:最新的研究论文中,谷歌研究人员引入了一种名为Cappy的预训练评分器模型,旨在增强和超越大型多任务语言模型的性能。这项研究旨在解决大型语言模型(LLM)所面临的挑战,其中包括高昂的计算资源成本和效率低下的训练和推理过程。

谷歌 (2)

目前,多任务法学硕士如T0、FLAN和OPT-IML等被广泛应用于各种自然语言处理任务,并在统一的指令跟踪框架下进行训练。然而,这些模型由于巨大的规模和硬件要求,使得它们在适应下游应用程序时面临着挑战。为了应对这些挑战,Cappy被引入作为一种轻量级的预训练评分器,旨在提高多任务法学硕士的性能和效率。

Cappy的架构基于RoBERTa,顶部有一个用于回归的线性层,利用多样化的数据集集合进行预训练,确保覆盖广泛的任务类型。研究人员还提出了一种数据构建方法,以满足预训练数据中标签多样性的需求,并生成一个大型有效的回归预训练数据集。Cappy的应用程序涉及一种候选者选择机制,可独立运行于分类任务,也可作为生成任务的辅助组件,增强现有多任务LLM的解码。

通过引入轻量级预训练评分器Cappy,这项研究解决了在多任务场景中有效利用大型语言模型的挑战,展示了其在各种任务上的参数效率和性能的优越性,同时强调了在实际应用中简化大型语言模型采用的潜力。

举报

  • 相关推荐
  • 多模态训练提速45% 百度智能云推出开源全模态训练框架

    多模态大模型时代,训练基础设施正面临结构性错位。传统框架基于“数据同质、结构单一、平台固定”设计,难以应对多模态异构数据、模型组件协同及跨平台算力需求。百度百舸开源的全模态训练框架LoongForge,以Megatron为核心引擎,通过统一模型抽象、系统层优化和硬件插件化设计,实现“一套代码多平台运行”。其CCT通算传并行、ChunkPipe流水线并行、自适应FP8等技术,在主流模型上实现15%-45%端到端训练加速,在DeepSeek等前沿架构上实现倍级性能提升,并在5000+卡昆仑P800集群上达到90%+线性扩展效率。

  • AI日报:谷歌发布最強模型Gemini 3.5 Flash;阿里云“千问云”上线;苹果AI辅助功能升级

    本期AI日报聚焦六大热点:谷歌发布性能与效率显著提升的Gemini 3.5 Flash模型并免费开放;阿里云推出面向Agent时代的“千问云”平台,重构大模型服务链路;谷歌与三星联合推出两款集成Gemini的智能眼镜;苹果推出Apple Intelligence驱动的AI辅助功能及Vision Pro眼控轮椅;谷歌发布多模态交互模型Gemini Omni;通义实验室发布Qwen3.7-Max模型,采用正交解耦技术,多项评测国内第一。

  • 危化人员定位新规7月施行!四相科技融合定位助危化企业合规增效

    距离2026年1月4日《“工业互联网+危化安全生产”建设规范 第3部分:人员定位》(AQ3064.3-2025)正式实施不足2个月,石油、化工等涉危化高风险企业6个月过渡期即将截止,逾期未达标将面临停产整改。该强制性新规要求人员定位从可选配置变为合规红线,推动企业安全管控从“事后追溯”转向“事前防控”、从“模糊定位”迈向“精准管控”。当前企业亟需解决快速达标、成本控制、系统适配三大难题,选对方案是顺利通过合规验收、规避停产风险的关键。

  • 前端铺开智能体,后端猛砸TPU:直击谷歌I/O大会

    ​曾经号称“看不懂AI”的伯克希尔,开始加仓AI。 谷歌,就成了Q1伯克希尔大量加持的其中一家AI公司。一季度,伯克希尔增持谷歌母公司Alphabet的A类股3640万股,环比激增约204%,持仓市值增至156亿美元。 投资公司们的热钱开始翻倍投入谷歌的同时,谷歌也用真实数据展示了一件事——当AI真正开始为普通人所用时,它的增长曲线能飞得多漂亮。 “两年前,我们每月处理的�

  • 男子加油站开明火炒菜 被劝阻后仍不收手还推搡工作人员

    离谱的事情每天都有发生,但如此离谱的确实少见。 近日在广东一加油站内,一男子在一辆新能源货车充电时,竟然支起明火灶开始炒菜。 由于充电区域距离加油区域较近,男子此番行为无疑存在较大的安全隐患,两名工作人员发现后遂上前劝阻。 然而男子根本不听,还表示自己马上就好,男性工作人员见状随关闭了其使用的明火,这直接激怒该男子,他先是推搡了一把�

  • 研究发现:吃西瓜有助于心脏健康 帮助血管舒张降血压

    夏天到了,西瓜是很多人餐桌上的常客。但你可能不知道,西瓜不仅解渴,还对心脏特别好。 西瓜是天然瓜氨酸最丰富的来源之一。瓜氨酸进入人体后会转化为精氨酸,促进一氧化氮生成,帮助血管舒张,降低血压。美国路易斯安那州立大学的临床试验证实,连续两周饮用西瓜汁,可以维持高血糖状态下的血管弹性。 西瓜的红瓤富含番茄红素,含量比生番茄还高。番茄红素�

  • 安检机钻出大活人吓坏工作人员 连忙抱住同事

    安检机正在运行,行李一个接一个往里过。突然,铅帘一掀,里面钻出个大活人。 5月6日,烟台火车站候车厅。一名旅客在安检口放行李时,身份证不小心掉到了传送带上,顺着滚进了安检机。这位旅客没多想,直接弯腰钻了进去,想自己把身份证找出来。 旁边的工作人员正低头检查行李,余光瞥见安检机出口处突然冒出一个人头,当场吓得连连后退,甚至一把抱住了旁边�

  • 适配多元AI需求,天翼云推动Token服务质效双提升

    中国电信于5月17日推出系列Token套餐,面向开发者和中小企业提供“Token+连接+安全”一体化服务,融合星宸大模型等国产主流模型,覆盖AI编程、代码开发、智能体搭建等场景。同时为个人家庭用户提供AI应用包套餐,支持通话、写作、图片生成等功能。天翼云依托全栈国产化技术、云边协同算力和五级属地服务,构建多芯适配、多模融合的Token服务平台,并计划推出Token币和Token权益,推动AI应用落地。

  • 不只能画图!谷歌推出Gemini Omni:只需动动嘴 AI自动帮你改大片

    在Google I/O 2026上,谷歌正式发布Gemini Omni模型。该模型支持文本、图像、音频、视频作为输入,实现跨模态生成与编辑。 其中在音频方面,目前该模型初期仅支持语音输入,但Google表示未来将很快扩展更多类型的音频输入能力。 首发产品Gemini Omni Flash已在Gemini应用上线,后续将向企业客户开放API。 该模型核心卖点在于深度视频编辑能力。用户通过自然语言指令即可对生成内�

  • 全球语言融合,时空壶X1开创独立式多人同传新时代

    全球跨语言协作向规模化、专业化升级,传统同传设备痛点凸显。时空壶X1作为全球首款独立式AI同声传译终端,通过端侧自研架构、20人5语实时同传、全场景稳定运行三大突破,彻底重构专业同传设备底层逻辑。其内置专用算力芯片与BabelOS系统,实现无网环境下精准翻译;支持多人协同、0.2秒超低延迟,语音识别准确率超95%;配备3.4英寸触控屏、8小时续航及IP54防护,适配线上线下混合会议,树立企业级跨语言沟通技术标杆,推动行业迈向多人企业级新阶段。

今日大家都在搜的词: