首页 > AI头条  > 正文

谷歌推出新方法:训练数据量减少 1 万倍,提升模型精准度

2025-08-25 14:37 · 来源: AIbase基地

近日,谷歌在其研究中提出了一种新颖的主动学习筛选流程,旨在大幅降低微调大型语言模型所需的训练数据量。根据实验结果,这种方法能够将训练数据量降低至原来的1万分之一,同时提高模型与人类专家判断的一致性达65%。在实际应用中,如广告内容分类、金融数据安全分析等领域,对高保真训练数据的需求一直很高,但筛选出符合要求的数据不仅难度大,成本也极为昂贵。

谷歌 (3)

图源备注:图片由AI生成,图片授权服务商Midjourney

这一新方法从一个零样本或少样本的初始模型开始,用户通过提示定义目标内容,比如询问某广告是否为 “点击诱饵”。初始模型会将广告标记为点击诱饵或良性,并生成一个大型标记数据集。然而,初始数据集常常存在严重的类别不平衡,导致模型的准确识别能力较弱。

为了解决这一问题,研究者将模型标记为点击诱饵和良性广告的内容进行分组,发现部分组之间存在重叠,说明模型在这些内容上容易判断错误。因此,研究者可以从这些重叠组中挑选样本对,交由专家进行判断,以此来控制审核成本,并优先选择能覆盖多种情况的样本对。这样得到的样本既有价值,又涵盖了各种可能出错的情形。

在模型微调过程中,专家提供的标注被分为两组,一组用于评估模型一致性,另一组则用于模型的微调。这一过程将不断重复,直到模型的表现达到与人类专家相近的水平。

谷歌的实验使用了 Gemini Nano-1和 Nano-2两款模型,并针对两个复杂度不同的任务进行了测试。在测试中,每个任务都使用了约10万条众包标注数据,尽管这些数据严重不平衡。结果表明,专家之间的判断一致性很高,而众包标签与专家判断的一致性则相对一般。通过新方法,32.5亿参数的模型在低难度任务上的对齐度显著提升,使用的数据量仅为250-450条,较原来的10万条大幅减少,仍能取得良好的效果。

综上所述,谷歌的新方法证明了只需少量高质量的数据,且确保专家标注一致性超过0.8,大型模型也能在训练时获得出色的表现。

划重点:  

📉 训练数据量可减少至原来的1万分之一,提高模型精准度。  

🤝 新方法依赖专家判断与模型迭代,确保样本质量。  

📊 实验表明,使用少量高质量数据可达到甚至超越传统大量数据的效果。  

  • 相关推荐
  • 重磅!标贝科技推出「十万音色·自然语音数据集」 重构AI语音训练基础设施

    标贝科技发布"十万音色·自然语音数据集",覆盖中英双语,包含10万种音色样本(中文5万、英文5万),基于近百万小时原始数据经智能生产线精细打磨。该数据集在规模、真实性和准确性三大核心指标实现突破,支持多情感表达和跨场景应用,涵盖基础情绪到特定风格,话题涉及多个领域。通过音频质量筛选、文本转写校正、说话人分离等技术,从海量数据中甄选出高质量样本,为语音识别、合成等AI模型训练提供坚实基础,助力实现更自然、真实的语音交互体验。

  • 如何用3分钟精准计算AI大模型成本?避免生成一篇万字文章就超支?

    AI大模型成本控制指南:实测三步预算法+企业级避坑方案。文章揭露行业痛点:1)价格迷雾:各厂商计费规则差异大,长文本/多模态存在隐藏溢价;2)团队实测GPT-4生成20篇行业分析(50万字)实际账单超预算4倍。解决方案:通过AIbase计算器实现精准预测:①场景化选择自动加载计费规则;②输入需求实时生成动态成本矩阵;③智能规避四大隐性成本(长文本衰减补偿/区域差价预警等)。跨境电商案例显示,使用工具后成本降低60%。核心观点:在AI时代,成本控制能力已成为企业核心竞争力。

  • 如何精准计算AI大模型调用成本?复杂参数太多,预算总超支怎么办?

    文章探讨了AI模型调用成本管理的痛点,包括GPT-4等模型复杂的计费规则(如Token分级、上下文溢价、多模态叠加收费)导致实际成本常超预算40%。提出AIbase计算器三步解决方案:自动匹配场景参数、实时联动报价、明细成本拆解。通过跨境电商客服和高校实验室案例验证工具有效性,强调数据溯源、用量预警和预算缓冲功能,帮助开发者实现精准成本控制,告别手动制表与定�

  • AI应用太烧钱?我们用一款精准的AI大模型费用计算器做出了清晰预算

    初创团队“智询未来”在开发AI问答应用时面临核心模型选择困境:GPT-4-turbo能力强但价高,Claude-3长文本处理优,Llama-3成本低但性能稍弱。通过AIbase成本计算器精准测算,发现Claude-3-Sonnet性价比最优,每月可省近4000元,还能通过优化提示词进一步降本15%。数据驱动的决策让团队将节省预算投入数据安全和提示词优化,凸显成本测算对初创企业技术选型的重要性。

  • 如何快速精准计算AI大模型费用?试试这个三步完成的免费工具!

    文章讲述AI项目预算失控的普遍现象:李工团队因手动计算GPT-4等大模型调用成本复杂,最终预算比实际支出少25%。行业调查显示73%团队曾因模型成本失控被迫调整项目。AIbase推出三步极速成本计算器解决痛点:1)集成50+主流大模型参数库;2)用自然语言描述需求即可生成预算;3)10秒输出详细成本对比报告。该工具已帮助电商企业节省40%预算,其优势在于实时追踪官方定价、智能匹配场景规则、自动生成多模型对比报告,让晦涩的token计价变得直观透明。目前已有超12万开发者使用该工具优化AI项目成本。

  • AI模型选型太耗时?三分钟精准匹配需求的多维对比库

    文章介绍了AI模型选择面临的三大痛点:模型爆炸式增长导致选择困难、信息碎片化增加搜集成本、多维度对比效率低下。针对这些问题,AIbase模型库(https://model.aibase.cn/llm)提供了解决方案:一站式聚合主流AI模型信息,实时更新模型状态;结构化表格直观对比核心参数;支持自定义筛选条件快速锁定目标模型。该工具能帮助开发者、产品经理和研究者节省前期调研时间,将精力集中在更有价值的应用构建和创新探索上。

  • AI大模型计费器如何精准比价?38款模型隐藏费用一键预警,三步告别超支

    文章揭示了AI项目成本失控的三大痛点:1)计费维度分裂,如输入/输出token分开计价;2)参数迷雾,如文心一言4.0增强模式成本是基础版3.2倍;3)汇率陷阱,海外模型美元报价波动导致实际成本偏差超15%。通过AIbase费用计算器可精准测算:支持38个主流API对比,包含隐藏费用提醒,提供四大维度的决策矩阵(百万token成本/长文本溢价/月度总价/性价比评分)。案例显示某团队发现自研模型成本比通义千问高27%后及时调整采购策略。该工具能帮助开发者避免"成本黑箱",实现零成本预算推演。

  • 马斯克称正在训练新FSD模型:约十倍参数 最快下月底发布

    马斯克今日在X上发文表示,特斯拉正在训练新的十倍参数FSD模型,如果一切顺利则可能会在下个月底准备好面向公众发布。

  • 谁在解锁“贴秋膘”的新方式?

    “贴秋膘,聚亲朋,酒香馔美,饮甘餍肥,一壶美酒喜相逢。吃得汗流长,盼着秋风凉。”当央视新闻主持人朱广权以诗词讲“立秋”,这届年轻人已经将贴秋膘安排得明明白白。 打开抖音等各大平台,从官方媒体科普“如何科学贴秋膘”,到美食博主大展身手制作“秋膘宴”,再到各地达人探店抢先“啃秋”……一方屏幕之间,烤肉的滋滋响声、海鲜的鲜美滋味、瓜果的甜

  • 广域铭岛的工业AI精准决策三要素:实时数据、机理模型与反馈机制

    广域锚岛在2025世界人工智能大会上发布"Geega工业AI平台+工业智造超级智能体"双引擎,通过实时数据感知、工业Know-How与AI算法融合、决策-执行-验证闭环反馈三大能力,构建工业智能决策体系。该平台覆盖研发、生产、物流等全领域,日均处理百万级调度事务,使工作效率提升30%,年节省24000小时。其创新在于将行业机理知识内化为AI模型,并通过仿真验证持续优化,实现AI与制造业的深度耦合,推动工业智能化从理论走向规模化应用。

今日大家都在搜的词: