首页 > 业界 > 关键词  > IBM最新资讯  > 正文

IBM申请名为 “LAB” 的专利,利用合成数据训练LLM

2024-04-09 11:03 · 稿源:站长之家

划重点:

⭐️ IBM 计划利用合成数据来满足 AI 模型庞大的数据需求

⭐️ 新系统 “LAB” 可系统生成合成数据,极大降低训练 LLM 模型的成本和时间

⭐️ 通过分类法生成合成数据,提高 AI 模型的表现和保护用户隐私

站长之家(ChinaZ.com)4月9日 消息:IBM 近日申请了一项名为 “LAB” 的专利,旨在利用合成数据来训练 LLM 模型,以加速企业 AI 技术的发展。

AI 模型对数据有着巨大的需求,而提供大量、质量高、相关性强的数据常常成为一项挑战。IBM 希望通过合成数据来解决这一问题,创建一个仿真真实用户数据的系统。这项创新方法将名为 Large-Scale Alignment for Chatbots(LAB)的技术应用到合成数据生成中,系统地为开发人员所需的聊天机器人任务生成合成数据。

IBM

IBM 认识到 AI 模型的有效性与其所训练的数据密切相关。传统的数据训练方法费时费力,而 LAB 方法可以显著降低训练 LLM 模型的成本和时间。该方法不断将新知识和能力融入模型,而不会覆盖模型已学到的知识,从而产生大量干净且处理过的数据来训练 AI 模型。

这一新的数据生成方法基于分类法,将数据分类为不同的类别和子类别。IBM 的分类法将指导 chatbot 的基础技能、知识和组合技能。这一系统使 LLM 开发人员能够规定其聊天机器人所需的知识和技能。

此外,IBM 还利用合成数据来改进其面向企业的 Granite 模型。通过 LAB 方法生成的合成数据,IBM Research 在1.2百万条指令的数据集上训练了两个开源 LLM 模型,结果显示这两个模型在广泛的基准测试中表现出色。IBM 的专利突出了这一方法的两个显著特点,即老师模型能够从分类法的每个叶节点生成合成示例,以扩大目标任务的覆盖范围,并且 LAB 方法能够向基础 LLM 模型添加新技能和知识,而无需将这些信息纳入老师模型中。

这一专利的提出也凸显了 AI 服务需求的激增,企业搭建 AI 模型的过程可能同样有利可图。IBM 可能会利用这一专利来支持那些正在构建自己 AI 模型的企业,提供一种相对于收集真实用户数据而言更少资源密集的方法。

举报

  • 相关推荐
  • AI日报:微信小程序正式接入Hy3 preview;QQ浏览器上线高考AI Skill;月之暗面发布 Kimi WebBridge

    今日AI领域动态:微信小程序接入Hy3 preview模型提升开发者体验;月之暗面推出Kimi WebBridge浏览器插件实现AI自动化操作;QQ浏览器联合腾讯元宝推出高考AI咨询师Agent;阿里云发布Qoder1.0,从AI IDE进化为智能体自主开发工作台;百度成立“模型委员会”统筹大模型全局;Codex登陆ChatGPT移动端成为开发者“口袋编程助手”;百灵大模型开源Ring-2.6-1T,主打真实复杂任务闭环;xAI发布Grok Build早期测试版,专注复杂编程的“规划型”智能体。

  • SmallRig在场·对话 | 秋麦:一位来自纽约的摄影师,用35年将中国古典视觉艺术美学缓缓注入“取景框”

    美国摄影师秋麦(Michael Cherney)用35年时间,以胶片为媒介,将中国古典山水画美学融入摄影创作。他坚持使用胶片,因其颗粒感与水墨画笔触质感相通,且冲洗过程带来“时间沉淀感”。其代表作《长江万里图》系列历时五年,以手卷形式呈现长江流域的自然与人文变迁。他主张不抹去现代元素,让古老与日常共生,并独创“双语书法”等跨界形式。面对AI技术,他认为艺术核心在于创作者“在场”的真实体验,而非单纯复制画面。

  • AI叙事拐点,中国AI公司要押上更多筹码

    这是《窄播Weekly》的第90期,本期我们关注的商业动态是:中国AI公司在继续扩大资本投入。 5月13日下午,腾讯召开股东大会。被问及AI业务进展时,马化腾说了这样一番话:「一年前我们以为上了船,后来发现那个船漏水了,现在感觉站上去了,还坐不下去,还是希望船速能快一点。」 同一天,腾讯和阿里巴巴发布最新季度财报,AI业务进展成为两家财报电话会的核心议题。 �

  • 当AI遇上消费行业:走进双汇揭秘“AI+管理”新范式

    AI浪潮席卷全球,企业管理正经历效率革命。5月22日,由河南双汇投资发展、金蝶软件联合主办的“走进双汇暨2026消费行业数字化转型峰会”将在郑州举行。峰会开放全球领先的肉类智能制造标杆工厂,展示“AI+管理”如何落地生产线。核心在于打破企业观望困境,现场展示AI原生新品,强调AI赋能而非替代人。活动包括顶尖企业实战分享、产业创见者联盟成立及白皮书首发,从技术、实践、生态三维度提供落地指南,推动消费品行业下一增长曲线。

  • AI仿真人不如AI仿超市

    我真没空管你们这些水果蔬菜、厨房用品、酒水饮料的事了。 谁也没想到,在经历了邪恶猫狗的叙事浪潮后,AI短片的新风口是火车上的小推车——啤酒饮料矿泉水,花生瓜子八宝粥,前面的乘客把腿收一收!

  • 数字人是一场AI的具象化革命

    去年由百度慧播星提供技术支持的罗永浩的数字人带货直播让人印象深刻。 这不仅因为他幽默生动,偶尔会作出推眼镜的动作,甚至能做出接过样品的互动,更因为他能在观众抛出问题时,像罗永浩本人一样抖出调侃式包袱。观众们第一次发现数字人开始有「灵魂」了。 到了今年,数字人已经走出直播间,开始参与带货视频、广告片的创作。 百度创始人李彦宏在Create2026百�

  • AI 智能化 2026 AI新零售直播峰会释放三大关键信号

    在2026 AI+新零售直播峰会上,行业共识认为技术价值需以商业结果衡量。关键点有三:AI已从差异化加分项变为基础服务,不接入将面临运营效率落差;AI落地需高质量用户数据、清晰业务场景驱动及企业一把手推动;支撑新零售增长的三大确定性要素是AI技术红利、服务深度与信任护城河。峰会强调,新零售本质是信任生意,品质与服务是AI无法替代的基石。

  • QQ内测AI帖子应用,能否解马化腾“上船漏水”之围?

    Tech星球独家获悉,腾讯正将AI创新的重点落地,QQ内测一项全新的AI帖子应用功能,目前正在QQ频道内做相关测试,整体看像是一个AI版贴吧。 不同于传统社区仅能发布图文、视频的局限,该功能打破了社交内容的固有形态,使用户可生成AI小游戏、轻量工具、AI对话搭子等产品,并直接封装成社交帖子发布。这一全新尝试,既是腾讯今年在AI社交领域的重要落子,更是其试图用A

  • 造一台AI PC=跑一遍AI基建——重新认识“创新的联想”

    联想在2026年4月22日发布ThinkPad新品及天禧AI生态,提出“超级个体”概念,即个体×ThinkPad×天禧AI=超级个体。文章从四个工序解析AI+PC的制造:大脑(天禧AI3.7的端云混合架构)、产线(天津工厂60%自动化率,每9秒下线一台)、神经(iChain供应链智能体覆盖90%部门)、地基(生态级零碳工厂和海神液冷技术)。联想通过自研技术整合算法、芯片、供应链和能耗,让AI+PC成为用户不在时也能工作的“分身”,体现中国创新的另一种形态——工程纪律与产品落地。

  • 灵瑞集首发瑞兽AI灵宠:以IP重构AI陪伴新范式

    芯伴科技推出“灵瑞集”AI灵宠系列,以中国瑞兽文化为内核,结合自研角色性格模型与全场景交互技术,打造6款差异化IP角色(辟邪、天禄、九尾狐等),定价169元起。产品搭载4G独立联网模块、长续航与Type-C快充,实现无WiFi秒级响应;配套互动小程序与治愈经营游戏,构建“硬件+软件+内容”生态闭环。该系列旨在将传统瑞兽转化为年轻人专属的“有文化、有温度、可成长”情感陪伴伙伴,降低AI潮玩体验门槛。

今日大家都在搜的词: