首页 > 业界 > 关键词  > IBM最新资讯  > 正文

IBM申请名为 “LAB” 的专利,利用合成数据训练LLM

2024-04-09 11:03 · 稿源:站长之家

划重点:

⭐️ IBM 计划利用合成数据来满足 AI 模型庞大的数据需求

⭐️ 新系统 “LAB” 可系统生成合成数据,极大降低训练 LLM 模型的成本和时间

⭐️ 通过分类法生成合成数据,提高 AI 模型的表现和保护用户隐私

站长之家(ChinaZ.com)4月9日 消息:IBM 近日申请了一项名为 “LAB” 的专利,旨在利用合成数据来训练 LLM 模型,以加速企业 AI 技术的发展。

AI 模型对数据有着巨大的需求,而提供大量、质量高、相关性强的数据常常成为一项挑战。IBM 希望通过合成数据来解决这一问题,创建一个仿真真实用户数据的系统。这项创新方法将名为 Large-Scale Alignment for Chatbots(LAB)的技术应用到合成数据生成中,系统地为开发人员所需的聊天机器人任务生成合成数据。

IBM

IBM 认识到 AI 模型的有效性与其所训练的数据密切相关。传统的数据训练方法费时费力,而 LAB 方法可以显著降低训练 LLM 模型的成本和时间。该方法不断将新知识和能力融入模型,而不会覆盖模型已学到的知识,从而产生大量干净且处理过的数据来训练 AI 模型。

这一新的数据生成方法基于分类法,将数据分类为不同的类别和子类别。IBM 的分类法将指导 chatbot 的基础技能、知识和组合技能。这一系统使 LLM 开发人员能够规定其聊天机器人所需的知识和技能。

此外,IBM 还利用合成数据来改进其面向企业的 Granite 模型。通过 LAB 方法生成的合成数据,IBM Research 在1.2百万条指令的数据集上训练了两个开源 LLM 模型,结果显示这两个模型在广泛的基准测试中表现出色。IBM 的专利突出了这一方法的两个显著特点,即老师模型能够从分类法的每个叶节点生成合成示例,以扩大目标任务的覆盖范围,并且 LAB 方法能够向基础 LLM 模型添加新技能和知识,而无需将这些信息纳入老师模型中。

这一专利的提出也凸显了 AI 服务需求的激增,企业搭建 AI 模型的过程可能同样有利可图。IBM 可能会利用这一专利来支持那些正在构建自己 AI 模型的企业,提供一种相对于收集真实用户数据而言更少资源密集的方法。

举报

  • 相关推荐
  • 强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

    2025年9月29日,深度求索公司发布新一代模型架构DeepSeek-V3.2,引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本,在V3.1-Terminus基础上引入稀疏注意力机制,优化长文本训练和推理效率。目前官方应用端已同步更新,API大幅降价。此次模型体积达671GB,下载需8-10小时。业内专家指出,此次快速适配表明双方早有深度技术协�

  • 远东股份:ALL IN“电能+算力+AI”,智能驱动未来

    远东股份(600869)凭借“电能+算力+AI”战略,在能源与算力融合领域形成先发优势。公司深耕特高压输电、新能源等关键技术,自主研发高导铝绞线提升输电效率,产品应用于多条国家级特高压线路。同时布局液冷技术研发,为数据中心提供高效散热方案。未来将持续推进“AI+能源”产业生态建设,助力制造业智能化升级和绿色高效算能模式构建。

  • iOS 26.1首个Beta版更新发布 苹果AI支持更多语言

    苹果发布iOS 26.1开发者预览版Beta更新,内部版本号23B5044l。主要更新包括:Apple Intelligence新增丹麦语、荷兰语、挪威语、葡萄牙语、瑞典语、土耳其语、繁体中文及越南语支持;AirPods实时翻译功能扩展至日语、韩语、意大利语和中文(含繁简);电话应用数字键盘采用全新液态玻璃设计。此外,Apple Music支持滑动切换歌曲,照片、日历和Safari浏览器迎来视觉优化。iOS 26正式版已于9月16日推送,适配第二代iPhone SE及之后共25款机型,iPhone 17系列和iPhone Air出厂预装该系统。

  • BYDFi 亮相 KBW2025:深化 Web3 交流与参与

    全球加密交易平台于2025年9月23日至24日参与韩国首尔举办的Korea Blockchain Week 2025(KBW2025),在Walkerhill酒店主会场设置展位并开展现场互动。这是BY DFi成为纽卡斯尔联队官方合作伙伴后首次亮相大型行业活动,团队还出席多场边会及社交活动。在展会分享其“双引擎战略”——同步布局中心化与链上交易,重点介绍链上工具MoonX,强调通过安全设计、产品完善及合规进�

  • 三星全线产品亮相北京京东MALL 全场景呈现有AI的科技·艺术·家

    9月12日,三星家电以“AI的呵护”为主题在北京京东MALL举办线下体验展,集中展示搭载AI技术的全线产品,包括冰箱、洗衣机、电视及手机等。重点展出了荣获IFA创新奖的AI神·黑钻热泵洗烘旗舰等产品,通过五大主题展区呈现科技与艺术融合的家电新形态。观众可现场体验食材管理、衣物护理等智能功能,感受AI技术带来的生活便利。展览将持续至9月17日,并提供互动礼品。

  • 声启未来新章 BANG & OLUFSEN 铂傲 推出全新Beo grace耳机

    Bang & Olufsen推出全新无线耳机Beo Grace,融合纤薄铝制机身与卓越音质,体现品牌对声学创新与永恒设计的追求。耳机灵感源自高级珠宝,采用标志性抛光铝材打造,支持杜比全景声与自适应主动降噪技术,降噪效果较前代提升四倍。配备12毫米钛金属驱动单元,续航达4.5小时(搭配充电盒可达17小时),具备IP57防水防尘。通过NearTap™手势操控与定制电池管理系统,兼顾便捷使用与长效耐用,开启可佩戴声学新纪元。

  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • 腾讯云大数据TBDS重磅升级,助力金融行业构建Data+AI一体化数智新范式

    腾讯云在腾讯全球数字生态大会上宣布,其大数据平台TBDS面向AI时代完成重磅升级。此次升级聚焦“数据与AI一体化”,旨在为金融机构提供兼具数据工程与数据科学能力的综合平台,打破传统数据处理与智能应用间的壁垒。新TBDS通过多模湖仓平台、WeData数智开发治理平台及DataAgent数据智能即服务构成核心架构,实现数据存储、管理、开发、治理与运维全面智能化。平台支持多模数据统一汇聚、异构计算负载调度,并显著提升数据开发到模型上线的全链路效率。在金融场景中,新TBDS已应用于信贷自动审批等业务,帮助机构提质增效。未来,腾讯云TBDS将持续发挥专业化与智能化优势,助力金融行业加速数字化转型。

  • 绝!被全局高色域震惊了,才发现从前用RGB都是「将就」

    文章揭露高端电视行业存在"局部高色域"技术陷阱:许多标称97% BT.2020色域的Mini LED电视实为RGB技术,仅在单色显示时达标,多色画面需三色混光导致光谱损失。而TCL的SQD-Mini LED技术通过量子点层直接激发纯色光,配合万象分区控光,实现100% BT.2020全色域覆盖。对比显示RGB技术存在色彩断层、串色问题,SQD技术则能精准还原自然渐变与游戏画面。建议消费者选购时询问是否为"全局高色域"并认准SQD技术,避免营销误导。

  • 蓝凌BPM,中大型组织流程数智化升级首选品牌

    蓝凌软件推出企业大脑LanBots,通过"四步升级"实现AI与BPM流程深度融合。该系统以16字方针为指导,统一接入管理大模型能力,覆盖流程规划、建设、执行、监控、分析全周期。核心功能包括:智能流程规划自动生成流程体系、AI辅助快速搭建业务表单、语义解析发起流程、智能填单与审批摘要、数据驱动的决策支持、规则化自动审批、实时风险监控及流程挖掘优化。助力企业构建高效、智能、安全的新工作方式,推动业务流程智能化升级与数字化转型。

今日大家都在搜的词: