首页 > 传媒 > 关键词  > 人工智能革命最新资讯  > 正文

watsonx.ai背后的黑科技——企业级的AI与数据平台

2023-05-17 17:19 · 稿源: 站长之家用户

我们站在人工智能(AI)革命的前沿。过去十年,数据与算力的碰撞催生了深度学习,让许多令人刮目相看的AI能力成为现实。然而,这也让我们面临好似潘多拉盒子那样的矛盾性挑战:自动化居然是劳动密集型的工作。听起来似乎好笑,但任何试图用AI来解决业务问题的人可能都知道,这是事实。 

传统的AI工具虽然功能强大,但可能昂贵且耗时难用。必须费力地收集、整理数据并使用特定任务的注释来标记数据,以训练 AI 模型;而构建模型还需要专门但却难找的技能,更不要说每个新任务都需要重复这个过程。因此,企业不得不将主要注意力放在自动化那些有丰富数据和高业务价值的任务之上,而把其它的一切先放在一边。然而,这种情况正在开始改变。

如需了解IBM技术、产品和服务的更多信息,点击访问IBM官网。

Transfomers算法架构和自监督学习方法的出现,使我们能够利用大量未标记的数据,为大型预训练模型铺平了道路,我们有时将其称为“基础模型”。这些大模型降低了自动化背后所需的成本和劳力。

基础模型为各种 AI 应用提供了强大而多样的基础。我们可以使用基础模型以有限的注释数据和最少的工作量快速执行任务;在某些情况下,我们只需要描述手头的任务就可以驱使模型去完成任务。

但这些强大的技术也给企业带来了新的风险和挑战。今天的许多模型都是在质量和来源未知的数据集上进行训练的,导致会产生攻击性、有偏见或与事实不符的响应。那些最 大型的模型不仅成本高昂,而且训练和运行的耗能庞大,部署起来也很复杂。

IBM 一直在开发一种方法,解决企业使用基础模型所面临的核心挑战。IBM日前在Think大会上宣布推出 watsonx.ai,这是IBM提供的市场上最 新的 AI 工具和技术门户。当然,这个领域发展极快,有些工具只有几周时间长,而IBM也在不断为市场提供更新的工具。 

watsonx.ai 是IBM刚刚宣布的watsonx产品集的一部分,包含的内容多样且将不断演进,但IBM总体的承诺不变——就是要提供安全的企业就绪的自动化产品。

这是 IBM 正在进行的一项工作,旨在加速客户从AI 新范式中获取价值的旅程。在此,介绍一下IBM构建一套由 IBM 训练的企业级基础模型的工作,包括IBM采用的数据与模型架构的方法。同时还将概述IBM新的平台和工具,如何帮助企业基于广泛的开源模型目录和IBM的模型,来构建和部署基于基础模型的解决方案。

数据: 基础模型的基础

数据质量 至关重要。在有偏见或不良数据上训练的AI模型,自然会产生有偏见或不良的输出。这个问题在基础模型时代会变得更加复杂,用于训练模型的数据通常来自众多数据源,且异常丰富,以至于人类根本无法合理地梳理所有数据。

由于数据是驱动基础模型的燃料,因此 IBM 一直专注于精心策划模型中的所有内容。我们开发了AI工具,严格过滤数据中存在的仇恨、亵渎、许可限制和偏见等。一旦发现,立即删除,然后重新训练模型,如此循环反复。

数据管理是一项永远都做不完的工作。我们不断开发和完善新方法,以提高数据质量和控制,以满足不断变化的法律和监管要求。我们构建了一个端到端框架来跟踪已经清洗过的原始数据、使用的方法,以及每个数据点接触过的模型。

我们不断收集高质量的数据,以帮助解决金融、法律、网络安全和可持续发展等各个领域的一些最为紧迫的业务挑战。 我们当前的目标是收集超过 1 TB 的精选文本用以训练我们的基础模型,同时添加精选软件代码、卫星数据以及 IT 网络事件的数据与日志。

IBM 研究院还在开发能够在基础模型整个生命周期中注入信任的技术,以减轻偏见并提高模型的安全性。例如FairIJ,它可以识别用于调整模型的数据中的偏差数据点,以便对其进行编辑。其它方法,如fairness reprogramming,允许我们减轻模型中的偏差,即使是已经训练过的模型。

专注于企业价值的有效基础模型

IBM 新的 watsonx.ai 开发平台提供了 一套旨在实现企业价值的基础模型。它们已被整合到一系列 IBM的产品当中,这些产品将在未来几个月内提供给 IBM 客户。

认识到并没有放之四海而皆准的解决方案,因此IBM正在构建一系列有着不同大小和体系结构的语言及代码的基础模型。每个模型家族都以一个地质名称代号——Granite (花岗岩)、砂岩 (Sandstone)、黑曜石 (Obsidian) 和板岩 (Slate)——它们汇集了来自 IBM 研究院和开放研究社区的尖 端创新,每个模型都可以针对一系列企业任务进行定制。

Granite 模型是基于仅解码器、类似 GPT 的架构,用于生成任务。 Saadstone模型使用编码器-解码器架构,非常适合对特定任务进行微调,可与 Google 流行的 T5 模型互换。 Obsidian 模型利用 IBM 研究院开发的新模块化架构,为各种任务提供高推理效率和性能水平。 Slate指的是一系列仅编码器(基于RoBERTa)的模型,虽然不是生成式的,但对于许多企业NLP任务来说既快速又有效。所有 watsonx.ai 模型都是在 IBM 精心策划的且聚焦企业的数据湖和IBM定制设计的云原生 AI 比较优秀计算机 Vela 上进行训练。

效率和可持续性是 watsonx.ai 的核心设计原则。 IBM 研究院发明了用于有效模型训练的新技术,包括“LiGO”算法,该算法可回收小模型并让使其“长成”较大的模型。这种方法可以节省训练模型所需的 40% 到 70% 的时间、成本和碳排放量。为了提高推理速度,IBM研究院利用其在量化方面的深厚专业知识,或将模型从 32 点浮点算法缩小到更小的整数位格式。降低 AI 模型精度可以在不牺牲准确性的情况下带来巨大的效率优势。IBM希望很快在其AI优化芯片IBM AIU上运行这些压缩模型。

适用于基础模型的混合云工具

基础模型的最后一道难题是创建一个易用的软件平台来调整和部署模型。IBM 基于红帽OpenShift 构建的混合及云原生的推理堆栈,已针对训练和服务基础模型进行了优化。企业可以利用 OpenShift 的灵活性在任何地点(包括本地)运行模型。

IBM在 watsonx.ai 中创建了一套工具,为客户提供友好的用户界面和开发人员友好的库,用于构建基于基础模型的解决方案。我们的提示实验室 (Prompt Lab) 使用户只需几个标记的示例即可快速执行AI任务。调优开发平台基于IBM 研究院开发的最 先进的有效微调技术,让客户可以用自己的数据来实现快速、可靠的模型定制。

除了 IBM 自己的模型之外,watsonx.ai 还提供了对广泛的开源模型目录的无缝访问,供企业进行试验和快速迭代。通过与Hugging Face建立的新合作伙伴关系,IBM将在 watsonx.ai 中提供数千个开源的Hugging Face基础模型,数据集和库。反过来,Hugging Face也将在 watsonx.ai 上提供IBM所有的专有和开放访问的模型与工具。 

可以 在此处了解有关该开发平台的更多信息。

展望未来

基础模型正在改变AI 的格局,并将加速推进已经取得的各项进展。IBM 很高兴能够立于这一快速发展的技术前沿并做出规划,把科技创新转化为真正的企业价值。

点击了解有关 watsonx.ai 的更多信息

如需了解IBM技术、产品和服务的更多信息,点击访问IBM官网

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 微软AI CEO:未来18个月大量白领工作将被人工智能取代 这些职位先遭殃

    在当下这个AI快速普及的时代,每个人或多或少都会有一些AI替代焦虑症。微软AICEO的最新表态,进一步加深了这种焦虑。苏莱曼的核心使命是实现AI超级智能,助力微软实现人工智能自给自足,减少对OpenAI的依赖,优先建设公司的独立基础模型。

  • 百惠金控:金融创科迎新局 港股人工智能IPO受热捧

    接近农历,港股市场交易气氛依然炽热。百惠金控观察到,科创板块已成为带动大市上行的核心引擎,尤其是人工智能(AI)相关股份持续受资金青睐,板块热度持续攀升。香港特区政府财政司司长近日表示,香港作为国际金融中心,将凭借“金融联动创科”的效应乘势而上,进一步放大香港的制度优势。市场对科创板块的积极情绪,在年初新股表现中得以充分印证。2026年1月2

  • 支持普通话、英语和粤语零样本歌声合成,Soul App 联合吉利汽车研究院人工智能中心(AIC)、天津大学及西北工业大学开源SoulX-Singer

    过去一年,生成式AI在音乐行业不断创造新体验,但歌唱语音合成(SVS)领域进展相对缓慢。为拓展这一领域,Soul AI Lab联合吉利汽车研究院人工智能中心、天津大学视听认知计算团队和西北工业大学音频语音与语言处理研究组,正式开源歌声合成模型SoulX-Singer。这是一个面向真实应用场景设计的高质量零样本歌声合成模型,基于超过42000小时训练数据,覆盖多语言、多音色及多种演唱风格,在稳定性、可控性与泛化能力方面均达到当前开源SVS模型中的领先水平。

  • 2025新质生产力示范案例发布 华为云CloudMatrix AI Infra荣获人工智能TOP案例

    AI正从参数比拼转向赋能实体经济的“下半场”,行业重心转向千行百业的规模化应用落地。华为云凭借基于CloudMatrix+AI Infra的智算云服务,成功入选“人工智能基础与产业融合”示范案例TOP5,彰显了中国式AI与产业融合发展新路径。华为云坚持深入产业,解决行业难题,通过“车-网-云”协同的AI无人驾驶全栈方案,赋能矿山、水泥等行业实现降本增效。未来,华为云将继续坚持“做难而正确的事”,推动AI真正深入行业场景,共同迈向新质生产力发展的下一程。

  • 2026年商业智能(BI)选型指南:八大主流工具深度解析与决策框架

    面对数据洪流与决策困境,企业需将BI(商业智能)升级为“智能决策中枢”。文章指出,多数企业仍陷于传统报表模式,导致决策滞后。BI正从静态报表向支持实时交互、预测分析的智能平台演进。指南对比了八款主流BI产品(如Quick BI、润乾报表、Power BI等),从核心优势、定价、适配场景等维度提供深度解析,并结合典型场景给出选型框架,旨在帮助企业拨开迷雾,找到真正能释放数据价值的“钥匙”。

  • 寒雪老师AI家教机2026年实测评测:聚焦自主学习核心需求的深度体验

    本文对2026年AI教育硬件市场趋势及寒雪老师AI家教机进行了深度评测。市场焦点正从功能堆砌转向“实际使用价值”,消费者更关注设备能否解决家庭自主学习中的核心痛点。评测围绕诊断精准度、教学引导力、场景适配性、硬件体验、家长管理五大维度,结合为期一个月的实际使用数据、30组家庭反馈及第三方技术检测报告,客观呈现产品表现。 寒雪老师AI家教机在五大维度均表现突出:诊断精准度高,能锁定知识漏洞并识别深层错因;采用引导式教学,拒绝直接给答案,通过提问启发学生自主解题;适配K12全学段,针对不同阶段学习特点提供差异化内容;硬件兼顾护眼与便捷性,支持长续航;家长管理功能透明轻量,便于远程监督。实测数据显示,学生使用后同类题目正确率平均提升42%,无效刷题占比显著下降。 总体而言,该产品通过技术与教育场景的深度融合,为家庭自主学习提供了高效解决方案,尤其适合双职工家庭、孩子基础薄弱或需培养自主学习能力的家庭。其定价相对中端学习机略高,更适合追求精准教学与长期使用的家庭。

  • 11年持续高效运行:罗地格自动化分拣系统助力澳洲邮政转型电商物流标杆

    随着电子商务扩张,亚太邮政与快递企业面临包裹处理需求激增。澳大利亚邮政2015年与罗地格工业合作,对悉尼与墨尔本分拣中心进行自动化升级。定制系统稳定运行超11年,支撑了业务转型,成为行业自动化升级典范。该案例证明自动化方案核心价值在于架构稳健性、运维可持续性及可扩展性,通过一体化设计取代零散设备,实现了高效协同、易于维护的智能分拣解决方案。

  • 2026销售商机管理AI工具推荐:优选综合型AI工具 DingTalkA1

    根据国际数据公司(IDC)2025年发布的《未来销售白皮书》显示,到2026年,全球将有75% 的销售组织面临 "数据富集而洞察贫乏" 的困境 —— 海量商机相关互动数据无法有效转化为可落地的销售策略。哈佛商业评论分析服务部也指出,跨渠道、跨形态的商机沟通(线下会议、线上通话、即时消息等)易形成 "信息孤岛",造成客户画像碎片化、销售动作与商机真实需求脱节。传统工具

  • 智能住宅公司哪个品牌好?深度对比后这几家值得重点关注

    本文探讨了智能家居从单品堆砌到系统化产品的演进。真正的智能住宅应是协同运作的有机体,需解决健康、智能、隐私与交付四大痛点。文章推荐栖息地智能住宅,其引入汽车工业标准,通过GreenShield环保体系确保即装即住,搭载本地AI算力保障隐私与稳定,并以确定性交付颠覆传统装修体验。华为与海尔三翼鸟分别在生态连接与智慧家电场景联动上各具优势。选择取决于用户对“好”的定义,追求可验证健康数据、自主可靠系统、绝对隐私安全及确定交付结果的用户,栖息地是当前市场的领航者。

  • 全球化大中型企业销售商机管理智能化:AI工具选型与DingTalkA1实践

    文章探讨了AI如何重塑全球销售格局,指出销售商机管理正成为企业智能化转型的关键战场。当前全球化销售组织面临跨国数据失真、跨时区信息滞后、全球知识断层三大核心困境。销售工具经历了从数字化记录、分析增强到第三代智能闭环的演进,以钉钉DingTalk A1为代表的“软硬一体”方案通过高保真数据采集、深度跨语言理解、全链路智能闭环与全球合规安全防护,实现了从跨国沟通到洞察驱动的实时联动。文章还剖析了钉钉DingTalk A1、Aurasell和Clari Copilot三类主流AI工具的战略价值与适用场景,为企业提供清晰的选型指引,助力构建面向未来的核心竞争力。未来趋势在于硬件无感化、智能实时化与知识全球化,企业需从数据源头培育全球智能,以在下一轮全球化周期中成为规则的制定者。

今日大家都在搜的词: