watsonx.ai背后的黑科技——企业级的AI与数据平台

2023-05-17 17:19 · 稿源：站长之家用户

我们站在人工智能(AI)革命的前沿。过去十年，数据与算力的碰撞催生了深度学习，让许多令人刮目相看的AI能力成为现实。然而，这也让我们面临好似潘多拉盒子那样的矛盾性挑战:自动化居然是劳动密集型的工作。听起来似乎好笑，但任何试图用AI来解决业务问题的人可能都知道，这是事实。

传统的AI工具虽然功能强大，但可能昂贵且耗时难用。必须费力地收集、整理数据并使用特定任务的注释来标记数据，以训练 AI 模型;而构建模型还需要专门但却难找的技能，更不要说每个新任务都需要重复这个过程。因此，企业不得不将主要注意力放在自动化那些有丰富数据和高业务价值的任务之上，而把其它的一切先放在一边。然而，这种情况正在开始改变。

如需了解IBM技术、产品和服务的更多信息，点击访问IBM官网。

Transfomers算法架构和自监督学习方法的出现，使我们能够利用大量未标记的数据，为大型预训练模型铺平了道路，我们有时将其称为“基础模型”。这些大模型降低了自动化背后所需的成本和劳力。

基础模型为各种 AI 应用提供了强大而多样的基础。我们可以使用基础模型以有限的注释数据和最少的工作量快速执行任务;在某些情况下，我们只需要描述手头的任务就可以驱使模型去完成任务。

但这些强大的技术也给企业带来了新的风险和挑战。今天的许多模型都是在质量和来源未知的数据集上进行训练的，导致会产生攻击性、有偏见或与事实不符的响应。那些最大型的模型不仅成本高昂，而且训练和运行的耗能庞大，部署起来也很复杂。

IBM 一直在开发一种方法，解决企业使用基础模型所面临的核心挑战。IBM日前在Think大会上宣布推出 watsonx.ai，这是IBM提供的市场上最新的 AI 工具和技术门户。当然，这个领域发展极快，有些工具只有几周时间长，而IBM也在不断为市场提供更新的工具。

watsonx.ai 是IBM刚刚宣布的watsonx产品集的一部分，包含的内容多样且将不断演进，但IBM总体的承诺不变——就是要提供安全的企业就绪的自动化产品。

这是 IBM 正在进行的一项工作，旨在加速客户从AI 新范式中获取价值的旅程。在此，介绍一下IBM构建一套由 IBM 训练的企业级基础模型的工作，包括IBM采用的数据与模型架构的方法。同时还将概述IBM新的平台和工具，如何帮助企业基于广泛的开源模型目录和IBM的模型，来构建和部署基于基础模型的解决方案。

数据: 基础模型的基础

数据质量至关重要。在有偏见或不良数据上训练的AI模型，自然会产生有偏见或不良的输出。这个问题在基础模型时代会变得更加复杂，用于训练模型的数据通常来自众多数据源，且异常丰富，以至于人类根本无法合理地梳理所有数据。

由于数据是驱动基础模型的燃料，因此 IBM 一直专注于精心策划模型中的所有内容。我们开发了AI工具，严格过滤数据中存在的仇恨、亵渎、许可限制和偏见等。一旦发现，立即删除，然后重新训练模型，如此循环反复。

数据管理是一项永远都做不完的工作。我们不断开发和完善新方法，以提高数据质量和控制，以满足不断变化的法律和监管要求。我们构建了一个端到端框架来跟踪已经清洗过的原始数据、使用的方法，以及每个数据点接触过的模型。

我们不断收集高质量的数据，以帮助解决金融、法律、网络安全和可持续发展等各个领域的一些最为紧迫的业务挑战。我们当前的目标是收集超过 1 TB 的精选文本用以训练我们的基础模型，同时添加精选软件代码、卫星数据以及 IT 网络事件的数据与日志。

IBM 研究院还在开发能够在基础模型整个生命周期中注入信任的技术，以减轻偏见并提高模型的安全性。例如FairIJ，它可以识别用于调整模型的数据中的偏差数据点，以便对其进行编辑。其它方法，如fairness reprogramming，允许我们减轻模型中的偏差，即使是已经训练过的模型。

专注于企业价值的有效基础模型

IBM 新的 watsonx.ai 开发平台提供了一套旨在实现企业价值的基础模型。它们已被整合到一系列 IBM的产品当中，这些产品将在未来几个月内提供给 IBM 客户。

认识到并没有放之四海而皆准的解决方案，因此IBM正在构建一系列有着不同大小和体系结构的语言及代码的基础模型。每个模型家族都以一个地质名称代号——Granite (花岗岩)、砂岩 (Sandstone)、黑曜石 (Obsidian) 和板岩 (Slate)——它们汇集了来自 IBM 研究院和开放研究社区的尖端创新，每个模型都可以针对一系列企业任务进行定制。

Granite 模型是基于仅解码器、类似 GPT 的架构，用于生成任务。 Saadstone模型使用编码器-解码器架构，非常适合对特定任务进行微调，可与 Google 流行的 T5 模型互换。 Obsidian 模型利用 IBM 研究院开发的新模块化架构，为各种任务提供高推理效率和性能水平。 Slate指的是一系列仅编码器(基于RoBERTa)的模型，虽然不是生成式的，但对于许多企业NLP任务来说既快速又有效。所有 watsonx.ai 模型都是在 IBM 精心策划的且聚焦企业的数据湖和IBM定制设计的云原生 AI 比较优秀计算机 Vela 上进行训练。

效率和可持续性是 watsonx.ai 的核心设计原则。 IBM 研究院发明了用于有效模型训练的新技术，包括“LiGO”算法，该算法可回收小模型并让使其“长成”较大的模型。这种方法可以节省训练模型所需的 40% 到 70% 的时间、成本和碳排放量。为了提高推理速度，IBM研究院利用其在量化方面的深厚专业知识，或将模型从 32 点浮点算法缩小到更小的整数位格式。降低 AI 模型精度可以在不牺牲准确性的情况下带来巨大的效率优势。IBM希望很快在其AI优化芯片IBM AIU上运行这些压缩模型。

适用于基础模型的混合云工具

基础模型的最后一道难题是创建一个易用的软件平台来调整和部署模型。IBM 基于红帽OpenShift 构建的混合及云原生的推理堆栈，已针对训练和服务基础模型进行了优化。企业可以利用 OpenShift 的灵活性在任何地点(包括本地)运行模型。

IBM在 watsonx.ai 中创建了一套工具，为客户提供友好的用户界面和开发人员友好的库，用于构建基于基础模型的解决方案。我们的提示实验室 (Prompt Lab) 使用户只需几个标记的示例即可快速执行AI任务。调优开发平台基于IBM 研究院开发的最先进的有效微调技术，让客户可以用自己的数据来实现快速、可靠的模型定制。

除了 IBM 自己的模型之外，watsonx.ai 还提供了对广泛的开源模型目录的无缝访问，供企业进行试验和快速迭代。通过与Hugging Face建立的新合作伙伴关系，IBM将在 watsonx.ai 中提供数千个开源的Hugging Face基础模型，数据集和库。反过来，Hugging Face也将在 watsonx.ai 上提供IBM所有的专有和开放访问的模型与工具。

可以在此处了解有关该开发平台的更多信息。

展望未来

基础模型正在改变AI 的格局，并将加速推进已经取得的各项进展。IBM 很高兴能够立于这一快速发展的技术前沿并做出规划，把科技创新转化为真正的企业价值。

点击了解有关 watsonx.ai 的更多信息

如需了解IBM技术、产品和服务的更多信息，点击访问IBM官网

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
戴尔科技AI就绪数据平台：AI创新的起点

无论开展何种业务，数据都是竞争优势的关键所在。创新是戴尔科技的DNA核心，集团的众多AI和行业专家致力于为企业创新之路的全过程提供支持。最大带宽须使用多路径客户端驱动程序并且受到客户端网络的限制。

数据湖仓 AI就绪数据平台生成式人工智能
利用观测云打造企业级的统一日志中心

前言在数字化转型时代，现代的大规模应用程序每天可以生成数以亿计的日志数据。它是企业运营和管理中的宝贵资产，记录了系统、应用和设备的各种活动和事件。观测云一直致力于为用户提供更好、更优的可观测能力，相信是企业构建统一日志中心、统一可观测平台的理想选择。

日志分析统一日志中心观测云
OpenAI针对API客户引入更多企业级AI功能，与Meta的Llama 3竞争

尽管Meta的新型Llama3迅速成为使用最广泛和定制程度最高的巨型语言模型排行榜榜首，但率先开启生成式人工智能时代的竞争对手OpenAI却通过为其GPT-4TurboLLM和其他模型之上构建和编程引入新的企业级功能来摆脱竞争。OpenAI今天宣布了其面向API客户的企业级功能的扩展，进一步丰富了其助手API，并引入了一些旨在增强安全性和管理控制权以及更有效地控制成本的新工具。如果您公司的一个团队使用一套面向公众的文档，另一个团队使用一套机密或内部文档，那么您可以在OpenAI的API中为每个团队分配一个单独的项目，并且这两个团队都可以使用AI模型来处理这些文档不会混合或危及后者。

OpenAI Meta AI头条
李未可科技正式推出WAKE-AI多模态AI大模型

4月18日，2024中国生成式AI大会上李未可科技正式发布为眼镜等未来终端定向优化等自研WAKE-AI多模态大模型，具备文本生成、语言理解、图像识别及视频生成等多模态交互能力。该大模型围绕GPS轨迹视觉语音打造新一代LLM-Based的自然交互，同时多模态问答技术的加持，能实现所见即所问、所问即所得的精准服务。李未可科技合伙人&AI负责人古鉴表示WAKE-AI将逐步开放平台能力，便于更多企业及开发者调用WAKE-AI能力，共建AI硬件生态。
荐藏在AI背后的“吃电狂魔”

3月底，美国密歇根湖畔的一座已经关闭的核电站HoltecPalisades，获得来自美国能源部的15亿美元贷款担保，进入重启阶段。如果顺利通过监管环节，它将成为美国历史上第一座重启的核电站。在化石能源枯竭的危机下，对新能源的利用，不仅能缓解迫近人工智能行业的能源危机，也承载着人类科技继续前行的“动力与文明”。

核电站重启美国能源部电力需求
江波龙企业级存储产品闪耀中国存储行业，领航未来发展方向

存储行业，作为一个历经风雨的周期性产业，近年来经历了波澜壮阔的变革。2019年至2023年，存储行业经历了供过于求、疫情、缺货、库存、超跌等，最后以原厂主动减产结束。然而，正是这些挑战，催生了行业的变革与升级。人工智能的飞速发展，为中国存储行业带来了更多发展机遇。众多存储企业都经历了一系列调整与创新，其中半导体存储品牌企业江波龙更是佼佼者，技
荐无需AI PC也能跑AI应用？背后的原因你知道吗

最近关注PC市场的朋友想必会注意到，“AIPC”已经成为了诸多厂商最新的宣传口号。在更进一步的产品介绍里，这些厂商往往会宣称他们的新品使用了全新内置NPU的处理器，因此它可以运行老旧设备所不能支持的各种AI应用，提供从语音助手到用户感知、从生成式绘图到文本辅助编辑在内的众多新功能。那么诸如AI绘图甚至是视频生成这样的高算力AI使用场景，才有可能真正在端侧落地，并且深度地改变我们使用PC进行学习、工作的方式。

AIPC 人工智能 AI
安信证书五一抢先购爆款企业级SSL证书低至75折

春光正明媚，万物竞生长。在5.1小长假来临之际，安信SSL证书助力企业数字化安全发展，推出企业级SSL证书优惠专场活动，深受企业青睐的SSL证书特惠来袭!更有爆款OVSSL证书直降2000元，假期网络安全，就是这么“减”单!活动时间为2024年4月20日-2024年5月20日，企业用户如有需求，可以前往安信证书官网优惠申请，凡在安信证书消费的用户，均可享受免费安装、30天内可申请退款等服务。此次活动优惠力度较大，企业用户把握住这次机会哦!选购过程中如有任何疑问，可以联系网站上的在线客服来解决，安信证书提供贴心的到期提醒服务及专业的技术支持服务，助力企业实现网络安全。
我们开源啦!一键部署免费使用!Kubernetes上直接运行大数据平台!

导语:市场上首个K8s上的大数据平台，开源了!智领云自主研发的首个完全基于Kubernetes的容器化大数据平台KubernetesDataPlatform开源啦!开发者只要准备好命令行工具，一键部署Hadoop，Hive，Spark，Kafka，Flink，MinIO...就可以创建以前要花几十万甚至几百万才可以买到的大数据平台无需再花大量的时间和经费去做重复的研发高度集成，单机即可体验大数据平台在高级安装模式下用户可在现有的K8s集群上集成运行大数据组件不用额外单独建设大数据集群项目地址:https://github.com/linktimecloud/kubernetes-data-platform辛辛苦苦研究出来的成果，为什么要开源?这波格局开大，老板有话说问题1:我们为什么要开源?我们的产品一直是基于大数据开源生态体系建设的。之前就一直有开源回馈社区的计划，但是因为之前Kubernetes对于大数据组件的支持还不够成熟，我们也一直在迭代与Kubernetes的适配。贡献参考开发者指南，了解如何开发及贡献KDP。

Kubernetes 大数据平台开源
开源软件 Tools4AI 将 AI 无缝集成到 Java 企业应用程序中

Tools4AI是一款开源软件，它通过将AI无缝集成到Java企业应用程序中脱颖出。这个基于Java的项目引入了大型操作模型或LLM代理，为希望将AI功能高效添加到Java应用程序中的开发人员提供了一个非常合适的解决方案。Tools4AI的出现改变了在Java环境中使用AI的游戏规则，为开发人员提供了一个实用的工具，使他们能够增强Java应用程序的功能不增加开发过程的复杂性。

AI集成 Java应用程序 Gemini-1.5-Pro

Chat UI:开源代码库，为HuggingChat应用提供动力

chat-ui是一个开源的聊天界面，使用开源模型如OpenAssistant或Llama。它是一个SvelteKit应用程序，为hf.co/chat上的HuggingChat应用提供支持。该产品允许用户通过自定义配置来运行和部署自己的Chat UI实例，支持多种语言模型和功能，如Web搜索、自定义模型等。

开源聊天应用 SvelteKit

360AI浏览器APP:360AI 浏览器，AI 赋能，秒懂一切。

360AI 浏览器利用人工智能技术，提供智能搜索、PDF、视频、网页总结等功能，旨在帮助用户高效获取知识，提升阅读体验。

智能搜索 PDF 阅读视频播放

FAQ Generator:免费AI生成FAQ，无需注册即可创建网站FAQ模板。

AI FAQ Generator是一款利用先进AI技术，通过分析常见问题自动生成FAQ列表的工具。它能够快速高效地生成FAQ，节省时间和资源，同时提供准确的答案，帮助提高客户满意度，并改善SEO效果。

AI技术自动化 FAQ创建

BrickCenter:一个创意无限的乐高设计平台，让你的想象力变为现实。

BrickCenter是一个在线平台，允许用户免费创建自己的乐高套装和迷你人物。它提供了一个将创意转化为详细乐高设计的工具，无论是复杂的场景还是个性化的迷你人物，用户都可以在这个平台上实现自己的设计梦想。该平台以其用户友好的界面和强大的定制功能而受到乐高爱好者的欢迎。

创意设计乐高

100 UI/UX Tips:在一个小时内学习如何制作令人印象深刻的应用程序界面。

《100 UI/UX Tips》提供了设计界面所需的所有提示，让用户感到满意。强调产品的主要优点、背景信息、价格和定位。

设计用户界面用户体验

whatwide.ai:提高生产力的AI助手，简单易用

whatwide.ai是一个提高生产力的AI助手，使用人工智能技术来节省时间并提高工作效率。它提供了50多种AI模型，包括文本生成、网站帮助、社交媒体分析、编程辅助等多种功能。whatwide.ai的优点在于高质量的内容生成、快速且安全的操作，以及多种AI类型供用户选择。

生产力文本生成网站帮助

Stream of Consciousness:一个展示想象中艺术家思绪的日常表演，通过创作和分享图像来表达创造力。

Stream of Consciousness是一个记录并分享艺术家思维的项目，通过创作和分享图像来展示创造力。它提供了一个深入艺术家思维的窗口，让人们了解艺术创作的过程和灵感的来源。

艺术创作思绪

Neurelo:是一种用于PostgreSQL、MongoDB和MySQL的云数据API平台，通过自动生成REST和GraphQL数据API、AI辅助的自定义查询API、查询可观察性等功能，简化和加速现代云应用程序开发。

Neurelo是一个专为云数据库而设计的平台，通过使用云API和人工智能技术，提供自动生成API、自定义查询API、查询可观察性和Schema as Code等功能，以提高开发人员的生产力。Neurelo能够简化数据库编程相关的复杂性，并具备可伸缩性、安全性和查询优化能力。

数据库云应用程序 API

EdrawMax:智能且风格多样的图表解决方案，简化您的想法可视化过程。

EdrawMax是一款功能强大的图表设计软件，它提供一站式的图表解决方案，适用于流程图、思维导图、组织结构图、甘特图、平面图和ER图等210多种图表类型。它具有简洁的用户界面，类似于MS Office的干净、整齐的界面，直观且易于导航的工具集，以及无缝的拖放功能。此外，EdrawMax还提供了23000多个用户制作的模板，850个精心制作的内置模板，以及26000多个免费符号，覆盖所有图表类型。它还具备AI功能，可以生成和分析22种类型的图表，包括文本到绘图和图片到绘图以及AI聊天。EdrawMax支持跨平台集成，可以在云端保存文件并通过链接共享，支持通过社交媒体或电子邮件发送作品，并能以13种格式导出图表，包括VSDX、PPTX和SVG等。此外，EdrawMax遵循GDPR标准，使用最高级别的256位SSL加密，确保用户隐私和数据安全。

watsonx.ai背后的黑科技——企业级的AI与数据平台

今日大家都在搜的词：

热文

站长商机