首页 > 业界 > 关键词  > 生成式人工智能最新资讯  > 正文

报告:数据质量是实施生成式人工智能的障碍

2024-02-06 09:36 · 稿源:站长之家

**划重点:**

- 📊 **数据领导者的调查:** 一项由Informatica进行的数据领导者调查表明,数据质量是实施生成式人工智能(GenAI)时面临的最大障碍。

- 🛠️ **数据管理工具和数据源:** 企业使用的数据管理工具数量以及大量企业应对1000多个独立数据源的情况也对GenAI项目产生了影响。

- 📈 **GenAI的实施和挑战:** 据调查,45%的公司已经以某种形式实施了GenAI,而另有53%计划实施。

站长之家(ChinaZ.com)2月6日 消息:Informatica最新的CDO Insights2024报告揭示,对于实施生成式人工智能(GenAI),数据质量是最大的障碍。该报告基于对全球大型企业中600名数据领导者的调查,发现45%的公司已经以某种形式实施了GenAI,而另有53%计划实施。对于几乎没有人在14个月前知晓的技术而言,只有2%的公司表示GenAI不适用于他们,这是一个非常低的数字。

然而,要成功实施GenAI并不像注册一个OpenAI账户,让GPT自由运行那么简单。尽管今天的预训练大型语言模型(LLMs)比过去的自然语言处理技术更易于使用,但拥有良好的数据仍然对于使一切正常运行至关重要,无论是从头开始训练模型、微调预构建模型,还是在运行时提示LLM。糟糕的数据将同样摧毁GenAI项目,就像它会摧毁任何类型的人工智能或机器学习项目一样。

在这方面,Informatica的调查发现,正在部署GenAI或计划部署GenAI的数据领导者中有42%(约600人中的588人)将数据质量列为GenAI成功的头号关切。报告显示,其他GenAI的关切包括数据隐私和保护、AI伦理、用于培训和微调语言模型的数据数量以及AI治理。

image.png

这些数据管理工具在Informatica的调查基础上被广泛使用。实际上,这家总部位于加利福尼亚州Redwood City的公司报告说,100%的调查参与者表示他们正在投资于支持数据战略和优先事项的数据管理能力,这无疑是一个很好的迹象。

然而,对Informatica来说,这个100%的数字也有一线曙光。该公司发现,58%的受访者使用了五种或更多种数据管理工具。此外,这些数据管理工具中的大多数在49%的受访者中并非作为云托管服务提供。

更多的数据通常意味着更多的洞察和更好的信号。但根据Informatica的说法,五分之二的公司表示他们正在处理1000个或更多个数据源。近80%的受访者表示他们预计2024年数据源的数量将增加。

39%的数据领导者报告称,在2024年,改善GenAI用例的数据可靠性和一致性是优先事项。另有39%的人将在2024年设定建立数据驱动文化和提高数据素养的目标,而38%的人将在2024年设定改善对数据和数据流程的治理的目标。

数据管理已经成为GenAI的关键推动因素并非令Jitesh Ghai,Informatica的首席产品官感到惊讶。

Ghai在新闻稿中说:“毫不奇怪,无论地区还是行业,生成式人工智能的实施和成功所需的数据策略仍然主导着大多数数据领导者的带宽。”他表示:“虽然这些领导者必须克服许多技术和组织上的障碍,但很明显,对于解锁GenAI的巨大潜力并使企业完全掌控其不断扩大的数据资产,全面、高度集成的数据管理能力的投资是关键。”

举报

  • 相关推荐
  • 人工智能创新创业大赛进入关键评审阶段,前沿AI项目角逐决赛席位

    "智汇运河·智算未来"人工智能创新创业大赛进入关键阶段。经过全球征集筛选,50个代表AI前沿创新的项目脱颖而出,涵盖智能制造、智慧城市、生命健康、智慧物流四大"AI+"赛道。赛事聚焦技术突破性、模式创新性和产业落地潜力,旨在推动AI技术从实验室走向应用场景。杭州拱墅区通过大赛汇聚全球智慧,加速构建人工智能产业高地。7月6日决赛将展现顶尖项�

  • 专业AI工具导航与人工智能学习平台AIbase.cn 连接现在与AI未来的智能桥梁

    AI技术正重塑各行各业,从语音助手到自动驾驶,从医疗诊断到金融分析,已从科幻变为现实。面对AI快速发展,许多人感到迷茫:如何跟上技术前沿?如何在AI浪潮中找到机遇?AIbase.cn应运而生,致力于成为连接现在与未来的智能桥梁。平台汇聚全球最新AI资讯、实用技术资源和前沿行业洞察,为新手、开发者和企业家提供一站式解决方案。核心服务体系包括:前沿资讯精选、精品AI工具库、系统化教程、商业化指南和开发者生态支持。通过专业内容与活跃社区,帮助用户在快速变化的AI领域保持敏锐洞察力,实现从概念到应用的跨越。AIbase.cn已成为数万AI从业者的首选平台,期待与您共同探索智能时代的无限可能。

  • 国内有哪些AI新闻网站?2025年最全人工智能资讯平台推荐

    本文介绍了国内优质AI新闻网站,帮助读者快速掌握人工智能领域最新动态。重点推荐了AIbase.cn、机器之心、量子位和AI工具集四个平台,分别从资讯全面性、技术深度、行业洞察和工具导航等角度分析其特色。文章指出,在AI技术快速迭代的背景下,专业AI新闻网站能提供更及时、深入的行业资讯,建议读者根据需求选择合适平台,建立日常阅读习惯,多元化获取信息,并积极参与社区讨论,以保持对行业趋势的敏锐度。

  • 寒武纪荣获2025人工智能领域金牛上市公司科创奖

    2025科创金牛奖获奖名单揭晓,寒武纪凭借在人工智能芯片领域的卓越表现,荣获人工智能领域金牛奖。该奖项由中国证券报打造,是中国资本市场最具影响力的奖项之一。寒武纪专注AI芯片研发,提供云边端一体化智能芯片产品和平台化基础系统软件,其通用型智能芯片产品技术壁垒高、应用场景广。2024年公司研发投入达10.72亿元,新增专利授权314项。此次获奖既是对其科技创新成果的肯定,也是对其推动AI技术产业化应用的认可。未来寒武纪将加速产品迭代升级,为我国人工智能产业发展筑牢技术根基。

  • 微算法科技(NASDAQ:MLGO)将人工智能驱动的任务调度策略与边缘计算区块链集成,增强物联网系统稳定性

    物联网(IoT)技术快速发展,边缘计算成为解决海量数据处理的关键方案。微算法科技(NASDAQ:MLGO)创新性地将AI驱动的CO-ETS任务调度策略与区块链技术结合,构建了智能、安全、高效的物联网任务调度系统。该系统通过模拟棕熊觅食行为的优化算法,动态调整任务分配,最小化能耗并最大化执行效率;同时利用区块链技术确保任务调度的透明性和不可篡改性。该方案可广泛应用于智慧城市、工业物联网和智能家居等领域,显著提升系统性能和安全性,为物联网发展带来革命性突破。

  • 神州数码 x 嘉岳数智:以生成式AI打造绿色低碳行业的“懂碳帝”

    在"双碳"战略推动下,绿色转型成为产业升级和企业发展的重要方向。神州数码与嘉岳数智科技合作,探索AI技术在碳评估智能化领域的应用,解决传统碳评估面临的数据分散、专业性强等痛点。通过构建EPAG专家流程增强生成框架、Agent场景分类机制和自动化评估学习流程,显著提升专业术语理解准确率至95%以上,大幅减少人工编辑工作量。双方打造的智能评估产品已进入预发布阶段,为生成式AI在垂直行业落地树立标杆,助力企业实现绿色低碳转型目标。

  • 可灵AI全系模型上线“视频音效”功能 可同步生成高质量立体声音效

    可灵AI宣布全系列视频模型上线“视频音效”功能,用户在使用可灵AI进行视频创作时,不仅能获得高质量的视频画面,更能体验到与视频精准匹配、富有空间感的立体声音效……

  • 从车企CIO视角看Testin云测的智能座舱AI测试实施案例

    文章探讨了智能座舱成为车企差异化竞争核心的趋势。2024年数据显示,智能座舱故障率高居新能源汽车投诉首位,暴露传统测试模式在复杂系统下的不足。以Testin云测为代表的AI测试服务商通过三大技术重构测试体系:1)视觉引擎实现跨系统界面识别,测试效率提升3倍;2)缺陷预测模型使65%问题在开发阶段暴露,降低后期修复成本50%;3)云端设备池化使硬件利用率从30%提升至65%。某头部车企案例显示,该方案使测试效率提升35%,缺陷检出率提高55%,年节省测试费用超千万元。未来趋势将向AI深度渗透、虚实结合测试和全生命周期管控发展。

  • 融合数据中台与动态调度:林剑峰在共享出行智能算法开发中的技术探索

    本文讲述了林剑峰在智能出行领域的十年深耕历程。作为系统工程师,他主导构建了融合数据、算法与规则引擎的智能调度体系,通过动态聚类和路径规划模型显著提升了共享单车调度效率。其创新包括分级围栏模型、嵌入式调度判断模块等专利技术,实现了跨区域精准调度和系统自主运行能力。数据显示,他推动的系统使车辆调度效率提升37.38%,异常识别准确率显著提高。林剑峰的工作体现了"技术+业务"的系统设计理念,为城市智能交通建设提供了可借鉴的技术范式。

  • 硬盘丢失了数据怎么恢复?硬盘数据恢复的6种方法

    文章分析了硬盘数据丢失的常见原因及恢复方法。数据丢失主要源于人为误操作、硬件故障、软件系统问题和环境因素四类。针对不同情况,介绍了6种恢复方法:回收站还原、系统版本回退、备份还原、Mac系统的TimeMachine、命令行操作以及专业数据恢复软件。其中专业软件如转转大师能深度扫描硬盘,支持多种文件格式恢复,操作简便且成功率高。文章强调数据丢失后应避免写入操作,根据实际情况选择合适恢复方式,并建议做好日常备份预防数据丢失。