首页 > 业界 > 关键词  > 生成式人工智能最新资讯  > 正文

报告:数据质量是实施生成式人工智能的障碍

2024-02-06 09:36 · 稿源:站长之家

**划重点:**

- 📊 **数据领导者的调查:** 一项由Informatica进行的数据领导者调查表明,数据质量是实施生成式人工智能(GenAI)时面临的最大障碍。

- 🛠️ **数据管理工具和数据源:** 企业使用的数据管理工具数量以及大量企业应对1000多个独立数据源的情况也对GenAI项目产生了影响。

- 📈 **GenAI的实施和挑战:** 据调查,45%的公司已经以某种形式实施了GenAI,而另有53%计划实施。

站长之家(ChinaZ.com)2月6日 消息:Informatica最新的CDO Insights2024报告揭示,对于实施生成式人工智能(GenAI),数据质量是最大的障碍。该报告基于对全球大型企业中600名数据领导者的调查,发现45%的公司已经以某种形式实施了GenAI,而另有53%计划实施。对于几乎没有人在14个月前知晓的技术而言,只有2%的公司表示GenAI不适用于他们,这是一个非常低的数字。

然而,要成功实施GenAI并不像注册一个OpenAI账户,让GPT自由运行那么简单。尽管今天的预训练大型语言模型(LLMs)比过去的自然语言处理技术更易于使用,但拥有良好的数据仍然对于使一切正常运行至关重要,无论是从头开始训练模型、微调预构建模型,还是在运行时提示LLM。糟糕的数据将同样摧毁GenAI项目,就像它会摧毁任何类型的人工智能或机器学习项目一样。

在这方面,Informatica的调查发现,正在部署GenAI或计划部署GenAI的数据领导者中有42%(约600人中的588人)将数据质量列为GenAI成功的头号关切。报告显示,其他GenAI的关切包括数据隐私和保护、AI伦理、用于培训和微调语言模型的数据数量以及AI治理。

image.png

这些数据管理工具在Informatica的调查基础上被广泛使用。实际上,这家总部位于加利福尼亚州Redwood City的公司报告说,100%的调查参与者表示他们正在投资于支持数据战略和优先事项的数据管理能力,这无疑是一个很好的迹象。

然而,对Informatica来说,这个100%的数字也有一线曙光。该公司发现,58%的受访者使用了五种或更多种数据管理工具。此外,这些数据管理工具中的大多数在49%的受访者中并非作为云托管服务提供。

更多的数据通常意味着更多的洞察和更好的信号。但根据Informatica的说法,五分之二的公司表示他们正在处理1000个或更多个数据源。近80%的受访者表示他们预计2024年数据源的数量将增加。

39%的数据领导者报告称,在2024年,改善GenAI用例的数据可靠性和一致性是优先事项。另有39%的人将在2024年设定建立数据驱动文化和提高数据素养的目标,而38%的人将在2024年设定改善对数据和数据流程的治理的目标。

数据管理已经成为GenAI的关键推动因素并非令Jitesh Ghai,Informatica的首席产品官感到惊讶。

Ghai在新闻稿中说:“毫不奇怪,无论地区还是行业,生成式人工智能的实施和成功所需的数据策略仍然主导着大多数数据领导者的带宽。”他表示:“虽然这些领导者必须克服许多技术和组织上的障碍,但很明显,对于解锁GenAI的巨大潜力并使企业完全掌控其不断扩大的数据资产,全面、高度集成的数据管理能力的投资是关键。”

举报

  • 相关推荐
  • 厚植AI创新沃土!麒麟信安打造人工智能孵化器,赋能创业梦想

    10月28日,麒麟信安人工智能孵化器在长沙启动,旨在汇聚AI领域人才、技术与资本,构建开放协同的创新生态。该项目获湖南省多部门支持,已吸引60余个项目入围,组建了首批30余位专家导师团,并与多家顶尖机构共建联合体,通过政策扶持、资本对接等多维度赋能,培育优质AI项目在湘落地发展,助力区域打造人工智能产业创新高地。

  • 人工智能巨头OpenAI拟上市 估值或高达1万亿美元

    OpenAI正积极推进上市计划,据知情人士透露,该公司可能最早于2026年下半年向证券监管机构提交上市申请,目标在2027年正式上市。 此次IPO的估值有望达到约1万亿美元,或将跻身全球规模最大的IPO之列。 在初步讨论中,OpenAI曾考虑通过上市筹集至少600亿美元资金,实际融资规模可能进一步扩大。

  • 共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

    10月28日,AtomGit平台在北京国家会议中心举行升级发布会,正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞,强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源,打造开放中立的基础设施,计划于11月21日正式上线。华为、百度等企业代表分享了开源实践,多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

  • 卖家精灵加入中国人工智能产业发展联盟(AIIA),加速AI赋能跨境电商

    卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力,近日正式加入中国人工智能产业发展联盟(AIIA),成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可,未来将携手联盟推动AI技术研发与产业化,助力中国品牌全球化。依托八年积累的海量电商数据与算法体系,卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案,服务超百万跨境卖家,显著提升运营效率与决策精准度。

  • 行业首个!海尔冰箱获ISO/IEC 42001人工智能管理体系认证

    2025年10月,海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业,标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程,确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品,推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术,为用户提供更安全、智能的健康饮食体验。

  • 人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

    科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲,强调高质量数据集是人工智能产业决胜关键。他指出,算力、算法和数据构成AI三大要素,而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施,通过集中管理、分散赋能模式,打通数据采集、治理到AI训练全链路,推动产业智能化升级。该平台已在制造、金融等领域落地,助力企业释放数据要素价值,实现弯道超车。

  • AI搜索可见性监控:品牌在生成式搜索时代的生存新法则

    AI搜索正颠覆传统SEO:58.5%的谷歌搜索已是零点击,用户看完AI摘要即离开。ChatGPT日处理超100亿查询,预计2030年流量将超谷歌。品牌需监控AI平台推荐情况,传统工具无法追踪豆包、通义千问等国产AI。建议建立监控体系:测试核心问题曝光率,每周追踪排名变化,持续优化内容。数据显示71%美国人用AI辅助购物决策,流量正加速从谷歌转向AI。生存法则很简单:看不见的,等于不存在。

  • 什么是GEO优化?AI生成式引擎优化平台推荐

    在数字化浪潮席卷的当下,搜索引擎的使用方式正在发生根本性变革。越来越多的用户不再只是输入碎片化的关键词,而是通过自然语言与AI对话来获取信息。根据中国信通院发布的《2025年生成式AI商业应用报告》数据显示,超60%的用户已养成借助AI对话获取各类信息的习惯。这一转变催生了全新的营销领域——GEO优化。 什么是GEO优化? GEO,全称为生成式引擎优化,是

  • 什么是AI生成式引擎优化GEO?GEO与传统SEO的核心区别

    ​GEO(生成式引擎优化)是AI时代的流量新密码。随着生成式AI全面渗透信息获取场景,传统搜索引擎优化(SEO)正在被GEO所补充甚至部分取代。截至2025年,中国AI搜索用户规模已超6.5亿,文心一言、豆包等平台日均处理查询超过20亿次,用户已经从“翻页搜索”转向“对话获取答案”。 与传统SEO关注网页排名不同,GEO的核心目标是让品牌内容被AI优先引用和推荐。研究表明,72%�

  • geo生成式引擎优化是什么?GEO优化原理与工具推荐

    在AI技术日新月异的今天,我们的信息获取方式正经历着一场革命。生成式引擎优化(Generative Engine Optimization,简称GEO)是AI搜索时代应运而生的新型优化策略,它被视为传统SEO在AI时代的进化版。 与传统SEO专注于提升网页在搜索引擎结果中的排名不同,GEO的核心目标是让品牌信息能够被DeepSeek、豆包、文心一言等主流AI平台识别、引用并直接推荐给用户。这种转变是因为搜索�

今日大家都在搜的词: