首页 > 传媒 > 关键词  > AI驱动数据治理最新资讯  > 正文

瓴羊Dataphin:AI驱动的数据治理——千里之行,始于标准

2025-01-20 14:54 · 稿源: 站长之家用户

作者: 周鑫 阿里云瓴羊智能科技高档技术专家

近年来,尽管 AI Agent 实现了爆发式增长,但许多企业仍面临 AI 应用与实际业务脱节的难题,其关键原因之一,在于数据质量不佳。根据Gartner的预测,2025 年中国至少三分之二的生成式人工智能项目,将由于数据质量差而面临“终结”。

AI时代,如何才能把握住数据治理机会,让数据真正为业务服务?

瓴羊「数据荟」数据Meet Up 第 3 站线上开讲,为大模型时代的数据治理创新实践献智献策。阿里云智能集团瓴羊高档技术专家周鑫围绕“AI驱动的数据治理”,从数据治理面临的难题出发,聚焦AI时代数据治理机会,剖析了瓴羊Dataphin在面对数据治理这一关键议题时的提效方案。

数据标准:数据治理“化零为整”的核心

从实施链路来看,数据治理为何如此困难?

“整个数据治理实施过程困难重重,主要体现在现状评估难、组织架构复杂、实施成本高,治理迭代难,造成比较大的原因是整个治理过程关注的点太多了,没有核心的抓手”,周鑫表示,大部分企业进行数据治理时,往往经历评估现状、制定目标、执行计划、持续监控四个步骤,每一项都需要大量的工作,导致治理动作非常零散。

这些零散的需求点,导致企业在实施阶段很容易偏离治理目标,缺少一个核心抓手。即使艰难地完成治理,后续迭代也非常困难,随着业务的变化,需要调整治理目标时,没有办法增量的迭代,又需要重头开始评估执行,已完成的治理项的变更影响也需要全量评估,使得治理成本变得非常高。

因此,问题的关键,是找到数据治理的核心抓手——数据标准。

近年来,国家频频颁布数据标准相关政策规范,从《“数据要素x”三年行动计划》到国家数据标准体系,再到全国数据标准化技术委员会,都印证了数据标准的重要位置。

“企业只需完成数据标准的梳理,即可完成大部分数据治理工作”,周鑫表示,以瓴羊Dataphin为例,企业完成业务与数据盘点后,统一进入到Data Catalog,在此基础上梳理数据标准。Dataphin在数据标准的建立过程中会自动生成元数据和内容的监控,数据标准会贯穿数据的整个生命周期,实现对数据的事前、事中和事后的标准落标稽核。

例如,在身份证号的标准设置中,系统会根据用户填写的标准属性,自动生成一系列元数据和内容监控,以及安全的分级。用户在治理过程中,只需关心那些没有满足标准的数据即可。这使数据标准的落标情况,成为衡量数据质量优劣的“晴雨表”,符合数据标准的数据越多,数据质量也就越好。

AI激活一池春水,数据治理的提效之道

AI时代奔迅而至,激活了数据治理的一池春水。在AI技术爆发式增长的当下,数据治理的机会在哪里?

周鑫认为,结合AI对数据治理提效的实现完整的主动数据治理,包括以下几点。

首先,通过AI能很好地理解结构化数据和非结构化的数据,自动化地进行业务梳理, 促进数据标准建设的效率。其次,在数据标准建设完成后,企业可借助AI实现自动治理:构建质量规则,实现分类分级和特征识别,管控数据整个生命周期。最后,数据治理动作完成后,AI还可自动评估治理效果,自动改进治理策略,形成数据治理良性内循环。

Dataphin解决方案:让“好数据”成就“好业务”

“我是电商业务负责人,今年大促目标是GMV提升20%,数据能帮我做什么?”

“我正在准备做运营外投,对于圈选母婴群,希望从数据上结合知识库,有什么建议?”

“我是产品运营,我想了解产品的销量指标定义是什么?”

……

在AI的助力下,以上数据资产应用问题,都可以通过对话的方式得到回应。

而承载这一功能的平台,便是智能小D。

“智能小D承担了数据PD与数据架构师的角色,它可以根据每一条策略,找到与之对应的数据资产表”,周鑫表示,智能小D基于Dataphin打造,由阿里云百炼平台和开源Dify提供支持,擅长数据知识的梳理和应用。未来,智能小D将进一步支持非结构化知识和智能体管理,用户还可通过挂载自定义智能体,实现智能体的个性化定义与功能拓展。

借助智能小D,用户可以直接基于业务需求找数据,如“我要找客户表”、“我要做客户分层,需要哪些表?”、“销量下降明显,可能的原因有哪些?”等,大模型将根据用户需求,通过分解、联想等方式,为其快速提供对应的数据资产表,让用户无需将需求拆解成资产的关键词,也能实现轻松找数。

除此之外,Dataphin还在属性丰富上引入了AI能力,简化了资产上架的流程。以往,一张表上架到目录,需要历经以下几个步骤:针对表及其所有字段,逐一描述其名称与含义;熟知上架目录,制定便于搜索的标签;若过程中发现表中的指标也需要上架,还需返回重新填写目录和标签。

“一套几百个字段下来,至少半小时才能将这张表完整地上架,我们引入AI能力后,把速度提高了近百倍”,周鑫表示,Dataphin可以帮用户智能生成所有描述,规划所有目录,自动识别潜在指标,待用户确认无误后,即可一键上架,几十秒即可完成所有资产上架工作。

在特征识别方面,Dataphin通过引入AI能力,降低了识别门槛,加快了识别速度。例如,在进行性别字段识别时,需要编写SQL能够识别的正则表达式,还需要探查多种数据的表达,例如:(男/女、Malel/Female、Sex/性别),很难一次性枚举种种条件。引入AI能力后,Dataphin即可以自动生成所有的正则表达式,几十秒内即可完成一次特征识别。

周鑫指出,目前Dataphin的数据治理AI计划正处于提效阶段。在这一阶段,Dataphin将进一步引入更多行业和业务知识,增强对非结构化数据的理解能力,并辅助生成质量规则。随着提效阶段的完成,数据治理将迈入自动化阶段,平台将实现质量规则的自动生成、分类分级的自动处理,以及敏感数据的自动识别等功能。最终,在更高阶的智能化阶段,Dataphin将基于对业务流程的深度理解,实现系统自动生成数据标准,全面提升数据治理的智能化水平。

知名的信息技术领域思想佼佼者J. Ladley 在其著作《数据治理》中宣称,数据治理的最终目标是让它不再是一个独立的计划,而是成为业务核心的一部分。未来,瓴羊旗下Dataphin将发挥自身在数据治理领域的深厚沉淀,致力于将数据治理融入业务环节,推动其从支撑性工具走向核心驱动力,以智能化手段赋能企业战略决策与创新实践。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 迎“人工智能+”政策东风!2025中国智能产业大会&吴文俊人工智能创新大会即将落地常州

    在全球AI竞争加剧背景下,国务院印发《关于深入实施“人工智能+”行动的意见》,推动AI与经济社会深度融合。中国人工智能学会主办的“2025第十四届中国智能产业大会暨吴文俊人工智能创新大会”将于8月30-31日在常州举行,聚焦破解AI产业“卡脖子”难题。大会设置15场专题会议和3场特色活动,覆盖基础技术突破、核心应用落地、交叉学科融合等领域,为产学研各界搭建高

  • 北电数智亮相世界人工智能大会,“四链融合”推动AI产业落地

    2025世界人工智能大会“人工智能+”战略领军人才与创新发展论坛圆满落幕。论坛聚焦“人才领航智启未来”主题,汇聚中科院、社科院专家及中国联通、腾讯云等机构代表,围绕“人工智能+”行动分享经验,为AI高质量发展筑牢人才根基、激发创新动能。北电数智CMO杨震出席并发表演讲,分享AI行业落地实践,强调紧跟国家战略,推进产业、创新、人才、资本四链融合,打造面向不同场景的AI解决方案,全方位助力AI产业发展。

  • ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

    ISC.AI2025人工智能安全论坛在北京召开,聚焦AI安全治理与创新实践。论坛汇集顶尖专家,探讨大模型安全评估与防护、智能体安全、AI治理等前沿议题。360集团张向征指出,随着Agent技术爆发式应用,AI安全已成为产业核心焦点。专家们强调需构建AI安全防护体系,应对大模型直接访问核心系统带来的全新挑战。中国电子院彭健提出企业合规建设需关注九大要素,清华大学苏航揭示智能体安全风险远超传统AI。华为云范建军倡导端到端大模型安全防护,中国信通院杨哲超呼吁构建协同治理框架。论坛为构建安全、普惠、负责任的人工智能未来贡献智慧。

  • 微信:加强治理违规荐股行为

    微信珊瑚安全官方公众号今天发文表示,微信将加强治理违规荐股行为的公告。 微信称,平台一直以来致力于为用户提供文明健康、规范有序的网络环境,鼓励倡导财经和证券类专业人士发布权威真实的证券股票类信息。 近期,伴随资本市场热度上升,平台发现有少量账号违规提供荐股服务,以专家授课”股市小作文”等方式编造传播虚假信息误导公众,发布各类导流内容�

  • AI与数据库双向赋能,达梦靠自主创新把握弯道超车机遇

    AI时代下,数据库行业正经历深刻变革。达梦数据副总经理李庄庄指出,AI与数据库双向赋能、深度融合,带来多模态数据处理、高并发低延迟等新需求。数据库需提升智能化自治能力,通过架构升级、AI技术集成及生态开放应对挑战。达梦通过AI4DB和DB4DB双路径布局,已在智能参数调优、多引擎数据库等领域取得进展。未来,数据库将更智能、普惠,技术硬实力与落地价值是关键竞争力。

  • 水滴信用:专业企业大数据MCP服务商提供多类型多数据维度企业信息MCP

    水滴信用作为专业企业大数据服务商,通过多维度企业信息MCP矩阵,整合工商、司法、知识产权、招投标等海量数据,构建企业级智能平台。提供企业查询、风险扫描、供应商管理、上市公司分析等场景化服务,帮助金融机构、企业及投资者高效获取精准洞察,实现数据驱动的智能决策与风险管控,推动商业效率革新。

  • 金仓数据库亮相2025数博会,以AI融合创新赋能产业升级

    2025中国国际大数据产业博览会8月28日在贵阳开幕,聚焦"数聚产业动能+智启发展新篇"主题,展示数据要素与人工智能融合创新成果。重点呈现金仓数据库系列产品,包括KXData一体机,通过软硬一体设计实现成本降低40%以上,并搭载智能运维系统。产品覆盖政务、医疗、金融等多个领域,助力产业升级与高质量发展,推动数字经济新篇章。

  • 海尔冰箱唯一获批“制冷家电人工智能技术山东省工程研究中心”

    海尔冰箱在人工智能领域取得新突破,主导建设的"制冷家电人工智能技术山东省工程研究中心"成为2025年山东省工程研究中心认定名单中唯一入选的冰箱品牌。该中心聚焦人工智能、物联网、大数据等技术方向,开发了全空间智慧保鲜舱冰箱等140多项行业首创产品,近三年获授权发明专利803件。海尔冰箱还推出行业首款接入DeepSeek的AI全空间保鲜冰箱,具备方言识别、降噪技术等功能,显著提升用户体验。市场数据显示,2023年1-7月海尔冰箱以47%市场份额稳居行业第一。通过AI技术赋能,海尔冰箱正引领行业向精准、智能保鲜时代跨越。

  • 下一个爆款在哪儿?2025英特尔人工智能创新应用大赛获奖名单揭晓

    8月16日,2025英特尔人工智能创新应用大赛总决赛在深圳落幕。40支优秀团队从2817支队伍中脱颖而出,围绕工业、教育、心理健康、游戏等领域展开对决。大赛展示了AI从云端走向边缘的趋势,依托酷睿Ultra处理器和低代码开发工具,推动AI应用本地化落地。获奖作品包括动力电池机器人协作拆卸系统和AI生成PPT服务,体现AI与产业需求的深度融合。英特尔与联想、惠普等合作伙伴共同为开发者提供全栈支持,加速AI技术普及和商业化进程。

  • 维谛(Vertiv)宣布收购生成式AI软件领军企业Waylay NV

    维谛技术(Vertiv)宣布收购比利时生成式AI软件企业Waylay NV,旨在提升关键数字基础设施的运营智能化水平、系统优化能力及服务体验。此次收购将整合Waylay先进的AI驱动自动化平台,帮助客户实现数据中心电力与热管理系统的实时监控、预测性维护和动态优化,应对AI工作负载快速增长的需求。维谛CEO表示,这将加速公司智能化基础设施愿景的实现,助力客户提升运营效率与�

今日大家都在搜的词: