首页 > 传媒 > 关键词  > 数据治理最新资讯  > 正文

瓴羊数据Meet Up第三期:2025年,数据治理的金钥匙,藏在这些趋势与实践里

2025-01-20 14:53 · 稿源: 站长之家用户

数据、算法与算力,被称为人工智能的三驾马车。在数据体量爆发性增长的当下,精耕细作的数据治理,或将成为企业赶上大模型风口的制胜关键。

瓴羊「数据荟」数据Meet Up第三站线上活动成功举办。来自中国信息通信研究院、阿里云智能集团、雅戈尔集团的业务主管、技术专家及大数据负责人,围绕“大模型时代的数据治理创新实践”主题,深入分享了AI与数据治理的深度融合、数据平台建设的理想实践以及数据资产管理与运营的前沿见解。

大模型时代,数据治理四大趋势与三大堵点

中国信息通信研究院云计算与大数据研究所高档业务主管尹正指出,AI时代下的数据治理,将呈现出“全域数据治理”、“数据研发模式工程化、敏捷化”、“数据治理技术智能化”、“数据安全纵深化”四大趋势。

具体而言,全域数据治理将重点关注音视频、图片、文本等非结构化数据。在实践领域,中国移动、自动驾驶等企业已通过构建非结构化数据评价体系,关注合成数据技术,提升了数据集可信性,解决了“数据荒”难题。

在全域数据治理下,数据研发模式也随之发生变化,企业应打造面向AI与BI结合的数据工程“流水线”,以系统化方法提升效率、降低成本、保障质量、推动创新。同时,智能化数据治理将逐步取代传统劳动密集型模式,而AI驱动的数据安全技术与能力,将为解决数据安全关键问题、应对大模型安全挑战指明方向。

尽管趋势向好,但当前大模型发展仍面临质量、安全、伦理三大数据堵点,具体体现为:高质量数据集构建知易行难,安全与隐私泄露频发、数据伦理体系亟待完善。不过,面向AI的数据治理框架正在形成,人工智能数据治理的流程、方法、技术也在逐步完善。此外,依据DataOps理念构建面向人工智能的数据工程体系,为Al提供了敏捷有效、安全可信的数据供给,并进一步为企业人工智能长期平稳、良好、健康发展提供了保障。

以数据标准为抓手,让AI为数据治理提效

阿里云智能集团瓴羊高档技术专家周鑫指出,企业数据治理面临现状评估难、组织架构复杂、实施成本高、治理迭代难等多个难题,破解以上难题的较好方法,是找到核心抓手,降低数据治理的复杂度。

数据治理很重要的一个核心是数据标准的梳理与建设。通过瓴羊Dataphin,企业只需完成基础数据梳理,即可完成大部分数据治理工作。例如,在身份证数据治理中,企业仅需定义数据类型、分级标准及字段空值校验等规则,系统即可自动开展元数据监控,检验数据是否符合字符串类型、是否存在空值,安全权限是否合规。除元数据监控外,数据标准还能与数据质量、建模、研发相结合,使数据标准可以在数据全生命周期中得以不断流转。

周鑫提到,数据质量是AI成功的关键,据Gartner预测,到 2025 年,至少三分之二的生成式人工智能项目将因数据质量不足等问题在概念验证阶段被放弃。与此同时,AI同样是实现主动数据治理的重要工具,它可以让数据治理变得更加智能化和自动化,形成从数据发现、治理、评估与标准的完整闭环。

瓴羊Quick BI智能小D是AI+BI的标志性产品化成果,它承担着数据PD与数据架构师的角色,可以为用户业务问题提供直接的解决方案。以往,关键词搜索往往与实际业务问题相差千里,搜索“交易”得出的相似度匹配信息,并不能解决实际的业务问题。而利用智能小D,用户可直接提出“GMV提升20%,我能做什么?”或“哪些表适合用于客户分层?”等问题,无需自行拆解数据维度,即可获取直接的数据维度与策略指引。

除了数据发现与理解,瓴羊通过自动属性丰富功能,帮助企业一键生成目录、标签、描述等信息,将原本需要半小时完成的上架操作缩短至数十秒,效率提升百倍。此外,瓴羊的自动生成识别特征功能,让不会写、读不懂正则表达式的人也能轻松完成条件组合复杂的特征识别工作。迈过提效阶段后,Dataphin还将往更加自动化、智能化方向演进,探索自动生成质量规则、智能理解业务流程解决方案,让数据治理更加轻盈。

Dataphin的技术演进:打造开放兼容的数据建设与治理平台

阿里云智能集团瓴羊高档技术专家江岚指出,Dataphin在产品演进过程中,面临着“全域资产建设与治理”、“混合云架构”、“多引擎支持”和“资产消费”等挑战。为应对这些挑战,Dataphin成功探索出了一套优化数据建设与治理中台的技术实现路径。

在多引擎兼容方面,Dataphin通过多引擎SDK和插件的结合,充分融合了富客户端和轻客户端的优势,在接口层、插件层和依赖层构建了多引擎技术架构,实现了对多云环境的支持以及多种引擎的适配兼容。

在混合云架构方面,Dataphin基于Kubernetes集群部署了应用集群与默认调度集群,同时在IDC通过外部调度集群进行任务调度,广泛应用于数据集成、数据服务和资产采集等多个场景。

在资产消费场景中,Dataphin通过统一JDBC,实现了数据资产在权限管理、脱敏处理、审计等方面的统一管控。此外,Dataphin还与Quick BI进行了深度集成,大幅简化了用户的配置工作。目前,Dataphin已经在自助取数与分析、数据探查与分析、接口调用与应用等三种消费方式中得到了广泛应用,极大地提升了业务人员、数据分析师和开发人员的工作效率。

从数据资产建设到数据运营,雅戈尔的数据价值探索实践

雅戈尔集团大数据负责人竺显波表示,数字化建设有两个阶段,一个阶段是一切业务数据化、可视化,第二个阶段是一切数据业务化、价值化。数字化之所以经常被说成是“一把手工程”,正在于它要协同好公司的战略、业务、技术、治理与改革,是一个系统性的大工程。

雅戈尔的数据架构由以下三部分组成:数据源层、数据中台与数据应用。其中,数据中台和数据应用分别通过瓴羊Dataphin和Quick BI等数据产品,实现了工具与架构的全面升级,落地了多个数字化产品成果。例如,企业数据门户以销售、物流等类别划分,用户只需简单拖拉拽操作,即可快速生成所需报表;主题门户则根据品牌、大区管理人员、店长等特定身份进行分类,为不同用户准确聚合并有效查找所需数据提供了便利。

在数据中台建设方面,雅戈尔成功搭建了16个系统,整合了950多个数据表、400个指标和650个报表,提升了系统性能与架构效率。同时,雅戈尔实现了组织架构信息、商品信息、人员信息等核心数据的统一治理与贯通,消除了数据二义性。

在标准化治理的基础上,雅戈尔从数据组织、技术架构和流程管理三个层面全面优化,推动数据价值的深度挖掘与应用。以“平效”为例,数据团队基于“面积在 300 至 1 万平方米之间,面积越大,平效越高”的数据规律,验证了公司“开大店、关小店”战略的科学性和可行性,为企业决策提供了数据支撑。

随着AI与数据治理深度融合,更多行业将迎来数字化转型的新机遇。瓴羊将持续以数据标准为核心,打造开放兼容的数据建设与治理平台,推动企业开启更加有效、安全的数据治理新时代。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 迎“人工智能+”政策东风!2025中国智能产业大会&吴文俊人工智能创新大会即将落地常州

    在全球AI竞争加剧背景下,国务院印发《关于深入实施“人工智能+”行动的意见》,推动AI与经济社会深度融合。中国人工智能学会主办的“2025第十四届中国智能产业大会暨吴文俊人工智能创新大会”将于8月30-31日在常州举行,聚焦破解AI产业“卡脖子”难题。大会设置15场专题会议和3场特色活动,覆盖基础技术突破、核心应用落地、交叉学科融合等领域,为产学研各界搭建高

  • ISC.AI 2025 人工智能安全治理与创新实践论坛圆满召开

    ISC.AI2025人工智能安全论坛在北京召开,聚焦AI安全治理与创新实践。论坛汇集顶尖专家,探讨大模型安全评估与防护、智能体安全、AI治理等前沿议题。360集团张向征指出,随着Agent技术爆发式应用,AI安全已成为产业核心焦点。专家们强调需构建AI安全防护体系,应对大模型直接访问核心系统带来的全新挑战。中国电子院彭健提出企业合规建设需关注九大要素,清华大学苏航揭示智能体安全风险远超传统AI。华为云范建军倡导端到端大模型安全防护,中国信通院杨哲超呼吁构建协同治理框架。论坛为构建安全、普惠、负责任的人工智能未来贡献智慧。

  • 微信:加强治理违规荐股行为

    微信珊瑚安全官方公众号今天发文表示,微信将加强治理违规荐股行为的公告。 微信称,平台一直以来致力于为用户提供文明健康、规范有序的网络环境,鼓励倡导财经和证券类专业人士发布权威真实的证券股票类信息。 近期,伴随资本市场热度上升,平台发现有少量账号违规提供荐股服务,以专家授课”股市小作文”等方式编造传播虚假信息误导公众,发布各类导流内容�

  • 从数据穿透到模型迭代,攀智资本:重新定义技术驱动投资

    攀智资本(香港)有限公司以技术驱动投资为核心,在全球金融市场调整与中国金融业蓬勃发展的背景下,通过AI与量化交易深度融合,构建高效数据分析、量化模型、智能风控和自动化交易系统。公司精准锚定中国市场机遇,布局多元资产,挖掘政策红利与技术创新带来的投资机会。未来将拓展ESG投资与全球化业务,持续完善量化基础设施,推动行业技术转型,展现技术驱动投资的新范式。

  • 微算法科技(NASDAQ:MLGO)基于人工智能优化构建混合ARIMA模型,提高比特币价格预测准确性

    随着数字资产市场兴起,比特币等加密货币价格预测成为焦点。传统模型难以准确捕捉其非线性波动,微算法科技引入AI技术优化ARIMA模型,结合LSTM网络构建混合模型,提升预测准确性。通过AI算法自动处理数据缺失、异常值检测及参数优化,实现更可靠的比特币价格预测,为投资者提供决策支持。

  • 北电数智亮相世界人工智能大会,“四链融合”推动AI产业落地

    2025世界人工智能大会“人工智能+”战略领军人才与创新发展论坛圆满落幕。论坛聚焦“人才领航智启未来”主题,汇聚中科院、社科院专家及中国联通、腾讯云等机构代表,围绕“人工智能+”行动分享经验,为AI高质量发展筑牢人才根基、激发创新动能。北电数智CMO杨震出席并发表演讲,分享AI行业落地实践,强调紧跟国家战略,推进产业、创新、人才、资本四链融合,打造面向不同场景的AI解决方案,全方位助力AI产业发展。

  • 下一个爆款在哪儿?2025英特尔人工智能创新应用大赛获奖名单揭晓

    8月16日,2025英特尔人工智能创新应用大赛总决赛在深圳落幕。40支优秀团队从2817支队伍中脱颖而出,围绕工业、教育、心理健康、游戏等领域展开对决。大赛展示了AI从云端走向边缘的趋势,依托酷睿Ultra处理器和低代码开发工具,推动AI应用本地化落地。获奖作品包括动力电池机器人协作拆卸系统和AI生成PPT服务,体现AI与产业需求的深度融合。英特尔与联想、惠普等合作伙伴共同为开发者提供全栈支持,加速AI技术普及和商业化进程。

  • 金蝶征信召开高质量普惠研讨会:用“数据+场景”破解优质资产荒

    文章探讨了当前普惠金融背景下银行面临的新增贷款来源与优质客户识别难题。央行数据显示2025年上半年贷款余额增长但新增贷款首次负增长,凸显银行风控压力。金蝶征信通过发票数据等高质量信息补充传统银税互动,结合AI反欺诈技术识别虚假交易,帮助银行精准定位产业链中的优质小微客户。会议达成共识:高质量数据是基础,数据+场景是关键方法,高价值场景是突破口,推动普惠信贷从规模扩张转向质量提升。

  • AI与数据库双向赋能,达梦靠自主创新把握弯道超车机遇

    AI时代下,数据库行业正经历深刻变革。达梦数据副总经理李庄庄指出,AI与数据库双向赋能、深度融合,带来多模态数据处理、高并发低延迟等新需求。数据库需提升智能化自治能力,通过架构升级、AI技术集成及生态开放应对挑战。达梦通过AI4DB和DB4DB双路径布局,已在智能参数调优、多引擎数据库等领域取得进展。未来,数据库将更智能、普惠,技术硬实力与落地价值是关键竞争力。

  • 天翼云TeleDB通过信通院“可信数据库”安全专项测试

    中国信通院公布2025上半年“可信数据库”评估结果,天翼云TeleDB高可用关系型数据库通过安全专项测试,产品性能与安全能力达行业领先水平。TeleDB具备高性能、高可用、高可靠、高安全、易扩展、易管理等优势,已在政务、物联网、新能源、医疗等行业广泛应用,助力企业数字化转型。此次评测进一步验证了国产数据库的技术实力,推动我国数据库产业快速发展。

今日大家都在搜的词: