首页 > 传媒 > 关键词  > 数据治理最新资讯  > 正文

瓴羊数据Meet Up第三期:2025年,数据治理的金钥匙,藏在这些趋势与实践里

2025-01-20 14:53 · 稿源: 站长之家用户

数据、算法与算力,被称为人工智能的三驾马车。在数据体量爆发性增长的当下,精耕细作的数据治理,或将成为企业赶上大模型风口的制胜关键。

瓴羊「数据荟」数据Meet Up第三站线上活动成功举办。来自中国信息通信研究院、阿里云智能集团、雅戈尔集团的业务主管、技术专家及大数据负责人,围绕“大模型时代的数据治理创新实践”主题,深入分享了AI与数据治理的深度融合、数据平台建设的理想实践以及数据资产管理与运营的前沿见解。

大模型时代,数据治理四大趋势与三大堵点

中国信息通信研究院云计算与大数据研究所高档业务主管尹正指出,AI时代下的数据治理,将呈现出“全域数据治理”、“数据研发模式工程化、敏捷化”、“数据治理技术智能化”、“数据安全纵深化”四大趋势。

具体而言,全域数据治理将重点关注音视频、图片、文本等非结构化数据。在实践领域,中国移动、自动驾驶等企业已通过构建非结构化数据评价体系,关注合成数据技术,提升了数据集可信性,解决了“数据荒”难题。

在全域数据治理下,数据研发模式也随之发生变化,企业应打造面向AI与BI结合的数据工程“流水线”,以系统化方法提升效率、降低成本、保障质量、推动创新。同时,智能化数据治理将逐步取代传统劳动密集型模式,而AI驱动的数据安全技术与能力,将为解决数据安全关键问题、应对大模型安全挑战指明方向。

尽管趋势向好,但当前大模型发展仍面临质量、安全、伦理三大数据堵点,具体体现为:高质量数据集构建知易行难,安全与隐私泄露频发、数据伦理体系亟待完善。不过,面向AI的数据治理框架正在形成,人工智能数据治理的流程、方法、技术也在逐步完善。此外,依据DataOps理念构建面向人工智能的数据工程体系,为Al提供了敏捷有效、安全可信的数据供给,并进一步为企业人工智能长期平稳、良好、健康发展提供了保障。

以数据标准为抓手,让AI为数据治理提效

阿里云智能集团瓴羊高档技术专家周鑫指出,企业数据治理面临现状评估难、组织架构复杂、实施成本高、治理迭代难等多个难题,破解以上难题的较好方法,是找到核心抓手,降低数据治理的复杂度。

数据治理很重要的一个核心是数据标准的梳理与建设。通过瓴羊Dataphin,企业只需完成基础数据梳理,即可完成大部分数据治理工作。例如,在身份证数据治理中,企业仅需定义数据类型、分级标准及字段空值校验等规则,系统即可自动开展元数据监控,检验数据是否符合字符串类型、是否存在空值,安全权限是否合规。除元数据监控外,数据标准还能与数据质量、建模、研发相结合,使数据标准可以在数据全生命周期中得以不断流转。

周鑫提到,数据质量是AI成功的关键,据Gartner预测,到 2025 年,至少三分之二的生成式人工智能项目将因数据质量不足等问题在概念验证阶段被放弃。与此同时,AI同样是实现主动数据治理的重要工具,它可以让数据治理变得更加智能化和自动化,形成从数据发现、治理、评估与标准的完整闭环。

瓴羊Quick BI智能小D是AI+BI的标志性产品化成果,它承担着数据PD与数据架构师的角色,可以为用户业务问题提供直接的解决方案。以往,关键词搜索往往与实际业务问题相差千里,搜索“交易”得出的相似度匹配信息,并不能解决实际的业务问题。而利用智能小D,用户可直接提出“GMV提升20%,我能做什么?”或“哪些表适合用于客户分层?”等问题,无需自行拆解数据维度,即可获取直接的数据维度与策略指引。

除了数据发现与理解,瓴羊通过自动属性丰富功能,帮助企业一键生成目录、标签、描述等信息,将原本需要半小时完成的上架操作缩短至数十秒,效率提升百倍。此外,瓴羊的自动生成识别特征功能,让不会写、读不懂正则表达式的人也能轻松完成条件组合复杂的特征识别工作。迈过提效阶段后,Dataphin还将往更加自动化、智能化方向演进,探索自动生成质量规则、智能理解业务流程解决方案,让数据治理更加轻盈。

Dataphin的技术演进:打造开放兼容的数据建设与治理平台

阿里云智能集团瓴羊高档技术专家江岚指出,Dataphin在产品演进过程中,面临着“全域资产建设与治理”、“混合云架构”、“多引擎支持”和“资产消费”等挑战。为应对这些挑战,Dataphin成功探索出了一套优化数据建设与治理中台的技术实现路径。

在多引擎兼容方面,Dataphin通过多引擎SDK和插件的结合,充分融合了富客户端和轻客户端的优势,在接口层、插件层和依赖层构建了多引擎技术架构,实现了对多云环境的支持以及多种引擎的适配兼容。

在混合云架构方面,Dataphin基于Kubernetes集群部署了应用集群与默认调度集群,同时在IDC通过外部调度集群进行任务调度,广泛应用于数据集成、数据服务和资产采集等多个场景。

在资产消费场景中,Dataphin通过统一JDBC,实现了数据资产在权限管理、脱敏处理、审计等方面的统一管控。此外,Dataphin还与Quick BI进行了深度集成,大幅简化了用户的配置工作。目前,Dataphin已经在自助取数与分析、数据探查与分析、接口调用与应用等三种消费方式中得到了广泛应用,极大地提升了业务人员、数据分析师和开发人员的工作效率。

从数据资产建设到数据运营,雅戈尔的数据价值探索实践

雅戈尔集团大数据负责人竺显波表示,数字化建设有两个阶段,一个阶段是一切业务数据化、可视化,第二个阶段是一切数据业务化、价值化。数字化之所以经常被说成是“一把手工程”,正在于它要协同好公司的战略、业务、技术、治理与改革,是一个系统性的大工程。

雅戈尔的数据架构由以下三部分组成:数据源层、数据中台与数据应用。其中,数据中台和数据应用分别通过瓴羊Dataphin和Quick BI等数据产品,实现了工具与架构的全面升级,落地了多个数字化产品成果。例如,企业数据门户以销售、物流等类别划分,用户只需简单拖拉拽操作,即可快速生成所需报表;主题门户则根据品牌、大区管理人员、店长等特定身份进行分类,为不同用户准确聚合并有效查找所需数据提供了便利。

在数据中台建设方面,雅戈尔成功搭建了16个系统,整合了950多个数据表、400个指标和650个报表,提升了系统性能与架构效率。同时,雅戈尔实现了组织架构信息、商品信息、人员信息等核心数据的统一治理与贯通,消除了数据二义性。

在标准化治理的基础上,雅戈尔从数据组织、技术架构和流程管理三个层面全面优化,推动数据价值的深度挖掘与应用。以“平效”为例,数据团队基于“面积在 300 至 1 万平方米之间,面积越大,平效越高”的数据规律,验证了公司“开大店、关小店”战略的科学性和可行性,为企业决策提供了数据支撑。

随着AI与数据治理深度融合,更多行业将迎来数字化转型的新机遇。瓴羊将持续以数据标准为核心,打造开放兼容的数据建设与治理平台,推动企业开启更加有效、安全的数据治理新时代。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

    科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲,强调高质量数据集是人工智能产业决胜关键。他指出,算力、算法和数据构成AI三大要素,而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施,通过集中管理、分散赋能模式,打通数据采集、治理到AI训练全链路,推动产业智能化升级。该平台已在制造、金融等领域落地,助力企业释放数据要素价值,实现弯道超车。

  • 厚植AI创新沃土!麒麟信安打造人工智能孵化器,赋能创业梦想

    10月28日,麒麟信安人工智能孵化器在长沙启动,旨在汇聚AI领域人才、技术与资本,构建开放协同的创新生态。该项目获湖南省多部门支持,已吸引60余个项目入围,组建了首批30余位专家导师团,并与多家顶尖机构共建联合体,通过政策扶持、资本对接等多维度赋能,培育优质AI项目在湘落地发展,助力区域打造人工智能产业创新高地。

  • 人工智能巨头OpenAI拟上市 估值或高达1万亿美元

    OpenAI正积极推进上市计划,据知情人士透露,该公司可能最早于2026年下半年向证券监管机构提交上市申请,目标在2027年正式上市。 此次IPO的估值有望达到约1万亿美元,或将跻身全球规模最大的IPO之列。 在初步讨论中,OpenAI曾考虑通过上市筹集至少600亿美元资金,实际融资规模可能进一步扩大。

  • 连续三年折桂!瓴羊Dataphin荣膺2025年度DAMA数据治理优秀产品奖!

    2025全球数据管理峰会以“数据×人工智能”为主题,聚焦行业最佳实践,构建从理念探讨到技术落地的完整交流链。会上,瓴羊与DAMA联合发布数据治理实践证书体系,覆盖数据分析等认证,旨在提升全民数据素养。瓴羊副总裁王赛提出Data与AI双向赋能重构企业数字化生产力,强调未来系统需支持自主决策与自动化执行。以快消品牌为例,通过Quick BI智能分析工具实现业务效率提升。瓴羊Dataphin平台助力企业构建AI友好型数据模型,连续三年获“数据治理优秀产品”大奖,提供全链路数据服务,加速释放数据价值。

  • 行业首个!海尔冰箱获ISO/IEC 42001人工智能管理体系认证

    2025年10月,海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业,标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程,确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品,推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术,为用户提供更安全、智能的健康饮食体验。

  • 共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

    10月28日,AtomGit平台在北京国家会议中心举行升级发布会,正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞,强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源,打造开放中立的基础设施,计划于11月21日正式上线。华为、百度等企业代表分享了开源实践,多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

  • GEO品牌监控平台横评:哪家工具的数据最准?

    本文测试多款GEO监控工具,发现同一关键词在不同工具中曝光率差异高达40%,直接影响AI推荐排名。通过对比测试,国际工具覆盖ChatGPT等平台但缺失国产AI,国内工具AIBase专注豆包、DeepSeek等平台,准确率达90%且提供竞品对比、场景还原等深度分析。建议国内企业首选AIBase,全球化业务可组合使用国际工具,并强调工具核心价值在于通过数据持续优化内容策略。

  • 智能问数:让数据 “开口”,让 BI 价值 “焕新”

    在数字经济时代,传统BI模式因技术壁垒使数据价值难以释放。智能问数通过自然语言交互,让非技术人员直接对话数据,快速获取洞察,实现从“为报表而生”到“为决策赋能”的转变。其核心架构融合智能问数、数据洞见与动态分析,支持多轮对话优化可视化呈现,并引入数据洞见能力,助力企业看清过去、把握现在、预判未来,重塑数据驱动增长的新范式。

  • 卖家精灵加入中国人工智能产业发展联盟(AIIA),加速AI赋能跨境电商

    卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力,近日正式加入中国人工智能产业发展联盟(AIIA),成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可,未来将携手联盟推动AI技术研发与产业化,助力中国品牌全球化。依托八年积累的海量电商数据与算法体系,卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案,服务超百万跨境卖家,显著提升运营效率与决策精准度。

  • 云数据安全态势感知全新上线,筑牢内外网数据安全防线

    本文系统分析了云上数据安全的核心问题与解决方案。主要挑战包括:数据资产分散难管理、访问溯源成本高、风险定位困难、权限滞留易泄露。解决路径需构建统一安全运营视图,通过资产自动发现、AI敏感数据识别、访问关系可视化实现全面监测,结合多维动态分析提供精准管控建议。最终达成“看得见、管得住、防得准”的安全目标,并满足合规审计要求。

今日大家都在搜的词: