首页 > 传媒 > 关键词  > 混合云最新资讯  > 正文

开放、兼容的数据建设与治理平台——瓴羊Dataphin“进化论”

2025-01-20 14:52 · 稿源: 站长之家用户

作者:江岚  阿里云瓴羊智能科技高档技术专家

随着十四五“数字中国”规划的不断深入,我国企业对数据治理和数据资产建设的广阔需求依然亟待激活。不过,由于数据分析领域长期处于高速发展阶段,加上国内参差不齐的供给现状,“看不懂”、“跟不上”、“学不会”、“用不起”仍是大多数企业的真实感受。

从ELT、Data Fabric、Semantic Layer、DataOps,再到Lakehouse和流批一体,近几年,全球数据分析领域的“热词”层出不穷、令人目不暇接。行业发展脉络存在共性,细究其中,可以提炼出三大主题:统一的基础设施、统一的中间层、统一的数据资产。

瓴羊「数据荟」数据Meet Up 第 3 站线上开讲,来自中国信通院、瓴羊与企业大数据团队的多位技术专家齐聚一堂,共话大模型时代的数据治理创新实践。阿里云智能集团瓴羊高档技术专家江岚以Dataphin为例,从多引擎兼容、混合云架构、统一资产消费的应对策略,分享了“开放、兼容的数据建设与治理平台”的技术架构与实践路径。

作为阿里巴巴全资子公司瓴羊的代表产品,Dataphin长期专注于数据治理环节,通过运用阿里巴巴“OneData”方法论,持续打造统一的数据基建、高质量的数据资产。近日,瓴羊Dataphin宣布全新功能升级,推出Dataphin敏捷版、半托管及DataAgent智能体,以更普惠、可扩展性和开放性的架构更新,为广大企业“建好数据”、“用好数据”打好基础。分析人士认为,瓴羊Dataphin的本轮升级,是其一次意义重大的变化,反映了能力架构、底层技术的全面演进。

从混合云架构到安全管控,企业数据治理面临哪些挑战?

瓴羊,脱胎于阿里巴巴这座“比较优秀工厂”的数字化实践,旨在将内部经验系统化、产品化地向千行百业进行输出。作为瓴羊旗下的智能数据建设与治理工具,Dataphin能够提供一站式的采、建、管、用的大数据能力,涵盖企业数据资产的建设、治理、消费等不同环节。自 2018 年上线以来,瓴羊Dataphin已服务了百余家客户,覆盖了餐饮、通信、乳品、汽车等多个行业。

以往,用户在使用Dataphin时,首要任务是配置集成管道,将业务库数据同步至数据库,并通过代码研发、规范建模等多种方式对数据进行加工处理。加工后的数据或通过集成管道任务回流至用户生产库,或通过配置数据服务API供下游系统使用。

在服务合作伙伴的过程中,瓴羊Dataphin发现,由于部署环境、引擎类型、治理目标等方面的差异,企业数据治理的需求变得越发精细和复杂,给平台既有的功能提出了诸多挑战。

一方面,许多企业迫切需要打通整个数据生产消费链路,不只限于传统的数据仓库环节,而是实现全域的数据资产治理。另一方面,不少企业的数据资产不再处于单一云环境,而是既涉及公共云、也涉及线下IDC机房,因而需要支持混合云架构的数据治理工具。同时,不少企业开展信创工作,众多国产化的引擎确实给兼容适配带来了不小的挑战。

因此,本轮产品升级的背后,是瓴羊Dataphin围绕数据治理的一线场景需求,通过持续的研发投入和自我迭代,实现了“多引擎适配”、“混合云统一调度”、“统一消费出口”三个层面的全新升级,从而与诸多企业伙伴共同进步,更好顺应“统一基建”、“全域治理”的行业发展趋势。

从多引擎兼容到统一资产消费,Dataphin的成果与经验

企业所使用的引擎各不相同,如果没有一个设计良好的多引擎中间件,就有可能带来重复的引擎对接成本,乃至潜在的类冲突和处理逻辑不一致的风险。如何适配数据库产业生态现存的众多引擎,是摆在瓴羊Dataphin面前的首先项难题。

目前,多引擎适配模式存在富客户端、轻客户端两种模式。富客户端直接对接引擎,网络开销少,且无单点瓶颈的风险;轻客户端压力小,无类冲突风险,且服务端可实现统一版本管理。

瓴羊Dataphin结合富/轻客户端两者优势,通过“多引擎SDK+插件”的模式,提炼出了SQL、File、Schema三大API接口,每种插件相互独立的同时,还增设了类隔离的机制,确保多引擎的处理逻辑对业务代码没有侵入,最终通过JAR包的合并,有效减少了部署资源。截至目前,瓴羊Dataphin不仅支持公共云多租户、独立部署、私有云部署等环境,还实现了对MaxCompute、EMR、CDH等十余种主流大数据计算引擎的适配,通过插件化模式,也降低了后续新引擎的兼容成本。

混合云架构方面的挑战则更加复杂:有的企业出于信息安全性考虑,部分业务只能存于线下IDC机房,同时拥有公共云和私有云环境,导致管理和运维的难度大大增加。

为此,瓴羊Dataphin采用了外部调度集群技术可以同时管理多个Kubernetes集群的资源,由调度模块负责在指定的集群上拉取任务配置并调起任务。这一设计使得平台能够有效地在混合云环境中调度和执行数据任务,有效避免跨网络的访问限制,并大大提升集成性能。

具体而言,在数据集成场景,瓴羊Dataphin实现了一套集群对多个云环境的调度,仅任务调度需要跨网络,而数据本身无需经过专线网络传输,降低了跨网络传输的成本和复杂性。而在资产采集场景,平台通过配置元数据采集任务,手动或周期性地运行采集任务,将采集到的资产元数据写入存储,以供后续的数据消费链路使用。此外,瓴羊Dataphin通过于外部集群中拉起的数据服务常驻容器,确保了数据服务场景的灵活性、安全性和隐私性。

在数据资产消费时,企业常常面临着资产分散、权限管理不一致、使用链路长等问题。为了实现统一的资产消费,瓴羊Dataphin提供了标准的JDBC接口,通过多引擎插件对接底层数据库,打造了仅有的消费出口,实现了对底层数据的统一访问。

更值得注意的是,Dataphin还实现了瓴羊旗下BI工具——Quick BI的无缝对接,资产消费可以自动创建Quick BI的数据源以及数据集,并且减少用户查看数据的操作成本。

目前,Dataphin提供了丰富的资产消费方式,不论是自助取数、数据探查还是接口调用,企业无需复杂处理链路,即可轻松实现数据分析和可视化展示。

从全域资产运营到AI+,数据资产运营将去向何方?

在企业数字化浪潮中,有越来越多企业通过瓴羊Dataphin,实现了数据资产的采、建、管、用,在数据洞察力提升的同时,也挖掘出了隐藏在资产之中的价值。

相较以前,如今的瓴羊Dataphin功能架构得到了多重升级,不仅引擎兼容性增强,支持多种类型的数据源,还丰富了资产消费的形式,此外,瓴羊Dataphin还新增支持了混合云的部署模式和公共云半托管模式,能让企业以最小的成本实现复杂网络环境下的部署,由此,平台的覆盖范围不再局限于数据仓库,而是朝着实现全域资产运营的目标迈进。

在未来,瓴羊Dataphin将持续深化采、建、管、用的一体化平台定位,沿着数据资产建设-治理-消费的路径不断完善。在建设方面,平台将对接更多种类的引擎、支持更大规模的统一调度和运维,还将上线拖拽式标签工厂等;在治理方面,平台将打造统一的元数据中心,让企业的数据资产“标准可循、质量可靠、安全可控、成本经济”;在消费方面,瓴羊Dataphin已经推出资产目录管理、资产搜索及查看等运营功能,未来还将上线资产门户、质量报告等。

随着大模型时代到来,瓴羊Dataphin也将积极拥抱AI技术,探索“数智结合”的资产运营手段。比如,在智能问数的帮助下,用户无需技术背景即可问询需要的数据,极大地降低了数据分析的门槛;通过智能特征识别、智能分类分级等手段,提高资产质量和生产效率。

在产业、政策、技术等多种因素的影响下,我国的数据治理领域仍然方兴未艾,如何在高速变化的外部环境下,为不同企业提供个性、易用、专业、安全的治理体验,仍然是横亘在产业各方面前的重要课题。未来,依托阿里巴巴数字化转型经验,瓴羊Dataphin有望以持续的迭代和演进,为企业打造全生命周期的数据资产解决方案,帮助千行百业“建好数据”、“用好数据”。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 腾讯云马文霜:Cloud Mate:助力企业高效管云、用云,让云上业务坚如磐石

    9月17日,腾讯云在2025全球数字生态大会上宣布智算全面升级,推出面向Agent的AI基础设施解决方案。腾讯云副总裁李力强调“同源同构”为核心原则,通过统一技术架构支撑自研业务与外部客户,实现产品标准化与全球化服务一致性。升级方案包括Agent Runtime云沙箱、Cloud Mate智能运维体及全链路安全能力,旨在提升模型推理效率、工具集成灵活性和系统稳定性,助力企业降低AI应用门槛。李力指出,未来两年AI+Agent部署将大幅增长,腾讯云已服务国内90%的大模型厂商,并为多行业提供高效智算支持。

  • 上云好时机!华为云Flexus OBS化繁为简解锁存储管理新体验

    在AI热潮与企业数字化转型加速的背景下,华为云Flexus对象存储(OBS)凭借高效、稳定、安全、低成本的优势,成为企业构建海量非结构化数据存储体系的关键。它支持弹性扩展与按需付费,避免资源浪费,并通过多副本、纠删码等机制保障数据持久性。Flexus OBS还具备高并发处理能力,适配AI训练、音视频平台等场景,与华为云其他服务深度协同,实现“即存即用”。目前,华为云828 B2B企业节正推出优惠活动,助力企业降本增效。

  • 2025 云栖大会|云通信+AI:释放通信新动能

    2025年9月25日,阿里云成功举办“云栖大会云通信分论坛”,聚焦大模型在云通信中的创新应用与全球化实践。论坛汇聚Meta、雨果跨境等生态伙伴,探讨行业趋势,剖析技术机遇与挑战。阿里云发布Chat App AI助理和智能联络中心2.0,展示智能化探索成果,强调合规化与智能化并重,推动通信服务从基础功能向个性化、自动化升级。通过AI与消息引擎结合,助力企业打通公域到私域的全链路增长,实现高效全球化运营与本地化深耕。

  • 腾讯云李力:坚持同源同构,为企业打造更贴近Agent的AI原生云

    9月17日,腾讯云在2025全球数字生态大会上宣布智算全面升级,推出“更贴近Agent的AI+Infra”解决方案,包括Agent+Runtime、云专家服务智能体Cloud Mate及全链路安全能力。腾讯云副总裁李力强调,“同源同构”是核心原则,确保产品服务一致性与全球化布局。方案旨在提升模型推理效率、工具集成灵活性和系统稳定性,助力AI从实验室走向生产级应用。腾讯云通过硬件多元支持、软件加速优化及智能运维服务,降低企业技术门槛,已服务国内90%大模型厂商及千行百业。

  • 腾讯云:扎根产业,出海破圈

    与产业共生共长,一直是腾讯云的愿景。 2025年9月16日,腾讯全球数字生态大会在深圳如期举行,其间腾讯云展现了多项新产品的进展和能力升级,并全面开放AI能力。 这意味着,腾讯云的产数融合又进了一步。 当下,腾讯云正在与千行百业深度融合,助力企业拥抱“智能化”与“全球化”,进而推动产业可持续高质量增长。 毋庸置疑,腾讯云“智向远大”。

  • 健合合生元公益十八载倾听“心”声,守护母婴健康传递爱与希望

    自2007年起,健合集团旗下合生元品牌联合中国红十字基金会成立母婴救助基金,长期为困境家庭提供先心病筛查、医疗救助及营养支持等公益服务。18年来,基金足迹遍及全国多地,累计投入超7800万元,成功救助超千名重症母婴及儿童。文章以新疆先心病患儿小晶为例,展现基金通过跨省义诊、专项救助等行动,帮助她重获健康,并点燃家庭希望。基金以实际行动践行企业社会责任,持续为“健康中国2030”注入温暖力量。

  • 腾讯云联合IDC发布AI Infra报告:定义Gen Al时代智算新范式

    2025年腾讯全球数字生态大会于9月16-17日在深圳召开。在Infra+Agent专场,腾讯云与IDC联合发布《AI+Infra:加速智能体落地的基础架构、发展趋势与产业实践》报告。报告指出,随着AI应用规模化落地,AI云基础设施正向核心智算设施演进,涵盖分布式底座、异构硬件、高性能软件和场景化方案四大维度。报告还提出六大演进趋势:架构重构、行业垂直化、算力智能化、安全能力提升、研发范式创新和服务化转型,并解析了腾讯云在交通、制造、医疗等领域的落地案例,为企业智能化转型提供实践指南。

  • 省下千万营销费,腾讯云天御破局快消黑产困局

    2025年AI浪潮下,快消行业面临个性化需求、智能供应链等新挑战,同时黑产威胁日益专业化、规模化。腾讯云天御风控系统通过大数据与AI技术构建智能风控体系,覆盖风险感知、评估与处置全链路,有效识别虚假手机号、代理IP等欺诈行为。该系统以轻量级SaaS服务接入,提供实时风险评估与动态防护,已在电商、视频、快消等行业落地,帮助客户显著降低营销成本、提升转化率。天御协同自研图灵盾等生态能力,推动风控从被动防御向主动感知演进,为行业构建安全可信的数字环境。

  • 淘宝闪购入局到店团购,场景融合里藏着行业新活力

    当“淘宝闪购,团购来了”的字样在街头亮起,本地生活赛道又迎来新故事。 9月20日,淘宝闪购启动到店团购业务,首批覆盖上海、深圳、嘉兴三个城市的核心商业区域。团购入口不仅包括淘宝闪购,还有支付宝和高德,阿里体系内最能打的三大流量入口同时开动,显示出这一业务的重要性。 这并不是一次偶然的尝试。回顾淘宝闪购的发展,今年4月30日,“小时达”正式升�

  • AI落地难?阿里云AI先锋新成员实战证明,对症的场景化方案才是关键

    本文探讨AI技术如何通过精准定位与协同合作破解行业难题。文章指出,AI渗透速度远超传统技术,IDC预测2025年全球AI支出将达3370亿美元。以阿里云为例,其通过算力底座与通用技术链接垂直领域伙伴,提供"技术+场景"一体化方案。文中列举挖地兔、集思科技等6家企业案例,展示AI在量化投资、电商直播等场景的实际应用,强调AI落地需找准对应场景,而阿里云的技术支撑与生态协同正推动千行百业实现数字化转型。

今日大家都在搜的词: