首页 > 传媒 > 关键词  > 新致云最新资讯  > 正文

新致云:如何实现大数据BI技术与传统BI领域的大融合

2016-08-04 17:19 · 稿源: 站长之家用户

大家好,我是来自新致金融云大数据团队MATRIX的架构师:汪勇。在互联网高速发展的今天,大数据技术越来越频繁地被应用于我们的日常开发中。而大数据BI对于跨系统、非结构化的数据处理能力以及处理量级也使其逐渐走进了软件开发商的视野。伴随BI的发展,BI的应用范围越来越广,而大数据BI恰恰可以实现一些传统的BI工具实现不了的数据结果分析,可这是否就意味着大数据BI的出现会就此将传统BI逼入绝境呢?其实不然,传统BI在中小型数据的处理领域中依然占据着无可替代的地位,但是我们是否可以将大数据BI技术中的一些思考运用到传统BI技术开发中呢?

接下来,我将简单介绍新致金融云运用大数据技术帮助一家大型上市保险集团公司解决传统BI技术瓶颈从而提升客户体验度的实际案例。

客户场景

在客户实施的数据类项目中,用户经常向我部反馈系统查询速度慢,而这种现象主要集中在运营监管、数据分析等数据集中项目中。这具体是怎么回事呢?通过对相关项目的调研,我们了解到该系统:

1、已有数据存量接近或超过1亿

2、若干常用的查询条件字段增加了索引

3、按分公司分区,限制用户不能跨分公司查询

4、查询规则相对复杂,包括多项选择、模糊匹配、表达式匹配等。

5、单次查询的速度就在20秒左右,多用户情况下系统响应速度更慢。

需求分析

因该系统的用户查询范围大,且具有不确定性,故将其定义为数据探查场景。

在数据探查场景中,最终用户的一个想法需要快速通过业务数据进行验证,其特点是查询方式灵活、数据范围大、周期短甚至是一次性的。

需求听起来不复杂,但与海量数据一结合,技术实现就变得非常不简单。常用的索引、分区分表等设计期优化方案,经过实践证明都无法起到太好的效果,不是跟不上运行期用户灵活要求,就是极大制约了用户的查询行为。而人工提数则存在理解偏差、工作量大、成本高等问题。

那么是否存在最佳解决方案?答案是肯定的。新致金融云结合其20余年丰富的行业经验与多年大数据技术积累,积极思考如何将大数据技术融入到实际业务场景中,以此得出结论,大数据探查场景会是一个好的切入点。

系统目标

1、数据探查由最终用户自行操作,减少中间环节;支持日访问量1万用户。

2、提供基于全库数据量,支持亿级数据规模。

3、提供灵活、快速的查询功能,响应时间控制在3秒以内。

4、能够通过硬件水平扩展,有效应对数据规模的持续扩容。

5、能与已有应用系统无缝整合,无需做大改造。

技术分析

1、物理层

选择支持高可用、分区容错性强的分布式存储系统。在大数据领域不得不提到hadoop hdfs,也包括基于hadoop或仿效hadoop原理的存储产品。在企业内部定制实施大数据平台,服务器数量不可能动则成千上万,因此我们需要在有限的资源条件下,最大化提升硬件利用率。

2、逻辑层

逻辑层是性能优化的关键。早期的大数据技术,通过强大的硬件性能暴力扫描数据的做法,适合大量日志、平面文件处理的简单场景。而当面对复杂数据访问过程,且在资源有限条件下,优化逻辑存储结构及算法支撑便显得尤为重要。

反向索引技术,是先从源数据中提取关键字字典,每个关键字对应一组数据行号列表。

结合有限状态机压缩算法,进一步减小查询时内存使用量。

使用跳跃表技术,同时扫描多个字段索引,加快组合查询速度。

从物理层加载某几列数据时,列式存储是顺序读取、行式存储是随机读取,列式存储明显具有速度优势。

3、用户层

大数据查询平台采用独立部署模式,对外提供json数据接口。任何web架构的应用系统均可无缝接入大数据查询平台 。

实施过程回顾

我们自今年五月份开始在相关项目中采用大数据技术解决数据探查问题。经过多次POC实践论证,及项目团队反复讨论与修改,在六月底正式部署生产环境,并于七月中旬通过客户测试进行试运行。

大数据探查系统经过loadrunner压力测试,在100并发用户的压力下,平均响应时间不超过1秒,比原来的查询速度提高几十倍以上。相对硬件设备投入,只有4台普通IBM服务器,每台配置8核cpu.32G内存500G硬盘。投入产出比预期高很多,获得甲方充分肯定。

由上述实践案例可见,虽然大数据BI与传统BI在不同量级的数据处理环节中各展所长,但是两者的数据处理技术依然具有相互借鉴的价值。目前新致金融云主要将大数据BI技术集中应用于该系统的返回清单数据支持功能,在后续我们还将根据客户要求进一步整合系统多维度聚合功能,届时,新致云将继续与大家分享大数据BI技术在传统BI领域中的应用与融合。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 卖家精灵火热亮相亚马逊华中卖家大会,以AI+大数据驱动华中卖家出海增效

    8月21日,2025亚马逊全球开店华中区域卖家大会在武汉成功举办,主题为“聚华中+通全球”。大会吸引了千余名企业代表参会,现场展示了多款基于生成式AI的跨境电商运营解决方案。亚马逊高管表示,AI正从根本上改变运营方式,助力卖家高效选品、创新产品和制定营销策略。卖家精灵作为服务商,携AI创新成果亮相,吸引超200位用户咨询,部分卖家当场下单。大会现场咨询火爆,展示了AI市场洞察、评论分析、竞品分析及Listing撰写等四大实用功能,帮助卖家实现精准选品和高效运营。未来,卖家精灵将继续以技术创新驱动,助力中国卖家在全球市场赢得竞争优势。

  • 数据库就要选华为云!

    文章讲述了作者10年前创业失败的经历,反思当时过度投入高端服务器和技术架构,却忽视了业务实际需求。如今随着云计算、大数据等技术发展,数据库架构设计更强调弹性、可靠性和智能化。游戏行业作为典型高并发场景,对数据库提出实时响应、高可用等严苛要求。华为云TaurusDB作为新一代云原生数据库,具备高性能(QPS达百万级)、弹性扩展(1写15读节点)、高可靠性(跨区部署、RPO为0)等优势,完美适配游戏行业需求。其核心技术包括计算存储分离、并行执行和NDP近数据处理,解决了传统MySQL架构的复制延迟等问题。文章建议企业选择与业务协同成长的数据库平台,而非从零搭建架构。

  • 极速、可靠、灵活|移动云以云硬盘为前沿技术落地提供有力支撑

    2025年4月,第十八届中国电子信息年会在成都成功召开。移动云举办“AI时代先进存力:构建新型数据存储前沿基础设施”论坛,聚焦AI大模型应用下数据存储、处理及算法框架的高要求。论坛探讨了存储技术、架构和安全创新,旨在推动存储技术发展,构建先进可靠的存力基石。移动云推出极速型云硬盘等产品,满足高IOPS、低延迟需求,并全面接入国产大模型DeepSeek,降低技术门槛,助力用户实现智能化升级。通过完善产品矩阵,满足多元业务场景需求,为千行百业数字化转型提供高质量存储保障。

  • 主数据是什么?2025年如何选择主数据平台?

    文章探讨了主数据管理在企业数字化转型中的核心作用。普元信息作为国内主数据管理领域的领先企业,通过其主数据平台帮助企业解决数据不一致、系统割裂等问题。文章详细分析了主数据平台应具备的六大核心能力:灵活建模、数据质量管理、资产化闭环、共享服务、AI支持及合规安全,并提供了8步落地方案。普元凭借在央企和行业龙头企业的成功案例,验证了其解决方案在大规模复杂场景下的实施深度与可靠性。文章最后提出10个选型评估要点,强调主数据平台是企业长期治理能力的体现而非一次性技术投入。

  • 领星ERP:筑牢数据安全防线,契合数据合规标准,为跨境企业发展保驾护航!

    在数字化浪潮下,跨境企业运营愈发依赖数据支撑。数据安全与合规对跨境企业至关重要,尤其对计划上市的企业,数据泄露或违规操作可能面临高额罚款、损害声誉,影响上市进程。领星ERP作为跨境电商ERP市场领先的管理系统,构建了九大安全防护体系,从物理环境、网络硬件到数据管理、权限控制等多维度保障数据安全。同时,其业财一体化方案确保业务与财务数据无缝集成,符合不同国家财税法规,助力企业实现数据合规,为稳健发展提供坚实支撑。

  • 金蝶征信召开高质量普惠研讨会:用“数据+场景”破解优质资产荒

    文章探讨了当前普惠金融背景下银行面临的新增贷款来源与优质客户识别难题。央行数据显示2025年上半年贷款余额增长但新增贷款首次负增长,凸显银行风控压力。金蝶征信通过发票数据等高质量信息补充传统银税互动,结合AI反欺诈技术识别虚假交易,帮助银行精准定位产业链中的优质小微客户。会议达成共识:高质量数据是基础,数据+场景是关键方法,高价值场景是突破口,推动普惠信贷从规模扩张转向质量提升。

  • 每日互动亮相2025可信数据空间推进大会

    8月21日,2025可信数据空间推进大会在京召开。每日互动首席数据官吕繁荣出席并发表演讲,系统阐释公司在可信数据空间领域的创新实践。其“发数站”平台入选标杆案例,通过“可信数据空间+可控大模型”技术组合,连接数据使用方、提供方和服务方,推动数据要素安全高效流通。目前该平台已在医疗、交通等30多个城市落地,助力数据价值释放与产业智能化升级。

  • 国内领先!移动云大云天元操作系统通过安全操作系统四级认证

    移动云自主研发的大云天元操作系统近日通过公安部网络安全专用产品安全检测,获得安全操作系统第四级认证。该系统凭借扎实的产品安全能力和完善的安全管理体系,成为国内首个通过该级别认证的国产操作系统。这一成果体现了其在安全领域的技术积累与行业地位,为保障客户数据安全和业务稳定运行提供可靠支撑,标志着国产操作系统安全能力达到国内领先水平。

  • 金仓数据库守护中国铁路安全运行

    中国铁路集团开展"守底线、补缺陷、除隐患、防风险"安全专项行动,建设多功能线路巡防平台,采用金仓数据库技术实现云边端协同工作。该平台具有实时监控、智能分析等功能,2025年4月将在全国18个铁路局全面上线运行。系统采用读写分离高可用集群架构,支持自动容灾切换和负载均衡,确保铁路运输安全畅通。平台通过自主研发的加密技术保障数据安全,性能损�

  • 50+案例见证!格创东智SPC让工序发声,用数据决策,筑牢半导体品质根基

    格创东智SPC系统通过实时数据采集与统计分析,实现半导体制造全流程质量监控。该系统覆盖数据接入、异常预警、闭环处理及持续优化,已助力50余家企业提升良率、降低成本。核心优势包括全链路数据覆盖、智能预警机制、多维分析工具及高效可视化操作,推动企业从经验决策转向数据驱动,迈向零缺陷制造目标。

今日大家都在搜的词: