首页 > 传媒 > 关键词  > 新致云最新资讯  > 正文

新致云:如何实现大数据BI技术与传统BI领域的大融合

2016-08-04 17:19 · 稿源: 站长之家用户

大家好,我是来自新致金融云大数据团队MATRIX的架构师:汪勇。在互联网高速发展的今天,大数据技术越来越频繁地被应用于我们的日常开发中。而大数据BI对于跨系统、非结构化的数据处理能力以及处理量级也使其逐渐走进了软件开发商的视野。伴随BI的发展,BI的应用范围越来越广,而大数据BI恰恰可以实现一些传统的BI工具实现不了的数据结果分析,可这是否就意味着大数据BI的出现会就此将传统BI逼入绝境呢?其实不然,传统BI在中小型数据的处理领域中依然占据着无可替代的地位,但是我们是否可以将大数据BI技术中的一些思考运用到传统BI技术开发中呢?

接下来,我将简单介绍新致金融云运用大数据技术帮助一家大型上市保险集团公司解决传统BI技术瓶颈从而提升客户体验度的实际案例。

客户场景

在客户实施的数据类项目中,用户经常向我部反馈系统查询速度慢,而这种现象主要集中在运营监管、数据分析等数据集中项目中。这具体是怎么回事呢?通过对相关项目的调研,我们了解到该系统:

1、已有数据存量接近或超过1亿

2、若干常用的查询条件字段增加了索引

3、按分公司分区,限制用户不能跨分公司查询

4、查询规则相对复杂,包括多项选择、模糊匹配、表达式匹配等。

5、单次查询的速度就在20秒左右,多用户情况下系统响应速度更慢。

需求分析

因该系统的用户查询范围大,且具有不确定性,故将其定义为数据探查场景。

在数据探查场景中,最终用户的一个想法需要快速通过业务数据进行验证,其特点是查询方式灵活、数据范围大、周期短甚至是一次性的。

需求听起来不复杂,但与海量数据一结合,技术实现就变得非常不简单。常用的索引、分区分表等设计期优化方案,经过实践证明都无法起到太好的效果,不是跟不上运行期用户灵活要求,就是极大制约了用户的查询行为。而人工提数则存在理解偏差、工作量大、成本高等问题。

那么是否存在最佳解决方案?答案是肯定的。新致金融云结合其20余年丰富的行业经验与多年大数据技术积累,积极思考如何将大数据技术融入到实际业务场景中,以此得出结论,大数据探查场景会是一个好的切入点。

系统目标

1、数据探查由最终用户自行操作,减少中间环节;支持日访问量1万用户。

2、提供基于全库数据量,支持亿级数据规模。

3、提供灵活、快速的查询功能,响应时间控制在3秒以内。

4、能够通过硬件水平扩展,有效应对数据规模的持续扩容。

5、能与已有应用系统无缝整合,无需做大改造。

技术分析

1、物理层

选择支持高可用、分区容错性强的分布式存储系统。在大数据领域不得不提到hadoop hdfs,也包括基于hadoop或仿效hadoop原理的存储产品。在企业内部定制实施大数据平台,服务器数量不可能动则成千上万,因此我们需要在有限的资源条件下,最大化提升硬件利用率。

2、逻辑层

逻辑层是性能优化的关键。早期的大数据技术,通过强大的硬件性能暴力扫描数据的做法,适合大量日志、平面文件处理的简单场景。而当面对复杂数据访问过程,且在资源有限条件下,优化逻辑存储结构及算法支撑便显得尤为重要。

反向索引技术,是先从源数据中提取关键字字典,每个关键字对应一组数据行号列表。

结合有限状态机压缩算法,进一步减小查询时内存使用量。

使用跳跃表技术,同时扫描多个字段索引,加快组合查询速度。

从物理层加载某几列数据时,列式存储是顺序读取、行式存储是随机读取,列式存储明显具有速度优势。

3、用户层

大数据查询平台采用独立部署模式,对外提供json数据接口。任何web架构的应用系统均可无缝接入大数据查询平台 。

实施过程回顾

我们自今年五月份开始在相关项目中采用大数据技术解决数据探查问题。经过多次POC实践论证,及项目团队反复讨论与修改,在六月底正式部署生产环境,并于七月中旬通过客户测试进行试运行。

大数据探查系统经过loadrunner压力测试,在100并发用户的压力下,平均响应时间不超过1秒,比原来的查询速度提高几十倍以上。相对硬件设备投入,只有4台普通IBM服务器,每台配置8核cpu.32G内存500G硬盘。投入产出比预期高很多,获得甲方充分肯定。

由上述实践案例可见,虽然大数据BI与传统BI在不同量级的数据处理环节中各展所长,但是两者的数据处理技术依然具有相互借鉴的价值。目前新致金融云主要将大数据BI技术集中应用于该系统的返回清单数据支持功能,在后续我们还将根据客户要求进一步整合系统多维度聚合功能,届时,新致云将继续与大家分享大数据BI技术在传统BI领域中的应用与融合。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • Gartner评选全球22家数据湖仓平台,腾讯云为中国唯一入选厂商

    国际研究机构Gartner发布《湖仓一体平台市场指南》,腾讯云凭借自研云原生Serverless湖仓引擎DLC入选全球22家代表厂商,成为唯一入选的中国企业。报告指出,湖仓架构正成为企业数据平台新标准,融合数据湖灵活性与数据仓库高效管理。腾讯云DLC已助力超100家客户完成架构转型,覆盖互联网、教育、零售等行业,显著提升数据处理效率并降低成本。

  • 软博会双奖加冕!太极华青打造政务数据共享新标杆

    10月15日至17日,中国国际软件博览会在郑州举办,聚焦“开源构筑新生态+软件智造新未来”。太极华青公司开发的普通省道和农村公路“以奖代补”考核数据支撑系统入选优秀创新软件推广名录,其母公司兴财科技凭借政务人工智能大模型应用荣膺软件与信息技术服务名牌企业。文章强调政务数据共享在提升政府治理效能中的关键作用,并指出《政务数据共享条例》实施将进一步夯实法治基础,推动跨部门、跨层级数据整合,强化资金绩效全流程管理。

  • AI时代品牌营销致胜秘诀:用数据驱动GEO优化,让AI排名持续在线

    当DeepSeek、豆包、文心一言等AI助手成为10亿用户的信息入口,品牌面临生死抉择:要么出现在AI推荐中,要么彻底消失。文章指出,AI营销与传统SEO完全不同,是一场没有终点的动态竞赛,需要持续投入和调整。品牌需建立“监测-分析-优化”闭环机制,使用专业工具实时监控排名波动,快速响应算法迭代和用户提问变化。成功关键在于让AI“看见”并“信任”品牌,通过补充权威数据、多媒体内容、长尾语义覆盖等方式提升可信度,在流量红利期抢占先机。

  • 腾讯云大数据TBDS重磅升级,助力金融行业构建Data+AI一体化数智新范式

    腾讯云在腾讯全球数字生态大会上宣布,其大数据平台TBDS面向AI时代完成重磅升级。此次升级聚焦“数据与AI一体化”,旨在为金融机构提供兼具数据工程与数据科学能力的综合平台,打破传统数据处理与智能应用间的壁垒。新TBDS通过多模湖仓平台、WeData数智开发治理平台及DataAgent数据智能即服务构成核心架构,实现数据存储、管理、开发、治理与运维全面智能化。平台支持多模数据统一汇聚、异构计算负载调度,并显著提升数据开发到模型上线的全链路效率。在金融场景中,新TBDS已应用于信贷自动审批等业务,帮助机构提质增效。未来,腾讯云TBDS将持续发挥专业化与智能化优势,助力金融行业加速数字化转型。

  • 2025数贸会 | 每日互动:大数据+大模型,重塑营销价值

    9月26日,全球数字生态大会在杭州举行,聚焦AI与大数据如何重塑营销价值。每日互动朱晓鸣提出,企业需转变思维,从数据中洞察价值而非仅追求数据量,并介绍了“大数据联合计算模式”以平衡合规与营销增效。大会还推出AI营销产品AITA助手,结合大数据与行业经验,为品牌提供智能策略,助力降本增效,推动营销新纪元。

  • 卖家精灵火热亮相杭州跨博会,以AI+大数据赋能跨境卖家高效出海!​

    2025杭州跨博会于9月25-27日成功举办,聚焦家电、宠物等六大产业带,吸引超2.6万人次到场。卖家精灵作为亚马逊服务商参展,通过万瓶定制水传递品牌温度,展示AI选品与运营工具,助力卖家数据化决策。展会整合跨境资源,推动企业转型与增长,未来将持续深化AI应用,促进行业从粗放经营向精细化运营升级。

  • 中国贡献!全球首个专注于文物艺术品溯源元数据的国际标准正式通过

    2025年10月17日,国际电信联盟通过全球首个文物艺术品溯源元数据国际标准,由中国企业易元数字主导制定。该标准基于分布式账本技术,构建统一元数据框架,填补全球文物数字化管理长期空白,助力跨文明信息联通与文明互鉴,为文化遗产保护提供技术支撑。

  • 宜享花依托AI与大数据技术,推动消费金融合规创新与服务提质

    宜人智科旗下品牌宜享花以人工智能与大数据技术为核心驱动力,构建覆盖全链路的一体化智能服务体系。平台在严格合规框架下,深度融合金融机构与多元场景资源,为消费者提供精准、安全的金融支持,并通过科技创新持续优化风控能力与服务体验。宜享花高度重视合规经营,建立覆盖业务全流程的个人信息保护机制,自主研发“Hawkeye反欺诈管理系统”有效识别并拦截欺诈行为。同时,平台发布《消费者权益保护2024年度报告》,建立六大消保评审维度,强化事前审查与专项检查机制。通过AI技术打造高效、智能的客户服务体系,累计提供智能客服超490万次,智能客服分流率达52%。未来,宜享花将持续深化科技应用,筑牢智能风控防线,完善消费者权益保护,为经济高质量发展注入科技金融新动能。

  • RingConn智能戒指解码健康数据,亮相上海市医师协会医学大数据创新应用论坛

    9月27日,上海市医师协会医学大数据与转化创新专委会成立,并举办医学大数据创新应用论坛。会议聚焦可穿戴设备的医疗级数据价值,以RingConn智能戒指为例,展示其在持续监测心率、血氧、睡眠呼吸暂停(OSA)筛查等方面的突破。该产品凭借高佩戴率(超80%)和精准数据,正推动健康管理从医院向家庭延伸、从治疗向预防前移。未来,智能可穿戴设备将构建协同生态,实现数据互补与价值共生。

  • 32路监控+4K影库!海康R1全能NAS:你的私人数据管家

    海康S1全能NAS以高性能硬件配置重新定义NAS标准:搭载英特尔N100处理器,性能较前代提升40%;支持32路监控存储与4K影库构建;具备双M.2插槽和双2.5G网口,提供高速存储与5Gbps聚合带宽。集成智能AI管理,支持人脸识别、事件标记等智慧相册功能,配合96TB超大容量与触控屏设计,兼顾专业监控与家庭娱乐需求,实现性能与颜值的全面突破。

今日大家都在搜的词: