首页 > 教程 > 关键词  > XML结点转换成JAVABEAN最新资讯  > 正文

XML结点转换成JAVABEAN并存入数据库

2008-10-24 17:23 · 稿源:爱问cpu

1.概述
我们要将外部系统给的XML文件进行解析,并存入到数据库。
但是我们并没有DTD或者Schema,只有一个WORD格式的说明文档;更离谱的是,XML结点树的结构(即XML结点与XML结点之间的关系)与业务Bean树的结构(即业务Bean与业务Bean的关系)并不完全一致,比如说,从业务角度讲,一只猪有只猪头,而在XML里,却写成了 pig --content --pighead 的三级关系,无端端多了一个content结点! 没有DTD/Schema,结构又不规范,我们就没法用自动化的第三方JAVA转换API进行解析,而只能手动地、一个一个地解析。但在手动解析的过程中,我们仍然发现各个结点的解析和入库中有很多东西是共同的,或者有共同的规律,这些东西可以抽出来作为一个准框架,然后再将结点中不同的部分开放出来,允许具体的结点做具体的实现,并最终形成一个半自动的解析/入库框架。
为什么说它是半自动的?它有哪些限制?
自动:不必为每个结点编写XML 解析代码和入库代码
“半”:需手动地编写每个JAVABEAN,并手动地为每个BEAN建表
限制:
a.所有业务字段的类型只能设为STRING/VARCHAR,并且非业务字段的类型在BEAN中不能为STRING
b.BEAN名与表名必须相同,或者可以进行一对一映射
c.BEAN的成员变量名必须与XML结点的属性名/元素名相同,或者可以进行一对一映射
这三种限制都是利用JAVA反射机制进行自动操作的前提。
2.基本思想
所谓的XML解析,就是将XML结点转换成JAVABEAN实例,XML结点的ATTRIBUTE值和ELEMENT值就是JAVABEAN实例的成员变量值; 所谓的持久化,就是将JAVABEAN实例变成数据库对应表中的一条记录,JAVABEAN实例的成员变量值就是记录中某个字段的值,或者其他表中某个参考了该记录的另一条记录。
而在XML中,JAVABEAN体系中,数据据表关系结构中,结点和结点之间的关系都是树形的关系。整体的解析和入库,就是在遍历树时执行转换动作。而我们知道,树的遍历是可以用递归算法实现的,而递归,就不用说了吧,它是实现程序“自动化”的主要途径之一。
以下是对各“树”的具体分析:
假设两个业务实体A和B之间存在聚合关系(父子关系)。那么具体可分三种情况:
a.B是一个原子字段(即不可再分),并且是A的一个属性。
XML中,B是A的XML ATTRIBUTE或者A的原子ELEMENT
BEAN中,B是A的成员变量,并且B是一个JAVA内置的数据类型
数据库中,B是A表的一个列
b.B是一个复合字段,并且是A的一个属性,而且和A是1:1关系
XML中,B是A的ELEMENT,并且B有自己的ELEMENT或者ATTRIBUTE
BEAN中,B是A的成员变量,并且程序中有个B类
数据库中,B表是A表的子表(即B外键参考了A表)
c.B是一个复合字段,并且是A的一个属性,而且和A是N:1关系
XML中,B是A的ELEMENT,并且B有自己的ELEMENT或者ATTRIBUTE
BEAN中,B组成一个类集(List,Set)共同作为A的成员变量,并且程序中有个B类
数据库中,B表是A表的子表(即B外键参考了A表)
了解了这三种情况,接下来就好办了。程序每抓到一个结点,都要递归地进行以下处理:先处理它的原子属性(情形a),接着处理它的单个子结点(情形b),最后处理它的类集子结点( 情形c)。
3.代码实现的重点
两个重点:
a.如何让业务实体在三棵树内一一对应好?
b.如何发现树形关系,比如A的属性有哪些,A的子结点有哪些?
问题a很简单,就是让三棵树里相同的业务实体取相同的名字。
a.解析XML时发现 结点X 的 属性Y 等于 值Z,则执行PropertyUtils.setProperty(结点X , 属性Y , 值Z)即可。在这里X,Y,Z是变量,程序不用关心具体的结点和属性是哪些个。需要注意的是,如果属性Y是原子字段,则要求属性Y必须为String类型,否则程序不知道将值Z转换成哪种类型(注:关于PropertyUtils, 请见apache commons Beanutils )
b.入库时发现x.getY()=z。如果属性y是原子字段,则执行SQL insert into X(...,y,...) values (...,z,...),这里要求y字段必须为varchar/char类型, 以免发生类型转换错误.
关于问题b
XML树:JDOM, dom4j等都可以直接找到父子关系
BEAN体系:
I.原子属性。我们限定一个BEAN中所有有业务意义的原子字段的类型都STRING,所有String类型的字段都是业务字段
II.单个子结点。我们让所有有业务意义的非原子字段都实现一个共同的接口BusiNode,这样一个BEAN中所有BusiNode成员都是这个BEAN的子结点
III.类集子结点。我们也可以限定所有且只有类集子结点可以使用List或Set类型,这样可以利用过滤出所有类集子结点。然而,在JAVA1.4及以前的版本里,程序并不知道过滤出的类集子结点是哪个Class的实例(因为没有泛型),也就没办法实例化一个类集子结点(见后文),因此只能手动注册类集子结点的属性名和Class。JAVA1.5以上的版本我没用过,不知道可不可以解决这个问题。
数据库表关系: 这就不用多说了,就是通过外键参考。因此每类结点对应的表中,都必须有个外键,以参考它的父结点;还必须有个主键,以供它的子结点参考。各表的外键名必须相同并为一常数,否则程序生成INSERT SQL时才可以不用理会具体表的具体的外键名。
程序在解析时,遍历的是BEAN树;在持久化时也是。比起XML树,BEAN树代表真正的业务结构;比起数据库表关系树,BEAN树才能由父至子地进行先序遍历
4.其他问题
a.要让程序知道,原子属性中哪些是XML结点的属性,哪些是XML结点的原子ELEMENT。代码中这是两个抽象方法,必须让具体的结点类实现
b.回顾本文概述部分提到的“pig --content --pighead 的三级关系,无端端多了一个content结点”,因此我们要让程序知道,pighead,pigfoot等结点的子结点,究竟是pig,还是pig下的content。处理不规范XML时要注意这个问题。这也是一个抽象方法,必须让具体的结点类实现
c.与上一条类似但更变态的,是类集结点的不规范问题。假设一个pig有多个pighead,那结构可能为 pig--pighead,pighead,...,也可能为pig--pigheads--content,content.... 必须让程序知道某个具体结点用的是哪种模式

举报

  • 相关推荐
  • AI驱动全域进化,金仓数据库以“融合”重构数据基座

    7月15日,电科金仓在京举办"融合进化+智领未来"主题产品发布会,推出多款AI时代数据库产品:KES V92025融合数据库具备多语法体系兼容、多集群架构等特性,性能提升30%;KEMCC统一管控平台实现跨云环境数据库管理;云数据库AI版集成高性能硬件与AI大模型;KFS Ultra智能数据集成平台支持百种数据源。中国人民大学教授王珊指出,数据库与AI深度结合已成释放数据价值关�

  • O域核心!金仓数据库支撑海南移动核心故障管理系统升级上线

    中国移动海南公司成功升级国产化核心故障管理系统"O域",采用金仓数据库技术支持。该系统创新构建五位一体监控体系,实现故障处理效率指数级提升。通过全栈国产化突破,采用分布式数据核心架构,实现99.999%高可用性和毫秒级响应。在2024年超强台风"摩羯"登陆期间,系统凭借同城双中心灾备架构稳定运行,保障了通信命脉。金仓数据库通过PLSQL优化、固定缓冲池等核心技术,使系统性能显著提升:告警分析速度提升450%,拓朴查询效率跃升644%,历史数据清理效率提高7倍,存储空间降低12%。

  • 金仓数据库26周年|淬火砺重器,万里再扬帆

    金仓数据库26年发展历程:从萨师煊教授70年代引入数据库概念,到王珊教授团队1999年创立金仓公司实现产业化突破,见证了中国数据库从无到有的发展。金仓坚持自主创新,打造KES融合数据库产品体系,拥有700多项专利,服务金融、能源等国家重点行业,装机量超百万套。公司构建产学研生态,培养数万名专业人才,推动国产数据库生态建设。站在新起点,金仓将继续以自主可控技术支撑千行百业数字化转型,助力数字中国建设。

  • AIbase完整评测:20,000+AI工具库深度解析

    AIbase是一个强大的AI工具导航平台,收录超过2万个AI工具并每日更新。它通过智能搜索、精准分类和用户友好界面,帮助开发者、设计师、营销人员和普通用户快速找到适合的AI工具。平台提供写作助手、视频编辑、代码生成等各类工具,并支持多语言访问。AIbase的核心优势在于庞大的数据库和高效更新机制,解决了用户在AI工具海洋中筛选的痛点。虽然存在用户深度评价不足�

  • AIbase完整评测:20,382+AI工具库背后的秘密

    AIbase.com是一个强大的AI工具发现平台,拥有超过20,382个AI工具的庞大数据库,每日持续更新。平台通过智能搜索和15+分类体系(如AI写作、视频编辑、代码生成等)帮助用户快速定位所需工具。作者通过实际案例展示了AIbase如何提升工作效率300%,包括快速找到社交媒体文案生成器、视频编辑工具和代码生成器等。平台优势在于工具数量庞大、分类精准、搜索高效,但也存在用户

  • AI日报:百度发布“绘想”平台与MuseSteamer;阿里音频驱动全身数字人模型OmniAvatar

    【AI日报】今日AI领域重要动态:1.开源语音大模型Step-Audio-AQAA发布,实现音频到语音的端到端自然转换;2.百度推出"绘想"平台与MuseSteamer,通过AI一键生成专业级视频;3.浙大与阿里联合发布OmniAvatar,音频驱动数字人技术取得突破;4.百度搜索迎十年来最大改版,新增智能框、百看和AI助手功能;5.xAI开发者控制台新增Grok4及Grok4Code引用,预示新一代AI模型即将发布;6.Gemin

  • AIbase MCP服务库上线:集成服务器、客户端、调试、案例教程等服务

    在当今数字化时代,人工智能技术正以前所未有的速度发展,深刻地改变着我们的生活和工作方式。而要充分发挥AI的强大能力,离不开高效的工具和服务支持。今天,就让我们来了解一下一个专注于MCP(Model Context Protocol)服务的优质平台 —— AIbase(www.aibase.cn)。 AIbase平台(https://mcp.aibase.cn/)作为一个精选全球优质MCP服务器的集合平台,为AI应用开发者和爱好者提供了丰富的�

  • 硬盘丢失了数据怎么恢复?硬盘数据恢复的6种方法

    文章分析了硬盘数据丢失的常见原因及恢复方法。数据丢失主要源于人为误操作、硬件故障、软件系统问题和环境因素四类。针对不同情况,介绍了6种恢复方法:回收站还原、系统版本回退、备份还原、Mac系统的TimeMachine、命令行操作以及专业数据恢复软件。其中专业软件如转转大师能深度扫描硬盘,支持多种文件格式恢复,操作简便且成功率高。文章强调数据丢失后应避免写入操作,根据实际情况选择合适恢复方式,并建议做好日常备份预防数据丢失。

  • 用数据丈量时代:神策十年进化论

    神策数据成立于2015年4月,从服务互联网客户的SaaS模式起步,逐步发展为国内数字化用户运营市场的领先企业。十年来,公司业务模式不断升级,现已服务金融、零售等大型客户,产品体系涵盖客户数据引擎(CDP)、客户旅程分析引擎(CJA)等核心产品,并接入AI大模型提升智能化水平。目前服务2500+付费客户,覆盖30多个行业,获得近100项专业认证和100+奖项。公司持续推动产品迭代

  • 还在搜“最新AI产品”?这个AI产品库让你领先99%的人!

    文章介绍AIbase产品库,这是一个专注于AI工具导航的平台。它通过每日更新全球最新AI产品、精准分类(如写作、绘画、视频生成等)、多维度筛选(价格、功能、平台)和真实用户评价,帮助用户高效发现优质AI工具。平台覆盖办公提效、创意设计、编程开发等场景,解决信息过载问题,让用户能快速找到适合自己需求的AI解决方案。