【加强版】SAX解析XML返回对应格式的Map对象(解决元素递归嵌套)

这篇具有很好参考价值的文章主要介绍了【加强版】SAX解析XML返回对应格式的Map对象(解决元素递归嵌套)。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

SAX解析XML返回对应格式的Map对象_辛丑年正月十五的博客-CSDN博客

前言

       上篇文章实现了xml元素节点的解析并返回了对应格式的Map对象,但是遗留了一个问题,就是当xml中的元素存在递归嵌套时就解析不了,因为qname属性会重复,导致后一个元素会覆盖前一个元素。

        问题明了了,解决问题的思路也就浮出水面了,要解决这种存在递归嵌套元素的xml只需找到该元素中的唯一属性值即可

简介

        本文依旧使用了上一篇文章的思路和代码,只是在上一篇文章的基础上增加了一个存储元素唯一标记的Map对象,该Map对象的作用就是用以区分,待解析XML递归嵌套元素的不同之处的。缺点就是,如果你待解析的xml中没有这种唯一属性的标记,那么你则需要赋予唯一属性值,并且替换使用的"KeyId"属性后(详见#图1.0)才能有效解析

# 图1.0

【加强版】SAX解析XML返回对应格式的Map对象(解决元素递归嵌套)

阅读必读

比较难理解的是xml节点复杂关系的呈现,设计思路是定义四个Map对象和一个int类型的下标值(详见图#1.1)四个Map对象的作用分别是

1、resultMap 存储结果集。

2、indexKeyId 存储元素的唯一标识,用于区分嵌套元素中元素之间的不同之处。

3、indexKeyMap 存储通过下标位置记录元素节点名称。

4、indexKeyMapObj 该对象以元素节点名称存储了元素对象本身。

5、index 元素的下标,每开始解析一个元素+1,每解析结束一个元素-1。

描述:当startElement开始读取节点元素时,通过下标记录元素的唯一标识和名称,并通过名称记录元素对象本身,每次开始解析一个元素时index下标进行累加,执行解析结束(endElement)时-1,解析思路是通过元素节点名称+唯一标识找到目标节点。组装格式也是通过index下标来找对应关系的,下面是代码呈现

# 图1.1

【加强版】SAX解析XML返回对应格式的Map对象(解决元素递归嵌套)

代码呈现

package com.syasuo.xml;

import com.alibaba.fastjson.JSON;
import lombok.SneakyThrows;
import lombok.extern.slf4j.Slf4j;
import org.springframework.util.CollectionUtils;
import org.xml.sax.Attributes;
import org.xml.sax.SAXException;
import org.xml.sax.helpers.DefaultHandler;

import java.io.BufferedOutputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.OutputStream;
import java.util.*;

/**
 * @author SYASUO
 * @date 2023/6/19 13:46
 */
@Slf4j
public class MyDefaultHandler extends DefaultHandler {

    //存储结果集
    private Map<String,Object> resultMap = new HashMap<>();

    //存储xml元素唯一的标识,主要用于区分元素节点的嵌套
    private Map<Integer,String> indexKeyId = new HashMap<>();
    
    //用下标标记key
    private Map<Integer,String> indexKeyMap = new HashMap<>();

    //下标标记的所属key的对象
    private Map<String,Map<String,Object>> indexKeyMapObj = new HashMap<>();

    //记录元素节点对应的下标,初始给0
    private int index = 0;

    @Override
    public void startDocument() throws SAXException {
        log.info("------------------------------XML读取开始------------------------------");
    }

    /**
     * 开始读取XML元素,每次记录下标对应的key和该key对应的对象
     */
    @SneakyThrows
    @Override
    public void startElement(String uri, String localName, String qName, Attributes attributes) throws SAXException {
        Map<String,Object> node = new HashMap<>();
        String keyId = null;
        for (int i = 0; i < attributes.getLength(); i++) {
            String eleName = attributes.getQName(i);
            if(null != eleName && eleName.equals("KeyId")){
                keyId = attributes.getValue(i);
            }
            node.put(attributes.getQName(i),attributes.getValue(i));
        }
        indexKeyId.put(index,keyId);
        indexKeyMap.put(index,qName);
        indexKeyMapObj.put(qName+keyId,node);
        index++;

    }

    /**
     * 元素节点读取结束时,由于index在startElement中执行了+1操作,
     * 因此获取对应节点的父级节点时需要先执行index-1操作得到当前节点下标,在当前节点下标位再次执行-1操作得到父级节点
     * 取到父级节点时需要判断父级包不包含该节点,如果包含就说明该节点是一个List集合,否则就作为一个单独的对象放入父级对象中
     * 最后给resultMap结果集对象赋值即可
     */
    @SneakyThrows
    @Override
    public void endElement(String uri, String localName, String qName) throws SAXException {
        //找当前节点
        int j = --index;
        String keyId = indexKeyId.get(j);
        //通过组合key找到当前元素对象
        String curKey = qName+keyId;
        Map<String,Object> curObj = indexKeyMapObj.get(curKey);
        if(j > 0){
            //找父节点
            j--;
            String parentQName = indexKeyMap.get(j);
            String parentKeyId = indexKeyId.get(j);
            //通过组合key找当前元素对象的父对象
            String parentKey = parentQName + parentKeyId;
            Map<String,Object> parent = indexKeyMapObj.get(parentKey);
            if(parent.containsKey(qName)){
                List<Map<String,Object>> list = new ArrayList<>();
                //System.out.println(parent.get(qName).getClass().getTypeName());
                if(parent.get(qName).getClass().getSimpleName().equals("HashMap")){
                    list.add((Map<String, Object>) parent.get(qName));
                }else{
                    list.addAll((Collection<? extends Map<String, Object>>) parent.get(qName));
                }
                //将当前节点对象加入当前对象集合
                list.add(curObj);
                parent.put(qName,list);
            }else{
                parent.put(qName,curObj);
            }
            resultMap = parent;
        }
    }

    @Override
    public void characters(char[] ch, int start, int length) throws SAXException {
      /*
        String element = new String(ch,start,length);
        log.info("该方法只有在【<ele>标签值</ele>】这种类型的标签下才能有效获取");
        */
    }

    @SneakyThrows
    @Override
    public void endDocument() throws SAXException {
        log.info("------------------------------XML读取结束------------------------------");
    }

    public Map<String,Object> getResultMap(){
        return resultMap;
    }
}

测试运行

注意:CprjInfoDTO是xml对应格式的JavaBean,需要替换成自己的。

XML如何转JavaBean,可以看我这一篇

使用XJC将XML转换成JavaBean遇到的坑_辛丑年正月十五的博客-CSDN博客

package com.syasuo.xml;

import com.alibaba.fastjson.JSON;
import com.alibaba.fastjson.JSONObject;
import com.syasuo.dto.CprjInfoDTO;
import com.syasuo.entity.CprjInfo;
import org.xml.sax.InputSource;
import org.xml.sax.SAXException;
import org.xml.sax.XMLReader;

import javax.xml.parsers.ParserConfigurationException;
import javax.xml.parsers.SAXParser;
import javax.xml.parsers.SAXParserFactory;
import java.io.*;
import java.util.Map;

/**
 * @author SYASUO
 * @date 2023/6/19 13:41
 */
public class Test {

    public static void main(String[] args) throws ParserConfigurationException, SAXException, IOException {
        Long startTime = System.currentTimeMillis();
        SAXParser parser = SAXParserFactory.newInstance().newSAXParser();
        MyDefaultHandler myDefaultHandler = new MyDefaultHandler();
        parser.parse(new File("D://root.xml"), myDefaultHandler);
        Map<String,Object> resultMap =  myDefaultHandler.getResultMap();
        OutputStream outputStream = new BufferedOutputStream(new FileOutputStream("D://OutMap.json"));
        //System.out.println(JSON.toJSONString(resultMap));
        outputStream.write(JSON.toJSONString(resultMap,true).getBytes());
        outputStream.close();
        CprjInfoDTO cprjInfo = JSONObject.parseObject(JSON.toJSONString(resultMap),CprjInfoDTO.class);
        OutputStream os = new BufferedOutputStream(new FileOutputStream("D://DefaultHandler.json"));
        os.write(JSON.toJSONString(cprjInfo,true).getBytes());
        os.close();
        //System.out.println(JSON.toJSONString(cprjInfo));
        System.out.println(System.currentTimeMillis()-startTime);
    }
}

 由于输出太大了,控制台打印不全也不容易看,所以输出了两个文件(详见#图1.2),分别是

1、OutMap.json 存储解析的原生Map对象

2、DefaultHandler.json 存储转换后的java对象

# 图1.2

【加强版】SAX解析XML返回对应格式的Map对象(解决元素递归嵌套)

成功

【加强版】SAX解析XML返回对应格式的Map对象(解决元素递归嵌套)

疑点解惑

问:为什么 j-- 就能找到父级对象?

解:因为sax解析元素是一层一层解析的,当解析嵌套元素时,内部元素没有解析完成时,外部元素是不会进入endElement方法的,所以每次内部元素解析完成通过我记录的下标-1就能找到父级元素 文章来源地址https://www.toymoban.com/news/detail-499991.html

到了这里,关于【加强版】SAX解析XML返回对应格式的Map对象(解决元素递归嵌套)的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • XML Map 端口进阶篇——常用关键字和格式化器详解

    XML Map 端口是用于在不同XML之间建立关系映射的工具,允许通过拖拽操作实现源XML和目标 XML之间的数据字段映射,除此之外,XML Map 端口还提供了其它丰富多彩的功能,使用户能够更加灵活和高效的处理XML 数据映射任务,让我们一同深入探索这些功能吧。 以生成850订单为例:

    2024年02月21日
    浏览(42)
  • [Java]_[初级]_[使用SAX流的方式写入XML文件]

    文件的写入目前没有发现可以增量写入的,只能是完全重新写入。对于大量数据需要写入 XML 文件,还是和读 XML 文件一样,不需要生成 DOM 模型能节省不少的内存和指令。 在 java 标准库里,也是有相关的SAX类来写入数据流, StreamResult(OutputStream) 负责把数据写入输出流。 之后

    2024年02月10日
    浏览(55)
  • 【Java 动态数据统计图】前后端对接数据格式(Map返回数组格式数据)六(120)

    说明 : 前端使用:vue3.0 ECharts可视化库 前后端对接数据格式:无非就是前端把后端返回的数据处理为自己想要的格式,或者,后端给前端处理好想要的格式; 针对前后端的柱状图,趋势图等数据对接,前端一般需要数组格式; 我们之前返回的数据格式是LIst Map 举例:动态数

    2024年02月11日
    浏览(45)
  • Java调用WebService接口,SOAP协议HTTP请求返回XML对象

    Java调用Web service接口SOAP协议HTTP请求,解析返回的XML字符串: 1. 使用Java的HTTP库发送SOAP请求,并接收返回的响应。 可以使用Java的HttpURLConnection、Apache HttpClient等库。 2. 将返回的响应转换为字符串。 3. 解析XML字符串 ,可以使用Java的DOM解析器或者其他第三方库,如JDOM、DOM4J等。

    2024年01月19日
    浏览(50)
  • 【Golang 接口自动化03】 解析接口返回XML

    目录 解析接口返回数据 定义结构体 解析函数: 测试 优化 资料获取方法 上一篇我们学习了怎么发送各种数据类型的http请求,这一篇我们来介绍怎么来解析接口返回的XML的数据。 定义结构体 假设我们现在有一个接口返回的数据 resp 如下: 要解析这个数据,首先我们要定义

    2024年02月14日
    浏览(42)
  • Springboot中LocalDateTime对象返回给前端,格式化

    后端日期时间对象,是LocalDateTime类型,直接返回前端,是数组形式 希望以正常的日期时间字符串格式返回 1.@JsonFormat注解 2.消息转化器 在实体类的LocalDateTime属性上面,添加注解 缺点: 每个日期时间属性都要添加,麻烦 3.2.1 配置类: config.WebMvcConfiguration 该config已实现了登录

    2024年04月13日
    浏览(40)
  • 深入解析MyBatisPlus:手动编写mapper和mapper.xml层实现IPage<YourEntity>返回类型

    在使用MyBatisPlus进行数据访问时,通常会涉及到编写mapper接口和mapper.xml文件来定义CRUD操作。在一些场景中,我们需要进行分页查询,并返回一个包含分页信息的数据集合。在这种情况下,我们可以使用MyBatisPlus提供的IPage接口来实现分页查询,并将其返回类型设置为 IPageYour

    2024年02月16日
    浏览(45)
  • 使用Pydantic将Python对象转换为其他数据格式,例如JSON、XML、YAML

    更多文章:技数未来 Pydantic是一个在Python中的数据验证和解析库。它可以将Python对象转换成其他数据格式,如JSON、XML和YAML。在使用Pydantic之前,我们需要进行一些准备工作: 1. 安装Python和pip:确保你的计算机上安装了Python以及pip包管理器。 2. 创建虚拟环境(可选):建议使

    2024年02月15日
    浏览(69)
  • <Java>Map<String,Object>中解析Object类型数据为数组格式

    背景 : 前端:入参为字符串和数组类型;通过json字符串传给后台, 后台:后台通过工具解析为MapString,Object,然后需要解析出Map里面的数组值做操作; 需求: 入参: { “addOrModify”: “add”, “hrBdName”: “陕西省”, “hrBdCode”: “1001”, “hrBuName”: [“宝鸡市”,“咸阳市”

    2024年02月15日
    浏览(41)
  • 【flask sqlalchmey】一次性将返回的列表对象或者 一行数据对象转成dict---flask-sqlalchemy输出json格式数据

    结果示例: 另外: res = Sysdict.query.all() 这种写法已经不被推荐了, 推荐的是scalar_one() 获取一行,scalars()获取多行 user = db.session.execute(db.select(User).filter_by(username=username)).scalar_one() users = db.session.execute(db.select(User).order_by(User.username)).scalars() 一般的 json.dumps(users) 或者 jsonify(use

    2024年02月13日
    浏览(56)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包