软件编程
位置:首页>> 软件编程>> java编程>> Java解析xml文件遇到特殊符号异常的情况(处理方案)

Java解析xml文件遇到特殊符号异常的情况(处理方案)

作者:朱季谦  发布时间:2023-10-23 17:31:48 

标签:Java,xml文件,特殊符号

在一次Java解析xml文件的开发过程中,使用SAX解析时,出现了这样一个异常信息:

Error on line 60 of document : 对实体 "xxx" 的引用必须以 ';' 分隔符结尾;

我打开xml文件后,发现该“xxx"符号之前跟着一个”&“符号,后来了解到,这类符号在xml里属于一种特殊符号,而特殊符号若没用转义符表示,直接用到xml文件里,就会在使用SAX等方式做解析时出现奇怪的异常。

其实,这都是因为这些特殊字符造成的。

XML当 * 殊符号包括< > & ' "等,它们是不允许作为xml文件的PCDATA,若想使用话,需用转义符代替:

&lt;    <
&gt;    >
&amp;   &
&quot;  "
&apos;  '

那么,若要正常读取xml文件数据,应该如何使用转义符替换呢?

刚开始是想百度一番如何解决,却发现好多帖子都是好几年前的,且都没有写清楚怎么个解决方法,大多都是提到是特殊符号引起的解析异常,但怎么过滤掉,显得含糊其辞,因此,只能自己胡乱捣鼓一番,捣鼓出一个比较合适的将特殊字符过滤的方案。

实现思路其实很简单,我们可以在读取xml文件使用SAX解析前,先把xml文件通过Reader读取,然后按行读取出来拼接成一个String字符串,再使用字符串的替换方法replaceAll()将特殊符号进行替换,替换后,就可以将字符串形式的xml直接转成Document对象做xml解析了:


 String xmlStr=s.replaceAll("&","&amp;");

转换方法代码如下:


StringBuffer buffer = new StringBuffer();
 BufferedReader bf= new BufferedReader(new FileReader("D:\\测试.xml"));
 String s = null;
    while((s = bf.readLine())!=null){
    buffer.append(s.trim());
 }

String str = buffer.toString();
 //在这一步进行字符替换,替换成合法转义字符
 String xml=str.replaceAll("&","&amp;");

//这里就可以将处理过的xml文件进行读取解析了
 Document document =  DocumentHelper.parseText(xml);

至此,就可以解决Java解析xml文件遇到特殊符号&出现异常的问题了。

来源:https://www.cnblogs.com/zhujiqian/p/14766674.html

0
投稿

猜你喜欢

手机版 软件编程 asp之家 www.aspxhome.com