以文本方式查看主题

-  中文XML论坛 - 专业的XML技术讨论区  (http://bbs.xml.org.cn/index.asp)
--  『 Semantic Web(语义Web)/描述逻辑/本体 』  (http://bbs.xml.org.cn/list.asp?boardid=2)
----  一段代码,有点问题,请大家帮忙  (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&rootid=&id=21172)


--  作者:widowss
--  发布时间:8/15/2005 9:41:00 PM

--  一段代码,有点问题,请大家帮忙
主要要解决的问题是我把一个html的网页转变为xml格式的,在下面这个问题中,如果网页格式正确,那么不会报错,否则会报错,有没有解决的办法
import javax.swing.text.Element;
import javax.xml.parsers.*;
import javax.xml.parsers.DocumentBuilderFactory;
import javax.xml.parsers.ParserConfigurationException;        

DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
DocumentBuilder bulider=factory.newDocumentBuilder();
File xmlfile=new File(url);
Document doc=bulider.parse(xmlfile);
~~~~~~~~~~~~~~~~~~~~~~~~~~~就在这个parse出错
NodeList nodelist=doc.getElementsByTagName("bookAuthor");


编译提示
org.xml.sax.SAXParseException: 字符转换错误:“Unconvertible UTF-8 character beginning with 0xa3”(行号可能太小)。
 at org.apache.crimson.parser.InputEntity.fatal(Unknown Source)
 at org.apache.crimson.parser.InputEntity.fillbuf(Unknown Source)
 at org.apache.crimson.parser.InputEntity.isXmlDeclOrTextDeclPrefix(Unknown Source)
 at org.apache.crimson.parser.Parser2.maybeXmlDecl(Unknown Source)
 at org.apache.crimson.parser.Parser2.parseInternal(Unknown Source)
 at org.apache.crimson.parser.Parser2.parse(Unknown Source)
 at org.apache.crimson.parser.XMLReaderImpl.parse(Unknown Source)
 at org.apache.crimson.jaxp.DocumentBuilderImpl.parse(Unknown Source)
 at javax.xml.parsers.DocumentBuilder.parse(Unknown Source)
 at TestHTML2XML.get_all_para(TestHTML2XML.java:74)
 at TestHTML2XML.main(TestHTML2XML.java:97)
Exception in thread "main"


--  作者:iamwym
--  发布时间:8/16/2005 12:40:00 AM

--  
好像是文件编码有问题,你这个是什么api?
--  作者:yanxq
--  发布时间:8/17/2005 1:17:00 PM

--  
使用try catch来捕获并显示错误,就可以了
--  作者:yeanse
--  发布时间:8/19/2005 11:03:00 AM

--  
你给出的源文件名称、路径有问题。。。
W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
78.125ms