我有一个jsp文件,我喜欢使用飞碟将其转换为PDF。这是jsp文件:
<%@page contentType="text/html" pageEncoding="UTF-8" isELIgnored="false"%>
<%@ taglib uri="http://java.sun.com/jsp/jstl/core" prefix="c" %>
<%@ taglib prefix="display" uri="http://displaytag.sf.net/el" %>
<!DOCTYPE html>
<%
String path = request.getContextPath();
String basePath = request.getScheme() + "://" + request.getServerName() + ":" + request.getServerPort() + path + "/";
%>
<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8">
<title>JSP Page</title>
</head>
<body>
<form name="testDBForm" action="<%=basePath%>/TestDatabase" method="post" onsubmit="return true">
<input type="submit" id="btnInsert" value="btnInsert" name="btnInsert" text="INSERT"/>
<input type="submit" id="btnSelect" value="btnSelect" name="btnSelect" text="SELECT"/>
<input type="submit" id="btnDelete" value="btnDelete" name="btnDelete" text="DELETE"/>
<input type="submit" id="btnUpdate" value="btnUpdate" name="btnUpdate" text="UPDATE"/>
</form>
<c:if test="${not empty message}">
<h1>${message}</h1>
</c:if>
<c:if test="${not empty insert}">
<h1>Insert: ${message}</h1>
</c:if>
<c:if test="${not empty select}">
<h1>Select: ${message}</h1>
</c:if>
<c:if test="${not empty update}">
<h1>Update: ${message}</h1>
</c:if>
<c:if test="${not empty delete}">
<h1>Delete: ${message}</h1>
</c:if>
</body>
</html>
这是我用来解析html到pdf的servlet代码:
protected void processRequest(HttpServletRequest request, HttpServletResponse response) {
response.setContentType("application/pdf");
String inputFile = "D:\\03072014\\src\\main\\webapp\\includes\\testDatabase.jsp";
String url="";
try {
url = new File(inputFile).toURI().toURL().toString();
} catch (MalformedURLException ex) {
Logger.getLogger(HtmlToPdfTaxCardConvertor.class.getName()).log(Level.SEVERE, null, ex);
}
OutputStream os=null;
try {
os = response.getOutputStream();
} catch (IOException ex) {
Logger.getLogger(HtmlToPdfTaxCardConvertor.class.getName()).log(Level.SEVERE, null, ex);
}
ITextRenderer renderer = new ITextRenderer();
renderer.setDocument(url);
renderer.layout();
try {
renderer.createPDF(os);
os.close();
} catch (DocumentException ex) {
Logger.getLogger(HtmlToPdfTaxCardConvertor.class.getName()).log(Level.SEVERE, null, ex);
}
catch (IOException ex) {
Logger.getLogger(HtmlToPdfTaxCardConvertor.class.getName()).log(Level.SEVERE, null, ex);
}
} }
我有例外
javax.xml.transform.TransformerException: org.xml.sax.SAXParseException: The markup in the document preceding the root element must be well-formed.
有人可以帮助我,是否可以从这种html页面创建pdf
答案 0 :(得分:1)
FS需要XHTML,这意味着它非常挑剔HTML文件的输入。
有两件事要尝试:
<!DOCTYPE html>
放在页面顶部。/
。<c:out value="${message}" />
代替${message}
,以确保HTML中没有放置非法字符,导致解析器中断。如果失败了继承我用于FS jsp页面的标准模板,doc类型声明是可选的,您可以使用标准<!DOCTYPE html>
,但我发现自定义声明大大提高了速度。但它确实意味着您必须对转义字符使用十进制编码。
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<!DOCTYPE doctypeName [
<!ENTITY nbsp " ">
<!ENTITY amp "&">
]>
<%-- other jsp stuff here --%>
<%@include file="/WEB-INF/jsp/taglib.inc"%>
<html>
....
</html>
<小时/> 还应该提到的是,如果你不想打扰所有这些垃圾,你可以使用JSoup或其他HTML清理器来清理你的HTML,并确保它100%的FS好。有一个很好的fork of the FS project going on由danfickle在github上构建,有助于整合。他还增加了更多的CSS3支持。