Java实现HTML页面转PDF解决方案

　　首先，当然是找到能够解析PDF的完美组件，百度和谷歌不约而同的告诉我们。IText是王道。而目前开源的组件中，Itext的确是一个First Choice,如果各位单纯是做把图片转成PDF或者自己写了Velocity或者FreeMarker模板生成了HTML是非常推荐直接用Itext来进行的。而如果，大家像我这样已经有前人写好了HTML页面或者懒得写FreeMarker模板的话。可以直接看下一段。

　　由于他们已经写好了HTML页面，而且显示已经很完美了。那我要做的就是能完美解析HTML+CSS的PDF生成工具。这时候flying-saucer进入了我的选择范围中。

　　这个工具托管在GoogleCode上面，作者做他们能够做下面的工作：

　　Flying Saucer takes XML or XHTML and applies CSS 2.1-compliant stylesheets to it, in order to render to PDF （via iText）， images, and on-screen using Swing or SWT.

　　不难看出工作原理，就是解析XML或者XHTML并且包括css样式表，并且用Swing或者SWT的组件生成PDF的功能。这解决了页面的显示问题。IText自身的一个很严重的问题就是解析CSS有很大的问题。而这个解决了。下面就是用Flying Saucer来实现的代码：

　　public boolean convertHtmlToPdf（String inputFile, String outputFile）

　　throws Exception {

　　OutputStream os = new FileOutputStream（outputFile）；

　　ITextRenderer renderer = new ITextRenderer（）；

　　String url = new File（inputFile）。toURI（）。toURL（）。toString（）；

　　renderer.setDocument（url）；

　　// 解决中文支持问题

　　ITextFontResolver fontResolver = renderer.getFontResolver（）；

　　fontResolver.addFont（"C:/Windows/Fonts/SIMSUN.TTC", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED）；

　　//解决图片的相对路径问题

　　renderer.getSharedContext（）。setBaseURL（"file:/D:/"）；

　　renderer.layout（）；

　　renderer.createPDF（os）；

　　os.flush（）；

　　os.close（）；

　　return true;

　　}

　　上面这段代码是这样的，输入一个HTML地址URL = inputFile,输入一个要输出的地址，就可以在输出的PDF地址中生成这个PDF.

　　注意事项：

　　1.输入的HTML页面必须是标准的XHTML页面。页面的顶上必须是这样的格式：

　　<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" ".org/TR/xhtml1/DTD/xhtml1-transitional.dtd">

　　<html xmlns=".org/1999/xhtml">

　　并且HTML页面的语法必须是非常严谨的，所有标签都必须闭合等等（由于flying-Saucer做了XML解析的工作，不严谨会报错的。），这是对页面的第一个要求。

　　2.要用到图片的地方写相对路径的形式，比如：

　　<img src="a.jpg" alt="323" width="252" height="80" />

　　而它的图片位置则必须在Java代码中指定。

　　renderer.getSharedContext（）。setBaseURL（"file:/D:/"）；

　　也有另一种方法就是直接在<img>标签中写绝对路径。

　　3.Flying-Saucer在解析tiff格式的图片的时候会报错。具体原因我还没找到。希望大家能够指点我。

　　4.如果在页面中有中文字体的话。必须在HTML代码中的样式中写上某种字体的css,并且必须是用英文的，然后在Java代码中写上对应的文件位置。

　　ITextFontResolver fontResolver = renderer.getFontResolver（）；

　　fontResolver.addFont（"C:/Windows/Fonts/SIMSUN.TTC", BaseFont.IDENTITY_H, BaseFont.NOT_EMBEDDED）；

　　上面的方法是添加了宋体。也可以添加其他字体。

　　以上就是解决方案托福答案

posted on 2013-12-15 10:57 好不容易阅读(225) 评论(0) 编辑收藏

新用户注册刷新评论列表


只有注册用户登录后才能发表评论。




网站导航: 博客园 IT新闻 Chat2DB C++博客博问管理

中文JAVA技术平等自由协作创造

导航

留言簿(2)

随笔档案

阅读排行榜

评论排行榜

常用链接

统计

最新评论

Java实现HTML页面转PDF解决方案