java的POI操作Excel文件

    微软在桌面系统上的成功,令我们不得不大量使用它的办公产品,如:WordExcel。时至今日,它的源代码仍然不公开已封锁了我们的进一步应用和开发。然而在要求更高的服务器领域,微软本身的产品移植性不好, 

    性能不佳。在我们实际的开发中,表现层的解决方案虽然有多样,但是Ie浏览器已成为最多人使用的浏览器,因为大家都用Windows。在企业办公系统中,常常有客户这样子要求:你要把我们的报表直接用Excel打开。或者是:我们已经习惯用Excel打印。这样子如果用.net开发是没有问题的,但是有j2ee这个比.net更有前途的开放式的开发环境,难道我为了解决打印的要求去另写客户端的控件?或者在服务器端使用本地代码?第一种方案的问题是关键数据的处理有时候不能在客户端做,第2种方案的问题是牺牲了代码的可移植性和稳定性。如果让客户端只负责处理生成好的报表,那将是一种诱人的选择。

    ApacheJakata项目的POI子项目,目标是处理ole2对象。目前比较成熟的是HSSF接口,处理MS Excel97-2002)对象。它不象我们仅仅是用csv生成的没有格式的可以由Excel转换的东西,而是真正的Excel对象,你可以控制一些属性如sheet,cell等等。这是一个年轻的项目,所以象HDF这样直接支持Word对象的好东西仍然在设计中。其它支持word格式的纯java方案还有itext,不过也是仍在奋斗中。但是HSSF已经成熟到能够和足够我们使用了。另外,无锡永中Office的实现方案也是纯java的解决方案,不过那也是完全商业的产品,并不是公开代码项目。其实,从开发历史的角度讲,在80年代中期starOffice的原作者在德国成立了StarOffice suite公司,然后到1999年夏天starOfficesun收购,再到20006starOffice5.2的发布;并且从starOffice6.0开始,starOffice建立在OpenOfficeapi的基础上,这个公开代码的office项目已经进行了很长的时间。虽然那是由C++写的,但是POI的代码部分也是由openOffice改过来的。所以,应该对POI充满足够的信心。国内已经有部分公司在他们的办公自动化等Web项目中使用poi了,如日恒的ioffice,海泰的HTOffice等。

    java当初把核心处理设成Unicode,带来的好处是另代码适应了多语言环境。然而由于老外的英语只有26个字母,有些情况下,一些程序员用8位的byte处理,一不小心就去掉了CJK的高位。或者是由于习惯在程序中采用硬编码,还有多种原因,使得许多java应用在CJK的处理上很烦恼。还好在POI HSSF中考虑到这个问题,可以设置encoding为双字节。

    POI可以到www.apache.org下载到。编译好的jar主要有这样4个:poi,poi Browser,poi hdf,poi hssf例程包。实际运行时,需要有poi包就可以了。如果用Jakarta ant编译和运行,下载apache Jakarta POIrelease中的src包,它里面已经为你生成好了build文件了。只要运行ant就可以了(ant 的安装和使用在此不说了)。如果是用Jbuilder 运行,请在新建的项目中加入poi包。以Jbuilder6为例,选择Tools菜单项的config libraries...选项,新建一个lib。在弹出的菜单中选择poi包,如这个jakarta-poi-1.5.1-final-20020820.jar,把poi添加到jbuilder中。然后,右键点击你的项目,在projectproperties菜单中pathrequired Libraries中,点add,添加刚才加入到jbuilder中的poi到你现在的项目中。如果你仅仅是为了熟悉POI hssf的使用,可以直接看POIsamples包中的源代码,并且运行它。hssf的各种对象都有例程的介绍。hssf提供的例程在org.apache.poi.hssf.usermodel.examples包中,共有14个,生成的目标xls都是workbook.xls。如果你想看更多的例程,可以参考hssfJunit test cases,在poi的包的源代码中有。hssf都有测试代码。

    这里只对部分例程的实现做介绍。

    HSSF提供给用户使用的对象在org.apache.poi.hssf.usermodel包中,主要部分包括Excell对象,样式和格式,还有辅助操作。有以下几种对象:

        HSSFWorkbook excell的文档对象

        HSSFSheet excell的表单

        HSSFRow excell的行

        HSSFCell excell的格子单元

        HSSFFont excell字体

        HSSFName 名称

        HSSFDataFormat 日期格式

    在poi1.7中才有以下2项:

        HSSFHeader sheet

        HSSFFooter sheet

    和这个样式

        HSSFCellStyle cell样式

    辅助操作包括

        HSSFDateUtil 日期

        HSSFPrintSetup 打印

        HSSFErrorConstants 错误信息表

    仔细看org.apache.poi.hssf包的结构,不难发现HSSF的内部实现遵循的是MVC模型。

    这里我用Roseorg.apache.poi.hssf.usermodel包中的对象反向导入并根据相互关系作了整理。从中不难可以发现每一个基本对象都关联了一个Record对象。Record对象是一个参考Office格式的相关记录。

    HSSFWorkbook即是一个Excell对象。这幅类图体现的是HSSFWorkbook和基本对象的相互关系。可见,许多对象中也建立了Workbook的引用。还需要注意的是在HSSFWorkbookHSSFSheet中建立了log机制POILogger,而且POILogger也是使用apache Log4J实现的。

    先看poiexamples包中提供的最简单的例子,建立一个空xls文件。

    

 1import org.apache.poi.hssf.usermodel.HSSFWorkbook;
 2
 3import java.io.FileOutputStream;
 4
 5import java.io.IOException;
 6
 7public class NewWorkbook{
 8
 9public static void main(String[] args) throws IOException{
10
11        HSSFWorkbook wb = new HSSFWorkbook();//建立新HSSFWorkbook对象
12
13        FileOutputStream fileOut = new FileOutputStream("workbook.xls");
14
15        wb.write(fileOut);//把Workbook对象输出到文件workbook.xls中
16
17        ileOut.close();
18
19    }

20}

    

    通过这个例子,我们建立的是一个空白的xls文件(不是空文件)。在此基础上,我们可以进一步看其它的例子。

 1import org.apache.poi.hssf.usermodel.*;
 2
 3import java.io.FileOutputStream;
 4
 5import java.io.IOException;
 6
 7public class CreateCells
 8
 9{
10
11    public static void main(String[] args)
12
13    throws IOException
14
15    {
16
17        HSSFWorkbook wb = new HSSFWorkbook();// 建立新HSSFWorkbook对象
18
19        HSSFSheet sheet = wb.createSheet("new sheet");// 建立新的sheet对象
20
21        // Create a row and put some cells in it. Rows are 0 based.
22
23        HSSFRow row = sheet.createRow((short0);// 建立新行
24
25        // Create a cell and put a value in it.
26
27        HSSFCell cell = row.createCell((short0);// 建立新cell
28
29        cell.setCellValue(1);// 设置cell的整数类型的值
30
31        // Or do it on one line.
32
33        row.createCell((short1).setCellValue(1.2);// 设置cell浮点类型的值
34
35        row.createCell((short2).setCellValue("test");// 设置cell字符类型的值
36
37        row.createCell((short3).setCellValue(true);// 设置cell布尔类型的值
38
39        HSSFCellStyle cellStyle = wb.createCellStyle();// 建立新的cell样式
40
41        cellStyle.setDataFormat(HSSFDataFormat.getFormat("m/d/yy h:mm"));// 设置cell样式为定制的日期格式
42
43        HSSFCell dCell = row.createCell((short4);
44
45        dCell.setCellValue(new Date());// 设置cell为日期类型的值
46
47        dCell.setCellStyle(cellStyle); // 设置该cell日期的显示格式
48
49        HSSFCell csCell = row.createCell((short5);
50
51        csCell.setEncoding(HSSFCell.ENCODING_UTF_16);// 设置cell编码解决中文高位字节截断
52
53        csCell.setCellValue("中文测试_Chinese Words Test");// 设置中西文结合字符串
54
55        row.createCell((short6).setCellType(HSSFCell.CELL_TYPE_ERROR);// 建立错误cell
56
57        // Write the output to a file
58
59        FileOutputStream fileOut = new FileOutputStream("workbook.xls");
60
61        wb.write(fileOut);
62
63        fileOut.close();
64
65    }

66
67}


    我稍微修改了原来的examples包中的CreateCells类写了上面的功能测试类。通过这个例子,我们可以清楚的看到xls文件从大到小包括了HSSFWorkbook HSSFSheet HSSFRow HSSFCell这样几个对象。我们可以在cell中设置各种类型的值。尤其要注意的是如果你想正确的显示非欧美的字符时,尤其象中日韩这样的语言,必须设置编码为16位的即是HSSFCell.ENCODING_UTF_16,才能保证字符的高8位不被截断而引起编码失真形成乱码。

    其他测试可以通过参考examples包中的测试例子掌握poi的详细用法,包括字体的设置,cell大小和低纹的设置等。需要注意的是POI是一个仍然在完善中的公开代码的项目,所以有些功能正在不断的扩充。如HSSFSheetgetFooter() getHeader()setFooter(HSSFFooter hsf) setHeader(HSSFHeader hsh)是在POI1.7中才有的,而POI1.5中就没有。运行测试熟悉代码或者使用它做项目时请注意POI的版本。

    另外需要注意的是HSSF也有它的对xls基于事件的解析。可以参考例程中的EventExample.java。它通过实现HSSFListener完成从普通流认知Xls中包含的内容,在apache Cocoon中的org.apache.cocoon.serialization.HSSFSerializer中用到了这个解析。因为Cocoon2是基于事件的,所以POI为了提供快速的解析也提供了相应的事件。当然我们自己也可以实现这个事件接口。

因为POI还不是一个足够成熟的项目,所以有必要做进一步的开发和测试。但是它已经为我们用纯java操作ole2对象提供了可能,而且克服了ole对象调用的缺陷,提供了服务器端的Excel解决方案。

    

    为了保证示例程序的运行,必须安装Java 2 sdk1.4.0 Jakarta POIJakarta POIWeb站点是: http://jakarta.apache.org/poi/

    
    示例1将演示
    如何利用
Jakarta POI API 创建Excel 文档。
   

 1import org.apache.poi.hssf.usermodel.HSSFWorkbook;
 2import org.apache.poi.hssf.usermodel.HSSFSheet;
 3import org.apache.poi.hssf.usermodel.HSSFRow;
 4import org.apache.poi.hssf.usermodel.HSSFCell;
 5import java.io.FileOutputStream;
 6public class CreateXL {
 7 /** Excel 文件要存放的位置,假定在D盘JTest目录下*/
 8 public static String outputFile="D:/JTest/ gongye.xls";
 9 public static void main(String argv[]){
10     try{
11      // 创建新的Excel 工作簿
12      HSSFWorkbook workbook = new HSSFWorkbook();
13      // 在Excel工作簿中建一工作表,其名为缺省值
14      // 如要新建一名为"效益指标"的工作表,其语句为:
15      // HSSFSheet sheet = workbook.createSheet("效益指标");
16      HSSFSheet sheet = workbook.createSheet();
17      // 在索引0的位置创建行(最顶端的行)
18      HSSFRow row = sheet.createRow((short)0);
19      //在索引0的位置创建单元格(左上端)
20      HSSFCell cell = row.createCell((short0);
21      // 定义单元格为字符串类型
22      cell.setCellType(HSSFCell.CELL_TYPE_STRING);
23      // 在单元格中输入一些内容
24      cell.setCellValue("增加值");
25      // 新建一输出文件流
26      FileOutputStream fOut = new FileOutputStream(outputFile);
27      // 把相应的Excel 工作簿存盘
28      workbook.write(fOut);
29      fOut.flush();
30      // 操作结束,关闭文件
31      fOut.close();
32      System.out.println("文件生成");
33    
34    
35     }
catch(Exception e) {
36      System.out.println("已运行 xlCreate() : " + e );
37     }

38    }

39}


读取Excel文档中的数据
  示例2将演示如何读取Excel文档中的数据。假定在DJTest目录下有一个文件名为gongye.xlsExcel文件。

  示例2程序如下:

 

 1import org.apache.poi.hssf.usermodel.HSSFWorkbook;
 2import org.apache.poi.hssf.usermodel.HSSFSheet;
 3import org.apache.poi.hssf.usermodel.HSSFRow;
 4import org.apache.poi.hssf.usermodel.HSSFCell;
 5import java.io.FileInputStream;
 6public class ReadXL {
 7 /** Excel文件的存放位置。注意是正斜线*/
 8 public static String fileToBeRead="D:/JTest/ gongye.xls";
 9 public static void main(String argv[])
10 try{
11  // 创建对Excel工作簿文件的引用
12  HSSFWorkbook workbook = new HSSFWorkbook(new FileInputStream(fileToBeRead));
13  // 创建对工作表的引用。
14  // 本例是按名引用(让我们假定那张表有着缺省名"Sheet1")
15  HSSFSheet sheet = workbook.getSheet("Sheet1");
16  // 也可用getSheetAt(int index)按索引引用,
17  // 在Excel文档中,第一张工作表的缺省索引是0,
18  // 其语句为:HSSFSheet sheet = workbook.getSheetAt(0);
19  // 读取左上端单元
20  HSSFRow row = sheet.getRow(0);
21  HSSFCell cell = row.getCell((short)0);
22  // 输出单元内容,cell.getStringCellValue()就是取所在单元的值
23  System.out.println("左上端单元是: " + cell.getStringCellValue()); 
24 }
catch(Exception e) {
25  System.out.println("已运行xlRead() : " + e );
26 }

27}

 设置单元格格式

  在这里,我们将只介绍一些和格式设置有关的语句,我们假定workbook就是对一个工作簿的引用。在Java中,第一步要做的就是创建和设置字体和单元格的格式,然后再应用这些格式:

    

    1、创建字体,设置其为红色、粗体:

1HSSFFont font = workbook.createFont();
2font.setColor(HSSFFont.COLOR_RED);
3font.setBoldweight(HSSFFont.BOLDWEIGHT_BOLD);

 

    2、创建格式

1HSSFCellStyle cellStyle= workbook.createCellStyle();
2cellStyle.setFont(font);

 
    3、应用格式 

 

1HSSFCell cell = row.createCell((short0);
2cell.setCellStyle(cellStyle);
3cell.setCellType(HSSFCell.CELL_TYPE_STRING);
4cell.setCellValue("标题 ");

 

    总之,如本篇文章所演示的一样,Java程序员不必担心Excel工作表中的数据了,利用Jakarta POI API我们就可以轻易的在程序中存取Excel文档。

 

    总结说说现在我所知道的Java编辑Excel文件的两大开源工具:

    jakarta POIJavaExcelAPI(简称JXL),这两套工具我都试用了一这段时间,感觉各有优劣吧。POI在某些细节有些小Bug并且不支持写入图片,其他方面都挺不错的;

JXL就惨了,除了支持写入图片外,我暂时看不到它比POI好的地方,我碰到的主要的问题就是对公式支持不是很好,很多带有公式的Excel文件用JXL打开后,公式就丢失了(比如now(),today()),在网上看到其他大虾评论说JXL写入公式也有问题,另外,JXL操作Excel文件的效率比POI低一点。经过比较后,我选择了POI开发我的项目。

posted on 2011-07-04 16:10 何智 阅读(8301) 评论(1)  编辑  收藏 所属分类: Java Util

评论

# re: java的POI操作Excel文件 2013-10-17 17:54 八脚猪子

cell21.setEncoding(HSSFCell.ENCODING_UTF_16);
成功解决导出乱码问题..非常非常感谢  回复  更多评论   


只有注册用户登录后才能发表评论。


网站导航:
 
<2013年10月>
293012345
6789101112
13141516171819
20212223242526
272829303112
3456789

导航

统计

留言簿(1)

文章分类

文章档案

搜索

最新评论