海上月明

editer by sun
posts - 162, comments - 51, trackbacks - 0, articles - 8
   :: 首页 :: 新随笔 ::  :: 聚合  :: 管理

PYTHON与EXCEL:openpyxl 读写excel2007

Posted on 2014-11-21 09:34 pts 阅读(3858) 评论(0)  编辑  收藏 所属分类: Python

【FROM】

http://blog.csdn.net/suofiya2008/article/details/6284208

有一万年没来这儿写blog了,今天等着发版,抽空来写点东西吧。

python有很多模块都是用来操作excel的,比如xlrd,xlwt,pyExcelerator。用着很方便,但是问题是,只能支持到 excel2003。虽然一般的应用其实足够了,但是如果遇到了导出大量数据(超过65535条)的需求时,excel2003就不够用了。所以我就只好 去找一个能支持excel2007的模块。

google了一下,发现了这个openpyxl,不过网上也没什么中文的文档可以看,于是就自己琢磨琢磨。

I.安装

openpyxl的最新版本是1.5.0 下载地址 http://pypi.python.org/pypi/openpyxl/1.5.0

需求python的版本是2.6+  ,也就是说,如果centOS系统的机器想用,那得升级系统的python。。。

安装就是解压缩,然后cd到目录,然后

python setup.py install

你懂的~

 II.读取excel2007文件

  1. #-*- coding:utf-8 -*   
  2.   
  3. from  openpyxl.reader.excel  import  load_workbook  
  4. import  MySQLdb  
  5. import  time  
  6.   
  7. #开始时间   
  8. startTime = time.time()  
  9.   
  10. #读取excel2007文件   
  11. wb = load_workbook(filename = r'empty_book.xlsx' )  
  12.   
  13. #显示有多少张表   
  14. print   "Worksheet range(s):" , wb.get_named_ranges()  
  15. print   "Worksheet name(s):" , wb.get_sheet_names()  
  16.   
  17. #取第一张表   
  18. sheetnames = wb.get_sheet_names()  
  19. ws = wb.get_sheet_by_name(sheetnames[0 ])  
  20.   
  21. #显示表名,表行数,表列数   
  22. print   "Work Sheet Titile:" ,ws.title  
  23. print   "Work Sheet Rows:" ,ws.get_highest_row()  
  24. print   "Work Sheet Cols:" ,ws.get_highest_column()  
  25.   
  26.   
  27. # 建立存储数据的字典    
  28. data_dic = {}   
  29.   
  30. #把数据存到字典中   
  31. for  rx  in  range(ws.get_highest_row()):  
  32.       
  33.     temp_list = []  
  34.     pid = ws.cell(row = rx,column = 0 ).value  
  35.     w1 = ws.cell(row = rx,column = 1 ).value  
  36.     w2 = ws.cell(row = rx,column = 2 ).value  
  37.     w3 = ws.cell(row = rx,column = 3 ).value  
  38.     w4 = ws.cell(row = rx,column = 4 ).value  
  39.     temp_list = [w1,w2,w3,w4]  
  40.      
  41.     data_dic[pid] = temp_list  
  42.   
  43. #打印字典数据个数   
  44. print   'Total:%d'  %len(data_dic)  

  1. #-*- coding:utf-8 -*  
  2. from openpyxl.reader.excel import load_workbook  
  3. import MySQLdb  
  4. import time  
  5. #开始时间  
  6. startTime = time.time()  
  7. #读取excel2007文件  
  8. wb = load_workbook(filename = r'empty_book.xlsx')  
  9. #显示有多少张表  
  10. print "Worksheet range(s):", wb.get_named_ranges()  
  11. print "Worksheet name(s):", wb.get_sheet_names()  
  12. #取第一张表  
  13. sheetnames = wb.get_sheet_names()  
  14. ws = wb.get_sheet_by_name(sheetnames[0])  
  15. #显示表名,表行数,表列数  
  16. print "Work Sheet Titile:",ws.title  
  17. print "Work Sheet Rows:",ws.get_highest_row()  
  18. print "Work Sheet Cols:",ws.get_highest_column()  
  19. # 建立存储数据的字典   
  20. data_dic = {}   
  21. #把数据存到字典中  
  22. for rx in range(ws.get_highest_row()):  
  23.       
  24.     temp_list = []  
  25.     pid = ws.cell(row = rx,column = 0).value  
  26.     w1 = ws.cell(row = rx,column = 1).value  
  27.     w2 = ws.cell(row = rx,column = 2).value  
  28.     w3 = ws.cell(row = rx,column = 3).value  
  29.     w4 = ws.cell(row = rx,column = 4).value  
  30.     temp_list = [w1,w2,w3,w4]  
  31.      
  32.     data_dic[pid] = temp_list  
  33. #打印字典数据个数  
  34. print 'Total:%d' %len(data_dic)  

 

   

 注意的是ws.cell()方法,支持的参数有两种,cell( coordinate=None , row=None , column=None)

coordinate坐标,eg  ws.cell("B1")

row 和 column 是行和列 ,都是从0开始

还有,如果想取得格里的值,得用ws.cell("A1").value 取到,如果用过xlrd,因为写法差不多,可能就会忘记加value了。

III.写入excel2007

 

  1. 写excel2007  
  2.   
  3. #-*- coding:utf-8 -*   
  4.   
  5.   
  6. import  MySQLdb  
  7. import  time  
  8. import  sys  
  9. #workbook相关   
  10. from  openpyxl.workbook  import  Workbook  
  11. #万恶的ExcelWriter,妹的封装好了不早说,封装了很强大的excel写的功能   
  12. from  openpyxl.writer.excel  import  ExcelWriter  
  13. #一个eggache的数字转为列字母的方法   
  14. from  openpyxl.cell  import  get_column_letter  
  15.   
  16.   
  17. #新建一个workbook   
  18.   
  19. wb = Workbook()  
  20. #新建一个excelWriter   
  21. ew = ExcelWriter(workbook = wb)  
  22.   
  23. #设置文件输出路径与名称   
  24. dest_filename = r'empty_book.xlsx'   
  25.   
  26. #第一个sheet是ws   
  27. ws = wb.worksheets[0 ]  
  28.   
  29. #设置ws的名称   
  30. ws.title = "range names"    
  31.   
  32.   
  33. #录入数据,注意col是数字转字母,然后需要限定%s(string型)当参数传到ws.cell()方法中去,records可以想象为一个从数据库里查询出来的数据集合   
  34. i=1   
  35. table = {}  
  36. for  record  in  records:  
  37.     for  x  in  range( 1 ,len(record)+ 1 ):  
  38.         col = get_column_letter(x)  
  39.         ws.cell('%s%s' %(col, i)).value =  '%s'  % (record[x- 1 ])        
  40.               
  41.     i+=1   
  42.   
  43. #又建了一个sheet,ws名字都没变,太省了。。。但是确实是一个新的sheet,不会影响之前那个sheet的东西   
  44. ws = wb.create_sheet()  
  45.   
  46. ws.title = 'Pi'   
  47.   
  48. ws.cell('F5' ).value =  3.14   
  49.   
  50.       
  51. #写文件   
  52. ew.save(filename = dest_filename)  

  1. 写excel2007  
  2. #-*- coding:utf-8 -*  
  3. import MySQLdb  
  4. import time  
  5. import sys  
  6. #workbook相关  
  7. from openpyxl.workbook import Workbook  
  8. #万恶的ExcelWriter,妹的封装好了不早说,封装了很强大的excel写的功能  
  9. from openpyxl.writer.excel import ExcelWriter  
  10. #一个eggache的数字转为列字母的方法  
  11. from openpyxl.cell import get_column_letter  
  12. #新建一个workbook  
  13. wb = Workbook()  
  14. #新建一个excelWriter  
  15. ew = ExcelWriter(workbook = wb)  
  16. #设置文件输出路径与名称  
  17. dest_filename = r'empty_book.xlsx'  
  18. #第一个sheet是ws  
  19. ws = wb.worksheets[0]  
  20. #设置ws的名称  
  21. ws.title = "range names"   
  22. #录入数据,注意col是数字转字母,然后需要限定%s(string型)当参数传到ws.cell()方法中去,records可以想象为一个从数据库里查询出来的数据集合  
  23. i=1  
  24. table = {}  
  25. for record in records:  
  26.     for x in range(1,len(record)+1):  
  27.         col = get_column_letter(x)  
  28.         ws.cell('%s%s'%(col, i)).value = '%s' % (record[x-1])        
  29.               
  30.     i+=1  
  31. #又建了一个sheet,ws名字都没变,太省了。。。但是确实是一个新的sheet,不会影响之前那个sheet的东西  
  32. ws = wb.create_sheet()  
  33. ws.title = 'Pi'  
  34. ws.cell('F5').value = 3.14  
  35.       
  36. #写文件  
  37. ew.save(filename = dest_filename)  

 

 注意的地方:

# col是用列号x为参数,调用了这个模块的get_column_letter方法算出来的字母,这个比较蛋疼。

    col = get_column_letter(x)

 

#在为数据格赋值的时候,注意写的格式:要不会有各种不靠谱的问题出现(这个是用坐标的方式写的,其实用row ,col的方式可能没那么麻烦)

    ws.cell( '%s%s'%(col, i) ).value = '%s' % (record[x-1])

关于该模块的API  可以查询官方文档   http://packages.python.org/openpyxl/api.html

总体来说,这个模块还是挺方便的,但是问题就是在对于python的版本有一定要求,如果在centOs上用,可能会有些问题。

本文只是简单的写了下使用的方法,之后格式超链接神马的之后再填上~


只有注册用户登录后才能发表评论。


网站导航: