python对Excel的读取
在 python 自动化中,经常会遇到对数据文件的操作,比如添加多名员工,但是直接将员工数据写在 python 文件中,不但工作量大,要是以后再次遇到类似批量数据操作还会写在 python 文件中吗?
应对这一问题,可以将数据写 excel 文件,针对 excel 文件进行操作,完美解决。
本文仅介绍 python 对 excel 的操作
安装 xlrd 库
xlrd 库 官方地址:https://pypi.org/project/xlrd/
pip install xlrd
笔者在安装时使用了 pip3 install xlrd
原因:笔者同时安装了 python2 和 python3
如果 pip 的话会默认将库安装到 python2 中,python3 中不能直接调用。
那么到底是使用 pip 还是 pip3 进行安装呢?
如果系统中只安装了 Python2,那么就只能使用 pip。
如果系统中只安装了 Python3,那么既可以使用 pip 也可以使用 pip3,二者是等价的。
如果系统中同时安装了 Python2 和 Python3,则 pip 默认给 Python2 用,pip3 指定给 Python3 用。
Xlrd 库简单的使用
以如下 excel 文件为例进行操作
文件名为 demo,有两个 sheet,名为工作表 1 和工作表 2
工作表 1 中有如下数据
简单的使用
# coding=utf-8import xlrd
# 打开文件
data = xlrd.open_workbook('file/demo.xlsx')# 查看工作表
data.sheet_names()
print("sheets:" + str(data.sheet_names()))# 通过文件名获得工作表, 获取工作表 1
table = data.sheet_by_name('工作表 1')# 打印 data.sheet_names() 可发现,返回的值为一个列表,通过对列表索引操作获得工作表 1
# table = data.sheet_by_index(0)# 获取行数和列数
# 行数:table.nrows
# 列数:table.ncols
print("总行数:" + str(table.nrows))
print("总列数:" + str(table.ncols))# 获取整行的值 和整列的值,返回的结果为数组
# 整行值:table.row_values(start,end)
# 整列值:table.col_values(start,end)
# 参数 start 为从第几个开始打印,
# end 为打印到那个位置结束,默认为 none
print("整行值:" + str(table.row_values(0)))
print("整列值:" + str(table.col_values(1)))# 获取某个单元格的值,例如获取 B3 单元格值
cel_B3 = table.cell(3,2).value
print("第三行第二列的值:" + cel_B3)
运行后结果
项目中使用
获得所有的数据
1 # coding=utf-8 2 3 import xlrd 4 5 def read_xlrd(excelFile): 6 data = xlrd.open_workbook(excelFile) 7 table = data.sheet_by_index(0) 8 9 for rowNum in range(table.nrows): 10 rowVale = table.row_values(rowNum) 11 for colNum in range(table.ncols): 12 if rowNum > 0 and colNum == 0: 13 print(int(rowVale[0])) 14 else: 15 print(rowVale[colNum]) 16 print("---------------") 17 18 # if 判断是将 id 进行格式化 19 # print("未格式化 Id 的数据:") 20 # print(table.cell(1, 0)) 21 # 结果:number:1001.0 22 23 24 if __name__ == '__main__': 25 excelFile = 'file/demo.xlsx' 26 read_xlrd(excelFile=excelFile)
结果
如果在项目中使用则可将内容方法稍为做修改,获得所有的数据后,将每一行数据作为数组进行返回
1 # coding=utf-8 2 3 import xlrd 4 5 def read_xlrd(excelFile): 6 data = xlrd.open_workbook(excelFile) 7 table = data.sheet_by_index(0) 8 dataFile = [] 9 10 for rowNum in range(table.nrows): 11 # if 去掉表头 12 if rowNum > 0: 13 dataFile.append(table.row_values(rowNum)) 14 15 return dataFile 16 17 18 if __name__ == '__main__': 19 excelFile = 'file/demo.xlsx' 20 print(read_xlrd(excelFile=excelFile))
结果