在python自动化中,经常会遇到对数据文件的操作,比如添加多名员工,但是直接将员工数据写在python文件中,不但工作量大,要是以后再次遇到类似批量数据操作还会写在python文件中吗?
应对这一问题,可以将数据写excel文件,针对excel 文件进行操作,完美解决。
本文仅介绍python对excel的操作
安装xlrd 库
xlrd库 官方地址:
pip install xlrd
笔者在安装时使用了 pip3 install xlrd
原因:笔者同时安装了python2 和 python3
如果pip的话会默认将库安装到python2中,python3中不能直接调用。
那么到底是使用pip 还是pip3进行安装呢?
如果系统中只安装了Python2,那么就只能使用pip。
如果系统中只安装了Python3,那么既可以使用pip也可以使用pip3,二者是等价的。
如果系统中同时安装了Python2和Python3,则pip默认给Python2用,pip3指定给Python3用。
Xlrd 库简单的使用
以如下excel文件为例进行操作
文件名为demo,有两个sheet,名为工作表1和工作表2
工作表1中有如下数据
简单的使用
12345678910111213141516171819202122232425262728293031323334
# coding=utf-8 import xlrd # 打开文件data = xlrd.open_workbook('file/demo.xlsx') # 查看工作表data.sheet_names()print("sheets:" + str(data.sheet_names())) # 通过文件名获得工作表,获取工作表1table = data.sheet_by_name('工作表1') # 打印data.sheet_names()可发现,返回的值为一个列表,通过对列表索引操作获得工作表1# table = data.sheet_by_index(0) # 获取行数和列数# 行数:table.nrows# 列数:table.ncolsprint("总行数:" + str(table.nrows))print("总列数:" + str(table.ncols)) # 获取整行的值 和整列的值,返回的结果为数组# 整行值:table.row_values(start,end)# 整列值:table.col_values(start,end)# 参数 start 为从第几个开始打印,# end为打印到那个位置结束,默认为noneprint("整行值:" + str(table.row_values(0)))print("整列值:" + str(table.col_values(1))) # 获取某个单元格的值,例如获取B3单元格值cel_B3 = table.cell(3,2).valueprint("第三行第二列的值:" + cel_B3)
coding=utf-8
import xlrd
打开文件
data = xlrd.open_workbook(‘file/demo.xlsx’)
查看工作表
data.sheet_names()
print(“sheets:” + str(data.sheet_names()))
通过文件名获得工作表,获取工作表1
table = data.sheet_by_name(‘工作表1’)
打印data.sheet_names()可发现,返回的值为一个列表,通过对列表索引操作获得工作表1
table = data.sheet_by_index(0)
获取行数和列数
行数:table.nrows
列数:table.ncols
print(“总行数:” + str(table.nrows))
print(“总列数:” + str(table.ncols))
获取整行的值 和整列的值,返回的结果为数组
整行值:table.row_values(start,end)
整列值:table.col_values(start,end)
参数 start 为从第几个开始打印,
end为打印到那个位置结束,默认为none
print(“整行值:” + str(table.row_values(0)))
print(“整列值:” + str(table.col_values(1)))
获取某个单元格的值,例如获取B3单元格值
cel_B3 = table.cell(3,2).value
print(“第三行第二列的值:” + cel_B3)
运行后结果
项目中使用
获得所有的数据
1234567891011121314151617181920212223242526
# coding=utf-8 import xlrd def read_xlrd(excelFile): data = xlrd.open_workbook(excelFile) table = data.sheet_by_index(0) for rowNum in range(table.nrows): rowVale = table.row_values(rowNum) for colNum in range(table.ncols): if rowNum 0 and colNum == 0: print(int(rowVale[0])) else: print(rowVale[colNum]) print("---------------") # if判断是将 id 进行格式化 # print("未格式化Id的数据:") # print(table.cell(1, 0)) # 结果:number:1001.0 if __name__ == '__main__': excelFile = 'file/demo.xlsx' read_xlrd(excelFile=excelFile)
coding=utf-8
import xlrd
def read_xlrd(excelFile):
data = xlrd.open_workbook(excelFile)
table = data.sheet_by_index(0)
for rowNum in range(table.nrows):
rowVale = table.row_values(rowNum)
for colNum in range(table.ncols):
if rowNum 0 and colNum == 0:
print(int(rowVale[0]))
else:
print(rowVale[colNum])
print("---------------")
# if判断是将 id 进行格式化
# print("未格式化Id的数据:")
# print(table.cell(1, 0))
# 结果:number:1001.0
if name == ‘main‘:
excelFile = ‘file/demo.xlsx’
read_xlrd(excelFile=excelFile)
结果
如果在项目中使用则可将内容方法稍为做修改,获得所有的数据后,将每一行数据作为数组进行返回
1234567891011121314151617181920
# coding=utf-8 import xlrd def read_xlrd(excelFile): data = xlrd.open_workbook(excelFile) table = data.sheet_by_index(0) dataFile = [] for rowNum in range(table.nrows): # if 去掉表头 if rowNum 0: dataFile.append(table.row_values(rowNum)) return dataFile if __name__ == '__main__': excelFile = 'file/demo.xlsx' print(read_xlrd(excelFile=excelFile))
coding=utf-8
import xlrd
def read_xlrd(excelFile):
data = xlrd.open_workbook(excelFile)
table = data.sheet_by_index(0)
dataFile = []
for rowNum in range(table.nrows):
# if 去掉表头
if rowNum 0:
dataFile.append(table.row_values(rowNum))
return dataFile
if name == ‘main‘:
excelFile = ‘file/demo.xlsx’
print(read_xlrd(excelFile=excelFile))
结果
原文始发于: