Pandas是Python处理数据最好用的工具包。处理好了的数据,也可以写回到原来的或新的Excel文件。但如果处理结果要写入到多张表,就要注意了。

用Pandas把DataFrame数据写入Excel文件,一般使用to_excel方法:

df.to_excel(target_filename, sheet_name)

但如果你有多张表要写入,上述方法永远是后一张表覆盖掉前一张表。即使每次修改sheet_name也不行。比如下面的代码:

df1.to_excel(target_file, sheet_name='sheet1')
df2.to_excel(target_file, sheet_name='sheet2')
df3.to_excel(target_file, sheet_name='sheet3')

最终得到的文件target_file中只有sheet3存在,而sheet1sheet2被相继覆盖掉了。

网上搜来的大部分文章,给出的解决方法都比较复杂。这里介绍一种比较简单的方法:

一、全新文件的写入方法

假如你有多张表要写入到一个全新的文件中,方法非常简单,多使用一个叫ExcelWriter的方法即可。例如:

import pandas as pd
 
# 假定你已经有两个DF数据块:df1和df2
 
writer = pd.ExcelWriter('test_new.xlsx')
df1.to_excel(writer, sheet_name='sheet1')
df2.to_excel(writer, sheet_name='sheet2')
writer.save() 

注意最后需要一条专门的wrtier.save()语句保存文件。

这样你获得的新文件中就有两张表了。

二、已有文件增加Sheet的方法

假如你已经有一个Excel文件,里面已经有一张或多张表,现在需要把新的DataFrame数据存入到该文件中,但不能覆盖原有的表。

此时需要使用openpyxl库。示例:

import pandas as pd
from openpyxl import 
 
# 假定你已经有一个新的DF数据块:df
 
writer = pd.ExcelWriter('test_exist.xlsx', engin='openpyxl')
book = load_workbook(writer.path)
writer.book = book
df.to_excel(excel_writer=writer, sheet_name='sheet3')
writer.save()

这样无论你原来的文件中有几张表,都能获得一张新的名为sheet3的表。

更多内容可参考此文:

Working with Python Pandas and XlsxWriter​

xlsxwriter.readthedocs.io/working_with_pandas.html正在上传…重新上传取消

Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐