# coding=utf-8

# start
# 1、获取当前文件夹下所有excel文件名:excels
# 2、获取其中某个excel文件的所有sheet名:sheets
# 3、以第一个excel文件为基础创建一个新的excel:result.xlsx
# 4、for each_sheet in sheets:
# 	4.1 for each_excel in excels[1,n]:
# 		4.1.1 读取each_excel中名为each_excel的内容
# 		4.1.2 以df格式获取数据
# 		4.1.3 将数据以追加的模式写入到新的excel的each_sheet中
# end

import pandas
import pandas as pd
import xlrd
import os
import shutil
from openpyxl import load_workbook

# 存放要合并数据的文件夹路径
path = "C:/Users/**/export/data/"


# 要合并文件路径
def get_excels():
    xlsx_names = [x for x in os.listdir(path) if x.endswith(".xlsx")]
    return xlsx_names


# 获取某个excel的sheet
def get_sheets():
    excels = get_excels()
    first_excel = excels[0]
    first_excel_path = path + first_excel
    xl = pandas.ExcelFile(first_excel_path)
    sheet_names = xl.sheet_names
    # df = xl.parse(sheet_names)
    return sheet_names


def meger_files():
    # 1、获取当前文件夹下所有excel文件名:excels
    excels = get_excels()
    # 2、获取其中某个excel文件的所有sheet名:sheets
    sheets = get_sheets()
    # 3、以第一个excel文件为基础创建一个新的excel:result
    first_excel = excels[0]
    first_excel_path = path + first_excel
    shutil.copyfile(first_excel_path, "result.xlsx")

    # 4/4.1 两层循环遍历所有sheet,及以同个sheet命名的所有excel中的数据
    for each_sheet in sheets:
        print each_sheet
        for i in range(1, len(excels)):
            each_excel_path = path + excels[i]
            xl = pandas.ExcelFile(each_excel_path)
            df = xl.parse(each_sheet)
            # print df

            # 读取当前结果文件当前sheet
            df1 = pd.DataFrame(pd.read_excel('result.xlsx', sheet_name=each_sheet))
            writer = pd.ExcelWriter('result.xlsx', engine='openpyxl')
            book = load_workbook('result.xlsx')
            writer.book = book
            # 复制excel的所有表
            writer.sheets = dict((ws.title, ws) for ws in book.worksheets)
            # 获取当前数据的最大行数
            df_rows = df1.shape[0]
            # 在最大行数后面追加数据,去掉行列索引
            df.to_excel(writer, sheet_name=each_sheet, startrow=df_rows + 1, index=False, header=False)
            writer.save()


if __name__ == '__main__':
    meger_files()

 输入:a.xlsx b.xlsx c.xlsx

 

 

 输出:result.xlsx

 

 

Logo

为开发者提供学习成长、分享交流、生态实践、资源工具等服务,帮助开发者快速成长。

更多推荐