zotero是一款免费易用的开源文献管理工具。有时候为了更方便的分享文献,需要将某个文献集合(分类)中条目所关联的PDF文件导出来。文献少的时候尚可逐个手动导出,但对于大量文献的情况,zotero目前并不支持批量导出功能。本文提供一个python批处理脚本来解决这一问题。脚本的基本原理是利用zotero生成的csv描述文件自动从zotero存储库复制相应的PDF文件,保存到指定的文件夹。

2022.9 更新

新版zotero已添加导出功能
在这里插入图片描述

Zotero CSV描述文件的导出方法

在这里插入图片描述
在这里插入图片描述
导出的csv文件包含每条文献的全部信息,其中的File Attachments字段记录着每条文献所属PDF文件的保存路径,通过脚本遍历该CSV文件即可实现PDF文件的批量导出。

脚本

zoteroPdfExport.py:

import csv
import argparse
import pathlib
import shutil

parser = argparse.ArgumentParser(
    description='Copy PDFs from Zotero to the given destination.')
parser.add_argument('-c', '--csv', type=pathlib.Path,
                    required=True, help='CSV file exported from Zotero')
parser.add_argument('-d', '--dest', type=pathlib.Path,
                    default='./', help='Destination folder for the PDFs')

args = parser.parse_args()

copySuccess = 0
copyFail = 0

with open(args.csv.absolute(), newline='', encoding='utf-8-sig') as csvfile:
    cr = csv.DictReader(csvfile)
    for row in cr:
        print("Copying... {}".format(row["File Attachments"]))
        try:
            shutil.copy(row["File Attachments"], args.dest.absolute())
            copySuccess = copySuccess+1
        except:
            copyFail = copyFail + 1

print("Done. {} Succeed, {} Failed.".format(copySuccess, copyFail))

脚本使用方法

python ./zoteroPdfExport.py -c xxx.csv -d ./pdfs

参数:

  • -c (--csv) 从zotero导出的分类描述文件(csv格式)
  • -d (--dest) PDF文件的目标路径,默认为当前文件夹

参数说明详见:

python ./zoteroPdfExport.py --help
Logo

华为开发者空间,是为全球开发者打造的专属开发空间,汇聚了华为优质开发资源及工具,致力于让每一位开发者拥有一台云主机,基于华为根生态开发、创新。

更多推荐