如何批量根据内容重命名 PDF 文件?
财务、HR 或行政人员在日常办公中,经常会收到一大批以乱码或无规律数字命名的发票、合同或简历。逐一打开、复制文件名、再重命名的效率很低。本文将展示如何通过 Python 脚本实现批量文本提取和重命名,以及如何使用直观的在线自动化工具轻松完成。
方案一:使用 Python 脚本提取文本并批量重命名
如果您掌握基础的代码运行环境,可以通过调用 Python 脚本与第三方 PDF 库(如 pypdf)来对文档内容进行读取和重命名操作:
- 在您的终端(Terminal)或命令行中,运行以下命令以配置所需的扩展包:
pip install pypdf - 创建一个新的文本文件,并将其命名为
rename_pdfs.py,随后输入以下示例脚本:import os from pypdf import PdfReader def batch_rename_pdfs(folder_path): for filename in os.listdir(folder_path): if filename.endswith(".pdf"): file_path = os.path.join(folder_path, filename) try: # 读取 PDF 内容 reader = PdfReader(file_path) # 获取第一页的全部文字内容 first_page_text = reader.pages[0].extract_text() # 智能提取第一行不为空的内容作为新的文件名称 lines = [line.strip() for line in first_page_text.split('\n') if line.strip()] if lines: new_name = lines[0][:50] # 提取前 50 个字符 new_filename = f"{{new_name}}.pdf" # 过滤和清洗在操作系统中非法的字符 for char in ['/', '\\', ':', '*', '?', '"', '<', '>', '|']: new_filename = new_filename.replace(char, "_") new_file_path = os.path.join(folder_path, new_filename) os.rename(file_path, new_file_path) print(f"重命名成功: {{filename}} -> {{new_filename}}") except Exception as e: print(f"解析文件出错 {{filename}}: {{e}}") # 配置您的待处理文件夹路径并启动重命名函数 batch_rename_pdfs("./my_invoice_folder") - 在控制台中运行该 Python 脚本,以批量将文件夹内的所有 PDF 重命名完毕。
替代方案:使用优页 (UniPagePDF) 可视化批量重命名
编写 Python 代码需要电脑上拥有编程环境,且对不具有编程基础的办公人员有一定门槛。作为更直观、免配置的替代方案,优页提供了一套完备的网页端批量重命名系统:
- 将数十个需要更名的 PDF 文档直接批量拖入优页界面。
- 工具会启动浏览器本地解析技术,自动提取并在界面列表里列出每个文件的首行文本或关键标题作为参考名称。
- 您可以在表格列表中预览新名称,并根据实际情况快速手动微调。
- 确认完毕后,点击一键打包,您将直接下载包含全部已命名文件的 ZIP 压缩包。