要获取 pdf 文件的页数,可以在 adobe 等 pdf 阅读器中打开 pdf 文件,这些阅读器都有内置的页数统计功能。然而,当有一批 pdf 文件时,打开每个文件检查其包含的页数是一项耗时的任务。在本文中,您将学习如何通过使用 spire.pdf for python 在 python 中获取 pdf 文件的页数。
安装 spire.pdf for python
本教程需要 spire.pdf for python 和 plum-dispatch v1.7.4。您可以通过以下 pip 命令将它们轻松安装到 vs code 中。
pip install spire.pdf
如果您不确定如何安装,请参阅此教程: 如何在 vs code 中安装 spire.pdf for python
python 获取 pdf 文件的页数
spire.pdf for python 提供了 pdfdocument.pages.count 属性,可在不打开 pdf 文件的情况下快速获取其页数。具体步骤如下:
- 创建一个 pdfdocument 对象。
- 使用 pdfdocument.loadfromfile() 方法加载 pdf 文档。
- 使用 pdfdocument.pages.count 属性获取 pdf 文档的页数。
- 将结果直接打印出来或写入 txt 文件。
- python
from spire.pdf.common import *
from spire.pdf import *
def appendtext(fname: str, text: str):
fp = open(fname, "w")
fp.write(text "\n")
fp.close()
# 指定输入和输出文件
inputfile = "lshort-zh-cn.pdf"
outputfile = "文档页码总数.txt"
# 创建一个pdfdocument对象
pdf = pdfdocument()
# 加载指定的pdf文档
pdf.loadfromfile(inputfile)
# 获取文档的总页数
count = pdf.pages.count
# 输出文档总页数信息
print("总页数:", count)
# 写入页数信息到txt文件
appendtext(outputfile, "文档总页数: " str(count))
pdf.close()
申请临时 license
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用javascript。获取有效期 30 天的临时许可证。