html 是创建网页的标准标记语言,而 pdf 则是一种广泛应用于各种平台和场景的文档格式。由于 pdf 格式的适用范围更广,通过将 html 转换为 pdf,用户可以轻松创建适合打印的文档、离线共享网页内容以及生成各种报告等。本文将介绍如何使用 spire.doc for python 在 python 程序中将 html 文件或 html 字符串转换为 pdf。
安装 spire.doc for python
本教程需要用到 spire.doc for python 和 plum-dispatch v1.7.4。可以通过以下 pip 命令将它们轻松安装到 vs code 中。
pip install spire.doc
如果您不确定如何安装,请参考:如何在 vs code 中安装 spire.doc for python
用 python 将 html 文件转换为 pdf
document.loadfromfile() 方法不仅支持加载 doc 或 docx 文件,还支持加载 html 文件。开发者可以使用该方法加载 html 文件,并使用 document.savetofile() 方法将其保存为 pdf 文件。以下是操作步骤:
- 创建一个 document 类的对象。
- 使用 document.loadfromfile() 方法加载 html 文件。
- 使用 document.savetofile() 方法将文档转换为 pdf 并保存。
- python
from spire.doc import document
from spire.doc import fileformat
from spire.doc import xhtmlvalidationtype
# 创建document类的对象
doc = document()
# 载入html文件
doc.loadfromfile("示例.html", fileformat.html, xhtmlvalidationtype.none)
# 将html文件转换为pdf文件并保存
doc.savetofile("output/html转pdf.pdf", fileformat.pdf)
doc.close()
用 python 将 html 字符串转换为 pdf
spire.doc for python 中的 paragraph.appendhtml() 方法可以解析简单的的 html 字符串(通常是文本及其格式)并呈现在 word 文档页面上。通过该方法解析并呈现 html 字符串后,再使用 document.savetofile() 方法将 word 文档保存为 pdf 文件,即可实现 html 字符串到 pdf 文档的转换。以下是详细操作步骤:
- 创建一个 document 类的对象。
- 使用 document.addsection() 方法添加一个节到文档。
- 使用 section.addparagraph() 方法添加一个段落到节。
- 指定 html 字符串。
- 使用 paragraph.appendhtml() 方法将 html 字符串呈现在段落中。
- 使用 document.savetofile() 方法将文档转换为 pdf 文档并保存。
- python
from spire.doc import document
from spire.doc import fileformat
# 创建document类的对象
doc = document()
# 添加一个节到文档
sec = doc.addsection()
# 添加一个段落到节
par = sec.addparagraph()
# 指定html字符串
htmlstring = """
旅游统计信息
python 将 html 转换为 pdf-k8凯发天生赢家
以下是一些旅游方面的统计信息:
热门旅游目的地
- 巴黎
- 罗马
- 东京
- 纽约
旅游收入排行榜
国家
收入(亿美元)
法国
79.5
美国
76.9
西班牙
67.7
意大利
58.3
"""
# 将html字符串所展示的内容插入到段落中
par.appendhtml(htmlstring)
# 将文档转换为pdf文件并保存
doc.savetofile("output/html字符串转pdf.pdf", fileformat.pdf)
doc.close()
申请临时 license
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用javascript。获取有效期 30 天的临时许可证。