比较两个 word 文档以发现差异是审查修改、确保准确性及内容协作时的一项关键任务。此过程使您能够识别不同文档版本间所做的添加、删除和修改。通过比较版本,您可以高效地追踪变更、验证更新并维护文档的完整性。本文将向您介绍如何使用 spire.doc for python 比较两个 word 文档。
安装 spire.doc for python
本教程需要 spire.doc for python 和 plum-dispatch v1.7.4。您可以通过以下 pip 命令将它们轻松安装到 windows 中。
pip install spire.doc
如果您不确定如何安装,请参考此教程: 如何在 windows 中安装 spire.doc for python
python 比较两个 word 文档
ms word 自带“比较”功能,可直接对比文档的两个版本,并生成一份突出显示两者差异的新文档。使用 spire.doc for python 提供的 document.compare() 方法可以实现类似的对比。以下是详细步骤:
- 创建第一个 document 类的对象并加载原始文档。
- 创建第二个 document 类的对象并加载修订文档。
- 调用 document.compare(document:'document',author:str) 方法将两个文档进行对比。
- 调用 document.savetofile() 方法保存比较后的文档。
- python
from spire.doc import *
# 初始化document对象并加载第一个word文档
firstdoc = document("会议通知a.docx")
# 初始化document对象并加载第二个word文档
seconddoc = document("会议通知b.docx")
# 对比两个文档并指定比较结果中差异标注的作者名称
firstdoc.compare(seconddoc, "冰蓝科技")
# 保存比较后的文档
firstdoc.savetofile("对比文档1.docx", fileformat.docx2016)
# 释放资源
firstdoc.dispose() seconddoc.dispose()
python 比较两个 word 文档时设置比较选项
当您的目标是专注于文本内容的变动而非格式时,无格式比较 word 文档就显得尤为实用。spire.doc for python 为此提供了 compareoptions 类,其中包含一个 ignoreformatting 属性,将其设定为 true 即可忽视所有格式变化。在执行 compare() 方法之际,只需将配置了该属性的 compareoptions 对象作为参数传递,系统即会按需执行比较操作,确保只凸显文本差异。下面是具体的操作步骤:
- 创建第一个 document 类的对象并加载原始文档。
- 创建第二个 document 类的对象并加载修订文档。
- 创建 compareoptions 对象并设置 ignoreformatting 属性为 true 以忽略格式比较。
- 调用 compare(document:'document',author:str, options:compareoptions) 方法比较两个文档。
- 使用 document.savetofile() 方法保存文档。
- python
from spire.doc import *
# 初始化document对象并加载第一个word文档
firstdoc = document("会议通知a.docx")
# 初始化document对象并加载第二个word文档
seconddoc = document("会议通知b.docx")
# 设置比较选项以忽略格式比较
compareoptions = compareoptions() compareoptions.ignoreformatting = true
# 对比文档
firstdoc.compare(seconddoc, "冰蓝科技", compareoptions)
# 保存比较后的结果
firstdoc.savetofile("对比文档2.docx", fileformat.docx2016)
# 释放资源
firstdoc.dispose() seconddoc.dispose()
申请临时 license
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用javascript。获取有效期 30 天的临时许可证。