word 文档中的每个段落都有意或无意地使用着某一种段落样式。段落样式可以是内置样式,例如标题1和标题2,也可以是自定义样式。本文介绍了如何使用 spire.doc for java 提取使用特定样式的段落。
下表列出了ms word中的样式名称及其在 spire.doc 中的对应名称。简单判断的原则是编程返回的样式名称不包含空格。
ms word 的样式名称 | spire.doc 的样式名称 |
title | title |
subtitle | subtitle |
heading 1 | heading1 |
heading 2 | heading2 |
heading 3 | heading3 |
no spacing | nospacing |
quote | quote |
intense quote | intensequote |
list paragraph | listparagraph |
normal | normal |
custom name | customname |
安装 spire.doc for java
首先,您需要在 java 程序中添加 spire.doc.jar 文件作为依赖项。jar 文件可以从 此链接 下载。 如果您使用 maven,则可以将以下代码添加到项目的 pom.xml 文件中,从而轻松地在应用程序中导入 jar 文件。
com.e-iceblue
e-iceblue
https://repo.e-iceblue.cn/repository/maven-public/
e-iceblue
spire.doc
4.11.8
提取使用特定样式的段落
您可以通过 paragraph.getstylename() 方法获取特定段落的样式名称。 如果段落的样式名称正好是您需要的,则可以使用 paragraph.gettext() 方法获取段落内容。以下是提取使用特定样式段落的步骤。
- 加载示例 word 文档,初始化 document 对象。
- 循环遍历文档各个节。
- 使用 section.getparagraphs().get() 方法从其中某个节获取特定段落。
- 使用 paragraph.getstylename() 方法获取段落的样式名称并确定样式是否为“标题 1”。
- 如果是,则使用 paragraph.gettext() 方法提取段落的文本。
- java
import com.spire.doc.document;
import com.spire.doc.documents.paragraph;
public class getparagraphbystylename {
public static void main(string[] args) {
//在初始化document对象时加载示例word文档
document doc = new document("c:\\users\\administrator\\desktop\\sample.docx");
//声明一个变量
paragraph paragraph;
//循环遍历各个节
for (int i = 0; i < doc.getsections().getcount(); i ) {
//循环遍历特定节的段落
for (int j = 0; j < doc.getsections().get(i).getparagraphs().getcount(); j ) {
//获取特定段落
paragraph = doc.getsections().get(i).getparagraphs().get(j);
//确定段落样式是否为“heading 1”
if (paragraph.getstylename().equals("heading1")) {
//获取“heading1”中段落的文本
system.out.println("heading 1: " paragraph.gettext() "\n");
}
//判断段落样式是否为“my custom style”
if (paragraph.getstylename().equals("mycustomstyle")) {
//获取“my custom style”中的段落文本
system.out.println("my custom style: " paragraph.gettext());
}
}
}
}
}
申请临时 license
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请 该email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用javascript。 获取有效期 30 天的临时许可证。