pdf 文件格式可以让文档在不同设备之间的呈现保持一致。但是,如果需要将 pdf 文档放到网页上,最好将它们转换为 html 文件。通过这种方式,文档的所有内容都可以直接显示在浏览器中,无需下载文件。并且加载大型 pdf 文档需要很长时间,而 html 文件可以非常快速地在浏览器中呈现。另外,相较于 pdf 文件,搜索引擎更容易抓取 html 网页以获取信息,这将增加您的网站曝光率。本文将展示如何使用 spire.pdf for java 将 pdf 文档转换为 html 文件。
安装 spire.pdf for java
首先,您需要在 java 程序中添加 spire.pdf.jar 文件作为依赖项。jar 文件可以从此链接下载。 如果您使用 maven,则可以将以下代码添加到项目的 pom.xml 文件中,从而在应用程序中导入 jar 文件。
com.e-iceblue
e-iceblue
https://repo.e-iceblue.cn/repository/maven-public/
e-iceblue
spire.pdf
9.9.6
将 pdf 文档转换为 html 文件
使用 spire.pdf for java 提供的 pdfdocument.savetofile(string filename, fileformat.html) 方法,可以直接将 pdf 文档转换为 html 文件。具体步骤如下。
- 创建 pdfdocument 的对象。
- 使用 pdfdocument.loadfromfile() 方法加载 pdf 文件。
- 使用 pdfdocument.savetofle() 方法将 pdf 文件另存为 html 文件。
- java
import com.spire.pdf.*;
public class convertpdftohtml {
public static void main(string[] args) {
//创建pdfdocument的对象
pdfdocument pdf = new pdfdocument();
//加载pdf文件
pdf.loadfromfile("示例文档.pdf");
//将pdf文件保存为html文件
pdf.savetofile("pdftohtml.html",fileformat.html);
pdf.close();
}
}
将 pdf 文档转换为嵌入 svg 的 html 文件
spire.pdf for java 还提供了 pdfdocument.getconvertoptions().setpdftohtmloptions(true) 方法,以便在转换时嵌入 svg。将 pdf 文件转换为嵌入 svg 的 html 文件的详细步骤如下。
- 创建 pdfdocument 的对象。
- 使用 pdfdocument.loadfromfile() 方法加载 pdf 文件。
- 使用 pdfdocument.getconvertoptions().setpdftohtmloptions(true) 方法启用嵌入 svg。
- 使用 pdfdocument.savetofle() 方法将 pdf 文件另存为 html 文件。
- java
import com.spire.pdf.*;
public class convertpdftohtmlembeddingsvg {
public static void main(string[] args) {
//创建pdfdocument的对象
pdfdocument doc = new pdfdocument();
//加载pdf文件
doc.loadfromfile("示例文档.pdf");
//设置嵌入svg
doc.getconvertoptions().setpdftohtmloptions(true);
//将pdf文件另存为html文件
doc.savetofile("pdftohtmlembeddingsvg.html", fileformat.html);
doc.close();
}
}
将 pdf 文档转换为 html 流
spire.pdf for java 还支持将 pdf 文档转换为 html 流。具体步骤如下。
- 创建 pdfdocument 的对象。
- 使用 pdfdocument.loadfromfile() 方法加载 pdf 文件。
- 使用 pdfdocument.savetostream() 方法将 pdf 文件保存为 html 流。
- java
import com.spire.pdf.*;
import java.io.*;
public class convertpdftohtmlstream {
public static void main(string[] args) throws filenotfoundexception {
//创建pdfdocument的对象
pdfdocument pdf = new pdfdocument();
//加载pdf文件
pdf.loadfromfile("示例文档.pdf");
//将pdf文件另存为html流
file outfile = new file("pdftohtmlstream.html");
outputstream outputstream = new fileoutputstream(outfile);
pdf.savetostream(outputstream, fileformat.html);
pdf.close();
}
}
申请临时 license
如果您希望删除结果文档中的评估消息,或者摆脱功能限制,请该email地址已收到反垃圾邮件插件保护。要显示它您需要在浏览器中启用javascript。获取有效期 30 天的临时许可证。