以下经验内容分享通过Java 程序将PDF文档转为Html的方法。
工具/原料
Free Spire.PDF for Java (免费版)
IDEA
jar文件导入:
1、方法1. 可在E-iceblue官网下载Free Spire.PDF for Java包,下载后,解压,将lib文件夹下的Spir髫潋啜缅e.Pdf.jar文件导入Java程序;方法2. 或者在Maven项目中配置pom.xml文件(即指定Maven仓库路径和Spire.Pdf.free的依赖),如下配置:<repositories> <repository> <id>com.e-iceblue</id> <url>http://repo.e-iceblue.cn/repository/maven-public/</url> </repository></repositories><dependencies> <dependency> <groupId>e-iceblue</groupId> <artifactId>spire.pdf.free</artifactId> <version>3.9.0</version> </dependency></dependencies>
Java 代码示例
1、import com.spire.pdf.*;public class PDFtoHtml { public static void main(String[] args) { //瑕铆幌约加载PDF测试文档 PdfDocument pdf = new PdfDocument(); pdf.loadFromFile("sample.pdf"); //保存为html格式的文件 pdf.saveToFile("PDFtoHtml.html",FileFormat.HTML); pdf.dispose(); }}
2、文档转换前后对比,如下图: