以下经验内容分享通过Java程序将PDF文档转为Html的方法。
工具/原料
FreeSpire.PDFforJava(免费版)
IDEA
jar文件导入:
1、方法1.可在E-iceblue官网下载FreeS圬桦孰礅pire.PDFforJava包,下载后,解压,将lib文件夹下的Spir髫潋啜缅e.Pdf.jar文件导入Java程序;方法2.或者在Maven项目中配置pom.xml文件(即指定Maven仓库路径和Spire.Pdf.free的依赖),如下配置:<repositories><repository><id>com.e-iceblue</id><url>http://repo.e-iceblue.cn/repository/maven-public/</url></repository></repositories><dependencies><dependency><groupId>e-iceblue</groupId><artifactId>spire.pdf.free</artifactId><version>3.9.0</version></dependency></dependencies>
Java代码示例
1、importcom饱终柯肢.spire.pdf.*;publicclassPDFtoHtml{publicstaticvoidmain(String[]args){//瑕铆幌约加载PDF测试文档PdfDocumentpdf=newPdfDocument();pdf.loadFromFile("sample.pdf");//保存为html格式的文件pdf.saveToFile("PDFtoHtml.html",FileFormat.HTML);pdf.dispose();}}
2、文档转换前后对比,如下图: