标签:java word io new pdf import stripper pdfFile
1 import java.io.File; 2 import java.io.FileOutputStream; 3 import java.io.IOException; 4 import java.io.OutputStreamWriter; 5 import java.io.Writer; 6 7 import org.apache.pdfbox.pdmodel.PDDocument; 8 import org.apache.pdfbox.util.PDFTextStripper; 9 10 public class PdfToWord{ 11 public static void main(String[] args){ 12 try{ 13 String pdfFile = "C:/xxxxx.pdf"; 14 PDDocument doc = PDDocument.load(new File(pdfFile)); 15 int pagenumber = doc.getNumberOfPages(); 16 pdfFile = pdfFile.substring(0, pdfFile.lastIndexOf(".")); 17 String fileName = pdfFile + ".doc"; 18 File file = new File(fileName); 19 if (!file.exists()){ 20 file.createNewFile(); 21 } 22 FileOutputStream fos = new FileOutputStream(fileName); 23 Writer writer = new OutputStreamWriter(fos, "UTF-8"); 24 PDFTextStripper stripper = new PDFTextStripper(); 25 stripper.setSortByPosition(true);// 排序 26 stripper.setStartPage(1);// 设置转换的开始页 27 stripper.setEndPage(pagenumber);// 设置转换的结束页 28 stripper.writeText(doc, writer); 29 writer.close(); 30 doc.close(); 31 System.out.println("pdf转换word成功!"); 32 } 33 catch (IOException e){ 34 e.printStackTrace(); 35 } 36 } 37 }
代码所用到的jar包 pdfbox-1.8.2.jar 另行下载
标签:java,word,io,new,pdf,import,stripper,pdfFile 来源: https://www.cnblogs.com/xiaoyue1606bj/p/10985904.html
本站声明: 1. iCode9 技术分享网(下文简称本站)提供的所有内容,仅供技术学习、探讨和分享; 2. 关于本站的所有留言、评论、转载及引用,纯属内容发起人的个人观点,与本站观点和立场无关; 3. 关于本站的所有言论和文字,纯属内容发起人的个人观点,与本站观点和立场无关; 4. 本站文章均是网友提供,不完全保证技术分享内容的完整性、准确性、时效性、风险性和版权归属;如您发现该文章侵犯了您的权益,可联系我们第一时间进行删除; 5. 本站为非盈利性的个人网站,所有内容不会用来进行牟利,也不会利用任何形式的广告来间接获益,纯粹是为了广大技术爱好者提供技术内容和技术思想的分享性交流网站。