Java 怎么使用Apache PDFBox读取PDF

2019年7月29日19:59:35Java 怎么使用Apache PDFBox读取PDF已关闭评论 549 598字阅读1分59秒

1.简介

Java 怎么使用Apache PDFBox读取PDF?——请看下文。

2.示例代码

/**
 * 版权所有 编程十万个怎么办(www.tah1986.com)
 */


import java.awt.List;
import java.io.File;
import java.util.Arrays;
import org.apache.pdfbox.pdmodel.PDDocument;
import org.apache.pdfbox.util.PDFTextStripper;

public class PdfRead
{
  public static void main(String[] args)
  {
    PDFTextStripper stripper;
    PDDocument doc;
    try
    {
      doc = PDDocument.load(filePath + File.separator + fileName);
      stripper = new PDFTextStripper();
      stripper.setStartPage(1);
      stripper.setEndPage(Integer.MAX_VALUE);
      String x1 = stripper.getText(doc);
      
      List<String> ans = Arrays.asList(x1.split("\r\n"));
      return ans;
    }
    finally
    {
      if (doc != null)
        doc.close();
    }
  }
}

 
编程十万个怎么办