doc、docx页码跟系统字体,渲染方式有关,需要预览,或则转成pdf才能知道最终页数。
pdf页码是个属性,可以直接读取,获取比较容易。
1:poi获取
import java.io.File;
import java.io.FileInputStream;
import java.io.IOException;
import org.apache.poi.xwpf.usermodel.XWPFDocument;
public class WordPageCount {
public static void main(String[] args) {
File file = new File("example.docx");
try (FileInputStream fis = new FileInputStream(file);
XWPFDocument document = new XWPFDocument(fis)) {
int pageCount = document.getProperties().getExtendedProperties().getPages();
System.out.println("Page count: " + pageCount);
} catch (IOException e) {
e.printStackTrace();
}
}
}
缺点:几乎不准,可以忽略。文章来源:https://www.toymoban.com/news/detail-607998.html
2: spire.doc获取(相对准确,页数越多速度越慢,因为需要渲染,其它功能需要收费)文章来源地址https://www.toymoban.com/news/detail-607998.html
spire.doc是国内开发的一款软件,感觉也是基于poi 在windows和mac获取页码相对比较
到了这里,关于java获取word文件页数的3种方式的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!