Java读取word文件内容-Toy模板网

这篇具有很好参考价值的文章主要介绍了Java读取word文件内容。希望对大家有所帮助。如果存在错误或未考虑完全的地方，请大家不吝赐教，您也可以点击"举报违法"按钮提交疑问。

前言

今天遇到一个读取word模板内容的需求，在网上找了很多种方案，有的代码比较复杂，有的读出来中文乱码，个人觉得使用Apache下面的poi包去实现起来比较简单，并且不会出现中文乱码的情况。

XWPFDocument

这次要用到一个新的类：XWPFDocument，它代表一个docx文档。是apache基金会提供的用户导出Word文档的工具类。

引入依赖

	  <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi</artifactId>
            <version>4.0.0</version>
        </dependency>
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-ooxml</artifactId>
            <version>4.0.0</version>
        </dependency>

准备一个word文档

提前准备一个word文档，随便写点内容：

Java读取word文件内容

编写demo

然后简单编写一个demo，测试下读取文件里面的内容：

package com.test;

import org.apache.poi.xwpf.extractor.XWPFWordExtractor;
import org.apache.poi.xwpf.usermodel.XWPFDocument;

import java.io.File;
import java.io.FileInputStream;



public class FileTest {
    public static void main(String[] args){
        File file = new File("C:\\Users\\PC\\Desktop\\test.docx");
        FileInputStream fis = null;
        XWPFDocument document = null;
        XWPFWordExtractor extractor = null;
        try {
            fis = new FileInputStream(file);
            document = new XWPFDocument(fis);
            extractor = new XWPFWordExtractor(document);
            System.out.println(extractor.getText());
        } catch (Exception e) {
            e.printStackTrace();
        }
    }
}