1.概述
在应用程序的开发过程中,经常需要使用Excel 文件来进行数据的导入或导出。所以,在通过ava语言实现此类需求的时候,往往会面临着Excel文件的解析(导入)或生成(导出)。
在Java技术生态圈中,可以进行Excel文件处理的主流技术包括: Apache POI 、JXL 、Alibaba EasyExcel 等。
Apache POI 基于DOM方式进行解析,将文件直接加载内存,所以速度较快,适合Excel 文件数据量不大的应用场景。JXL只支持Excel 2003以下版本,所以不太常见。
Alibaba EasyExcel 采用逐行读取的解析模式,将每一行的解析结果以观察者的模式通知处理
( AnalysisEventListener ) , 所以比较适合数据体量较大的Excel 文件解析。
2.Apache POI
Apache POI是用Java 编写的免费开源的跨平台的Java API,Apache POI提供给Java 程序对Microsoft office 格式档案进行读写功能的API 开源类库:
JURCE - 它分别提供对不同格式文件的解析:
HSSF - 提供读写Microsoft Excel格式档案的功能。
XSSF - 提供读写Microsoft Excel OOXML格式档案的功能。
HWPF - 提供读写Microsoft Word格式档案的功能。
HSLF - 提供读写Microsoft PowerPoint格式档案的功能。
HDGF - 提供读写 Microsoft Visio格式档案的功能。
3.使用XSSF解析Excel文件
HSSF用于解析旧版本( *.xIs ) Excel文件,由于旧版本的Excel文件只能存在65535行数据,所以目前已经不常用。所以目前主要采用XSSF进行新版本( *.xlsx ) Exce文件的解析。
创建Excel文件
当我们要解析一个Excel文件时,需要创建一个Workbook的实现类XSSFWorkbook,它就代表了一个Excel文件,
try (Workbook workbook = new XSSFWorkbook();
FileOutputStream fos = new FileOutputStream("D:\\share\\Demo01.xlsx")) {
workbook.write(fos);
} catch (IOException e) {
e.printStackTrace();
}
加载Excel文件
可以创建FileInputStream文件输入流对象那指定路径下的Excel文件传入到XSSFWorkbook中,推荐写入到try-with-resources中例如:
// 输入流
FileInputStream fis = new FileInputStream("D:\\share\\Demo01.xlsx");
// Excel文件对象
Workbook workbook = new XSSFWorkbook(fis);
Sheet(工作簿)
创建工作簿对象
// 按照默认名称创建工作簿
Sheet sheet1 = workbook.createSheet();
// 按照自定义名称创建工作簿
Sheet sheet2 = workbook.createSheet("自定义工作簿2");
获取工作簿
// 按照名称获取工作簿
// org.apache.poi.ss.usermodel.Sheet ss包下的
Sheet sheet0 = workbook.getSheet("Sheet0");
// 按照下标获取工作簿
Sheet sheet1 = workbook.getSheetAt(1);"Sheet0");
获取工作簿的数量
int n = workbook.getNumberOfSheets();
Row(行数据)
通过sheet来进行数据行的获取或创建
获取当前数据行
Row row = sheet.createRow(0);
获取首行下标
int first = sheet.getFirstRowNum();
获取尾行下标
int last = sheet.getLastRowNum();
根据下标获取指定行
Row row = sheet.getRow(0);
遍历所有行
for(Row row : sheet) {
System.out.println(row);
}
遍历指定行
for (int i = 1; i <= sheet.getLastRowNum(); i++) {
Row row = sheet.getRow(i);
System.out.println(row);
}
文章来源地址https://www.toymoban.com/news/detail-467229.html
Cell单元格
创建单元格
Cell cell0 = row.createCell(0);
设置单元格值
cell0.setCellValue(//对应类型数据值);
根据下标获取单元格
Cell cell = row.getCell(1);
遍历所有单元格
for(Cell cell : row) {
}
获取单元格的类型
CellType type = cell.getCellType();
设置单元格样式
// 创建单元格样式
DataFormat dataFormat = workbook.createDataFormat();
Short formatCode = dataFormat.getFormat("yyyy-MM-dd HH:mm:ss");
CellStyle cellStyle = workbook.createCellStyle();
cellStyle.setDataFormat(formatCode);
// ...
// 为当前行创建单元格
Cell cell1 = row.createCell(1);
cell1.setCellStyle(cellStyle); // 设置单元格样式
cell1.setCellValue(new Date()); // 保存当前日期时间至本单元格
设置单元格对齐方式
// 创建单元格样式
CellStyle cellStyle = workbook.createCellStyle();
//设置单元格的水平对齐类型。 此时水平居中
cellStyle.setAlignment(HorizontalAlignment.CENTER);
// 设置单元格的垂直对齐类型。 此时垂直靠底边
cellStyle.setVerticalAlignment(VerticalAlignment.BOTTOM);
4.超大Excel文件读写
一般进行超大Excel文件的读写,一般两种方式,第一种使用SXSSFWorkbook进行写入,通过设置SXXFWorkbook 的构造参数,可以设置每次在内存中保持的行数,当达到这个值的时候,那么会把这些数据flush 到磁盘上,这样就不会出现内存不够的情况。第二种使用阿里巴巴提供的EasyExcel工厂类进行写入读取操作。但是对于不同电脑,不同CPU,不同内存读写的速度也是不同的。
我的电脑比较老CPU是Intel(R) Core(TM) i5-3320M CPU @ 2.60GHz 2.60 GHz,内存(RAM)是4.00GB,以下是对应的使用EasyExcel写入100万条数据运行后统计的总耗时:
我的电脑如果使用SXSSFWorkbook来进行一般的读入数据直接把IDEA卡到无响应,作者也是很无奈,所以更推荐与使用EasyExcel来进行超大Excel文件的读写。文章来源:https://www.toymoban.com/news/detail-467229.html
到了这里,关于Excel文件解析以及超大Excel文件读写的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!