java中 Excel文件解析及超大Excel文件读写

这篇具有很好参考价值的文章主要介绍了java中 Excel文件解析及超大Excel文件读写。希望对大家有所帮助。如果存在错误或未考虑完全的地方,请大家不吝赐教,您也可以点击"举报违法"按钮提交疑问。

本文主要对Excel中数据的解析和生成进行总结

 

前言

                在应用程序的开发过程中,我们经常要用到Excel进行数据的导入或导出。所以,在通过Java语言实现此类需求时,通常会对Excel文件进行解析或生成。


 文章来源地址https://www.toymoban.com/news/detail-470262.html

一、Excel文件解析

1,概述

            在应用程序开发过程中,经常需要使用Excel文件来进行数据的导入或导出。所以,在通过Java语言来实现此类需求的时候,往往会面临着Excel文件解析(导入)或生成(导出)。


             在Java技术生态圈中,可以进行Excel问价处理的主流技术包括:Apache POI,JXL,Alibaba EasyExcel等。


             Apache POI基于DOM方式进行解析,将文件直接加载内存,所以速度较快,适合Excel文件数量不大的应用场景。JXL只支持Excel2003以下版本,所以不太常见。


             Alibaba EasyExcel采用逐行读取的解析模式,将每一行的解析结果以观察者模式通知处理(AnalyEventListener),所以比较适合数据体量较大的Excel文件解析。

2,  Apache POI
         Apache POI使用Java编写的免费开源的跨平台的Java API。Apache POI提供给Java程序对Microso Office 格式档案进行读写功能的API开源类库


HSSF :提供读写Microsoft Excel格式档案的功能。

XSSF :提供读写Microsoft Excel 0OXML格式档案的功能。HWPF

HWPF :  提供读写Microsoft Word格式档案的功能。

HSLF  :  提供读写Microsoft PowerPoint格式档案的功能。

HDGF  :  提供读写Microsoft Visio格式档案的功能。
3, XSSF解析Excel文件

HSSF用于解析旧版本(*.xls) Excel文件, 由于旧版本的Excel文件只能存在65535行数据, 所以目前已经不常用。所以目前主要采用XSSF进行新版本(*.xlsx) Exce文件的解析。

         导入下图中的架包:

                                       java中 Excel文件解析及超大Excel文件读写

 

 Workbook (Excel文件)

Workbook接口代表一一个 Excel文件,用于创建或加载(解析)见实现类是XSSFWorkbook。

                创建Excel文件:

// 输出流
FileOutputStream fos = new FileOutputStream("c:\\test\\temp.xlsx");

// Excel文件对象
Workbook workbook = new XSSFWorkbook();

// 通过输出流进行写入
workbook.write(fos);

// 关闭资源
fos.close();
workbook.close();
try (Workbook workbook = new XSSFWorkbook();
                FileOutputStream fos = new FileOutputStream("c:\\test\\temp.xlsx")) {
    workbook.write(fos);
} catch (IOException e) {
    e.printStackTrace();
}

 

解析Excel文件

// 输入流
FileInputStream fis = new FileInputStream("c:\\test\\12345.xlsx");

// Excel文件对象
Workbook workbook = new XSSFWorkbook(fis);

Sheet(工作簿)

通过Workbook来进行工作簿Sheet对象的获取或创建。

 

创建工作簿

// 按照默认名称创建工作簿
Sheet sheet1 = workbook.createSheet();

// 按照自定义名称创建工作簿
Sheet sheet2 = workbook.createSheet("自定义工作簿2");

获取工作簿

// 按照工作簿下标获取Sheet
Sheet sheet01 = workbook.getSheetAt(0);

// 按照工作簿名称获取Sheet
Sheet sheet02 = workbook.getSheet("Sheet0");

 

获取工作簿数量

int n = workbook.getNumberOfSheets();

 

Row (数据行)

通过Sheet 来进行数据行Row 对象的获取或创建

 

获取首行下标

int first = sheet.getFirstRowNum();

获取末尾行下标

int last = sheet.getLastRowNum();

根据下标获取指定行

Row row = sheet.getRow(0);

遍历所有行

for(Row row : sheet) {
    System.out.println(row);
}

遍历指定区域行

for (int i = 1; i <= sheet.getLastRowNum(); i++) {
    Row row = sheet.getRow(i);
    System.out.println(row);
}

Cell (单元格)

通过Row 来进行单元格Cell 对象的获取或创建

创建单元格

Cell cell0 = row.createCell(0);

设置单元格值

cell0.setCellValue(UUID.randomUUID().toString());

遍历所有单元格

for(Cell cell : row) {
                
}

获取所有单元格类型

CellType type = cell.getCellType();

设置单元格样式

// 创建单元格样式
DataFormat dataFormat = workbook.createDataFormat();
Short formatCode = dataFormat.getFormat("yyyy-MM-dd HH:mm:ss");
CellStyle cellStyle = workbook.createCellStyle();
cellStyle.setDataFormat(formatCode);

// ...

// 为当前行创建单元格
Cell cell1 = row.createCell(1);
cell1.setCellStyle(cellStyle); // 设置单元格样式
cell1.setCellValue(new Date()); // 保存当前日期时间至本单元格

 

设置单元格对齐

// 创建单元格样式
CellStyle cellStyle = workbook.createCellStyle();

//设置单元格的水平对齐类型。 此时水平居中
cellStyle.setAlignment(HorizontalAlignment.CENTER);

// 设置单元格的垂直对齐类型。 此时垂直靠底边
cellStyle.setVerticalAlignment(VerticalAlignment.BOTTOM);

 

二、超大Excel文件读写

1,使用POI写入

package Myde;



import java.io.FileInputStream;
import java.io.FileOutputStream;
import java.io.IOException;
import java.util.Arrays;
import java.util.Date;
import java.util.List;
 
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.CellStyle;
import org.apache.poi.ss.usermodel.DataFormat;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.xssf.streaming.SXSSFWorkbook;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
 
public class Demo06{
	public static void main(String[] args) {
		//List<String> list= Arrays.asList("AA","BB","CC","DD","EE","FF");
		
		//读取一个已存在的Excel文件
		try (Workbook workbook=new SXSSFWorkbook(1000);
			FileOutputStream out=new FileOutputStream("D:\\demo-data.xlsx")){
			
			//在已经存在的Excel文件中,创建一个新的sheet
			Sheet sheet=workbook.createSheet();
			
			//获取格式编码值
			DataFormat dataformat=workbook.createDataFormat();
			short dateformatCode=dataformat.getFormat("yy年MM月dd日 HH:mm:ss");
			short moneyformatCode=dataformat.getFormat("¥#,###");
			
			//创建日期格式对象
			CellStyle datecellstyle=workbook.createCellStyle();
			datecellstyle.setDataFormat(dateformatCode);
			
			//创建货币格式对象
			CellStyle moneycellstyle=workbook.createCellStyle();
			moneycellstyle.setDataFormat(moneyformatCode);;
			
			//创建列头
			 Row headrow=sheet.createRow(0);
			 Cell headcell0=headrow.createCell(0);
			 headcell0.setCellValue("序号");
			 
			 Cell headcell1=headrow.createCell(1);
			 headcell1.setCellValue("姓名");
			 
			 Cell headcell2=headrow.createCell(2);
			 headcell2.setCellValue("日期");
			 
			 Cell headcell3=headrow.createCell(3);
			 headcell3.setCellValue("红包金额");
			 long begin=System.currentTimeMillis();
			 for(int i=0;i<1000000;i++) {
				 //String name=list.get(i);
				 String name=i+"A";
				 //创建行
				 Row row=sheet.createRow(i+1);
				 
				 //创建单元格
				 Cell cell0=row.createCell(0);//序号
				 cell0.setCellValue(String.valueOf(i+1));
				 
				 Cell cell1=row.createCell(1);//姓名
				 cell1.setCellValue(name);
				 
				 Cell cell2=row.createCell(2);//日期
				 cell2.setCellStyle(datecellstyle);
				 cell2.setCellValue(new Date());
				 
				 Cell cell3=row.createCell(3);//金额
				 cell3.setCellStyle(moneycellstyle);
				 cell3.setCellValue(Math.random()*1000000);
				 
			 }
			 //写入文件
			workbook.write(out);
			long end=System.currentTimeMillis();
			System.out.println("耗时"+(end-begin)+"毫秒");
		} catch (IOException e) {
			
			e.printStackTrace();
		}
	}
 
}

 

可以看到使用SXSSDWorkbook的执行时间为:

java中 Excel文件解析及超大Excel文件读写

2.使用EasyExcel

   (1)下载alibaba easyexcel相关jar包

   (2)  订单实体类Order

public class Order {
    @ExcelProperty("订单编号")
	private String orderId; // 订单编号
	
    @ExcelProperty("支付金额")
	@NumberFormat("¥#,###")
	private Double payment; // 支付金额
	
    @ExcelProperty(value = "创建日期",converter = LocalDateTimeConverter.class)
	private LocalDateTime creationTime; // 创建时间

	public Order() {
		this.orderId = LocalDateTime.now().format(DateTimeFormatter.ofPattern("yyyyMMddhhmmss"))
				+ UUID.randomUUID().toString().substring(0, 5);
		this.payment = Math.random() * 10000;
		this.creationTime = LocalDateTime.now();
	}

	public String getOrderId() {
		return orderId;
	}

	public void setOrderId(String orderId) {
		this.orderId = orderId;
	}

	public Double getPayment() {
		return payment;
	}

	public void setPayment(Double payment) {
		this.payment = payment;
	}

	public LocalDateTime getCreationTime() {
		return creationTime;
	}

	public void setCreationTime(LocalDateTime creationTime) {
		this.creationTime = creationTime;
	}



	@Override
	public String toString() {
		return "Order [orderId=" + orderId + ", payment=" + payment + ", creationTime=" + creationTime + "]";
	}
}

(3)Converter转换类(兼容LocalDateTime日期时间类)

public class LocalDateTimeConverter implements Converter<LocalDateTime> {

	@Override
	public Class<LocalDateTime> supportJavaTypeKey() {
		return LocalDateTime.class;
	}

	@Override
	public CellDataTypeEnum supportExcelTypeKey() {
		return CellDataTypeEnum.STRING;
	}

	@Override
	public LocalDateTime convertToJavaData(CellData cellData, ExcelContentProperty contentProperty,
			GlobalConfiguration globalConfiguration) {
		return LocalDateTime.parse(cellData.getStringValue(), DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss"));
	}

	@Override
	public CellData<String> convertToExcelData(LocalDateTime value, ExcelContentProperty contentProperty,
			GlobalConfiguration globalConfiguration) {
		return new CellData<>(value.format(DateTimeFormatter.ofPattern("yyyy-MM-dd HH:mm:ss")));
	}

}

(4)写入100w条数据

public class Demo {
	public static void main(String[] args) {
        // 写入100w
        EasyExcel.write("c:\\test\\run\\easy.xlsx", Order.class)
                 .sheet("订单列表")
                 .doWrite(data());
    }
    
    // 创建100w条订单数据
    private static List<Order> data() {
        List<Order> list = new ArrayList<Order>();
        for (int i = 0; i < 1000000; i++) {
            list.add(new Order());
        }
        return list;
    }
}

(5)读取100w条数据

EasyExcel.read("c:\\test\\run\\easy.xlsx", Order.class,new AnalysisEventListener<Order>() {
    @Override
    public void invoke(Order order, AnalysisContext arg1) {
        // 读取每条数据
        orderList.add(order);
    }

    @Override
    public void invokeHeadMap(Map<Integer, String> headMap, AnalysisContext context) {
        // 读取到列头
        System.out.println(headMap);
    }

    @Override
    public void doAfterAllAnalysed(AnalysisContext arg0) {
        // 读取完毕
        System.out.println("END");
    }
}).sheet().doRead();

EasyExcel的执行时间为

java中 Excel文件解析及超大Excel文件读写

 

可以看到两种方法时间相差不大,但在运行时,CPU的利用率还是有一定差距。

 

 

 POI:

java中 Excel文件解析及超大Excel文件读写

EasyExcel:

java中 Excel文件解析及超大Excel文件读写

 

从此可以得出,在读写超大Excel文件时,我推荐大家使用EasyExcel。


 

 

总结

  1. Excel文件解析  apache POI,可以解析world和Excel
  2. getRow(),获取行    lastRoeNumber() 最后一个,getCell()按下标获取当前行的单元格
  3. GetStringCellValue() -->文本     getNumberCellValue() -->数字
  4. Workbook.createSheet() 创建表格
  5. CellStyle单元格格式
  6. Excel文件对象  Workbook workbook=new XSSFEorkbook()
  7. 创建工作簿  Sheet sheet1=workbook.createSheet();
  8. 按照工作簿下标获取Sheet  Sheet sheet1=workbook.getSheetAt(0);
  9. 遍历所有行for(Row row:sheet){System.out.println(row);}

 

 

到了这里,关于java中 Excel文件解析及超大Excel文件读写的文章就介绍完了。如果您还想了解更多内容,请在右上角搜索TOY模板网以前的文章或继续浏览下面的相关文章,希望大家以后多多支持TOY模板网!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处: 如若内容造成侵权/违法违规/事实不符,请点击违法举报进行投诉反馈,一经查实,立即删除!

领支付宝红包 赞助服务器费用

相关文章

  • Java 解析 /生成 Excel文件

    目录 一.概述 二.Apache POI 1.XSSF解析文件 2.XSSF生成文件 三.Alibaba EasyExcel 四.SXSSF写入文件         在程序的开发过程中,通常会使用Excel文件来进行数据的导入和导出,在使用Java实现此类需求时也要经理Excel文件的解析或生成         在Java技术中,能实现此类需求的技术

    2024年01月20日
    浏览(37)
  • Java解析上传的zip文件--包含Excel解析与图片上传

    前言:今天遇到一个需求:上传一个zip格式的压缩文件,该zip中包含人员信息的excel以及excel中每行对应的人的图片,现在需要将该zip压缩包中所有内容解析导入到数据库中,包括图片,并将图片与excel内容对应。 代码演示: 回顾: 博主解答思路为: 接收压缩文件 解析压缩文件

    2024年02月05日
    浏览(49)
  • Java中Excel文件解析(POI简介及基本使用)

    在Java技术生态圈中,可以进行Excel文件处理的主流技术包括: Apache POI 、 JXL 、 Alibaba EasyExcel 等。 其中各个技术都有最适合的场景 Apache POI 基于 DOM 方式进行解析,将文件直接加载内存,所以速度较快,适合 Excel 文件数据量不大的应用场景。 JXL 只支持Excel 2003以下版本,所以

    2024年02月08日
    浏览(48)
  • Java解析Excel文件并把数据存入数据库

    使用SpingMVC和hibernate框架实现 web.xml中的配置文件就按照这种方式写,只需要把\\\"application.xml\\\"换成你的配置文件名即可 在这个配置文件中你还可以规定上传文件的格式以及大小等多种属性限制 注意: 1.enctype=“multipart/form-data” 必须写,封装表单 2.method=“post”,提交方式必须

    2024年01月23日
    浏览(46)
  • CANoe-读写Excel文件

    1、CANoe读写Excel文件操作: 针对所有可用Excel打开的文件格式,目前CANoe仅支持.csv(文本文件)文件的读写,无法用CAPL编程实现对Excel文件的读写,.xlsx文件和.xls文件无法进行读写。可以在CANoe下创建.NET测试节点,实现对Excel文件的读写操作。 如图所示,openFileRead方法: If

    2024年02月05日
    浏览(92)
  • 使用SheetJS读写Excel文件

    项目中有一个Excel转JSON的工具,之前这个工具一直使用 Python 的 openpyxl 库来编写的,然后使用 pyinstaller 打包成 .exe 文件。之前这个工具只是个命令行工具,不带界面的。现在项目升级,打算使用Web前端方式重写这个工具,调整部分功能并新增图形界面。这篇文章中将使用 S

    2024年02月14日
    浏览(40)
  • 使用EasyExcel读写Excel文件

    笔者之前一直使用POI读写Excel文件,最近有个需求需要读取大概80万行数据的Excel,使用POI读取到10.2万行左右就卡死不动了,而且CPU占用直接拉满到100%,内存占用也很高。 查找资料后,发现POI提供了读取大量数据的方法,但是用起来比较复杂。同时看到有人提到用EasyExcel读取

    2024年02月13日
    浏览(49)
  • python之批量读写excel文件

    首先,导入openpyxl库中的读取和新建文件包(比较官方的名称我没有查,就按照好理解的方向这样说),文中关于行和列的理解都是个人想法,可能有和读者不同之处。 先详细说怎么样读取单个excel文件,批量在后边写。 excel表格格式如下,需要弄清楚的就是excel文件路径,以

    2024年02月02日
    浏览(48)
  • Python读写EXCEL文件常用方法

    python读写excel的方式有很多,不同的模块在读写的讲法上稍有区别,这里我主要介绍几个常用的方式。 用xlrd和xlwt进行excel读写; 用openpyxl进行excel读写; 用pandas进行excel读写; 为了方便演示,我这里新建了一个data.xls和data.xlsx文件,第一个工作表sheet1区域“A1:E5”的内容如下

    2024年02月11日
    浏览(42)
  • Python读写EXCEL文件常用方法大全

    python读写excel的方式有很多,不同的模块在读写的讲法上稍有区别,这里我主要介绍几个常用的方式。 用xlrd和xlwt进行excel读写; 用openpyxl进行excel读写; 用pandas进行excel读写; 为了方便演示,我这里新建了一个data.xls和data.xlsx文件,第一个工作表sheet1区域“A1:E5”的内容如下

    2024年01月19日
    浏览(54)

觉得文章有用就打赏一下文章作者

支付宝扫一扫打赏

博客赞助

微信扫一扫打赏

请作者喝杯咖啡吧~博客赞助

支付宝扫一扫领取红包,优惠每天领

二维码1

领取红包

二维码2

领红包