POI 操作Excel疑难点笔记

时间:2021-12-30 04:33:19

在POI中,我们可以通过Workbook, Sheet, Row, Cell 对象分别对应Excel文件、工作表、行、单元格。

在POI的使用中,我遇到了几个非常诡异、捉摸不透的问题,现在记录下来。

1、关于Sheet、Row、Cell的下标

一般情况下,我们读取一个Excel表格是这样的:

Workbook workbook = WorkbookFactory.create(file);
Sheet sheet = workbook.getSheetAt(0);
Row row = sheet.getRow(0);
Cell cell = row.getCell(0);

在POI的API中,Sheet(工作表)、Row(行)、Cell(单元格)都是从0开始的。

2、关于getPhysical*()、getLast*Num()方法

sheet.getPhysicalNumberOfRows();     //获取此工作表中有效定义的行

row.getPhysicalNumberOfCells();  //获取此行中有效的单元格数

sheet.getLastRowNum();  //获取最后一行非NULL行的行下标

row.getLastCellNum();  //获取最后一个非NULL单元格的列下标,并加上1(所以虽然列是从0开始的,但是这里得到的值是下标+1,需要注意

getPhysical*()方法是指获取有效定义的行数或列数,算的是一个数目。这里的有效定义是指只要你曾经对此行或此单元格进行过操作,无论是格式上的操作还是数据上的操作,那么这以行或列就是有效的。

我修改A2单元格的单元格格式为文本,那么A2单元格对于POI来说就是已定义的单元格,无论之后对A2做什么操作都不会改变这个事实。又如我对A2单元格赋值,此时A2单元格就是已定义的单元格,即使我之后清除A2单元格的值,但A2还是已定义的单元格。

所以getPhysical*()方法可能会得到的行或单元格可能没有数据。

而getLast*Num()方法是获取最后一个非NULL的行(单元格)下标,算的是下标。它前面有可能行或单元格有可能是NULL的,也就是不存在的。如:

NULL 1 NULL 2 3 NULL NULL    那么getLastCellNum 获取到的值就是5(列从1算起)

例如:下图表是一个4*4的Excel表格数据

1  ""  3  4

null null null 3

null  null null null

3 null 3 null

那么sheet.getPhysicalNumberOfRows() = 3,因为虽然有4行,但是第3行全部是NULL,因此这一行是未定义的,所以只有3行。

sheet.getLastRowNum() = 3,最后以列非NULL行的行下标是第4行,即下标为3的行。

row.getPhysicalNumberOfCells()    第1行,有效单元格数是4。第2行中,只有第4个单元格是有效的,因此有效单元格数是1。第3行有效单元格是0,第4行有效单元格数是2。

row.getLastCellNum()    第1行中,值为4(下标为3,加1后值为4)。第2行,值为4。第3行,值为-1。第4行,值为3。(第3行没有任何有效的单元格,所以返回-1)