场景:对于经常需要导入Excel模板或数据来解析后加以应用的,使用频率非常之高,做了一个比较稳定的版本,体现在这些地方
工具:org.apache.poi
使用前必须了解这些:
1、要解析,那肯定先判断是不是Excel
2、xls后缀的Excel,是03版及以前的用HSSFWorkbook类
xlsx后缀的Excel,是07版及以后的用XSSFWorkbook解析
3、getWorkbook这个方法是我自己乱造各种Excel数据不断测试搜索修正得出的结果,其他的像简单的判断后缀xls还是xlsx来决定用HSSH还是XSSF是不保险的,比如你可能没遇过org.apache.poi.openxml4j.exceptions.InvalidFormatException这样的异常,当然这个异常仍然是因为Excel类型导致获取workbook时出错,然而我查到的结果是,Excel最底层是xml实现的,类型问题出在这儿,看异常的描述也可以稍微看出来openxml4j.exceptions
4 、可能出现空行,空的单元格,或者单元格值为空的情况,这些情况,在我的readExcel()方法里都考虑到了,为什么我不用迭代器,或者加强的for each循环?就是因为这些坑爹的空单元格或者空行啊,迭代器内部在取cell单元格对象时跳过这些空的对象,who knows why?我也不知道,反正我测试过,跳过去了,本来5个单元格,一个空的,结果就只得到4个数据,即使用cell.isEmpty()和cell!=null来判断,也没卵用,因为遍历的时候直接跳过去了,都没有判断的机会
5、取单元格数据,这个就比较简单了,判断单元格类型,根据类型做相应的处理取出来,但是我觉得我这个getCellValue()的方法应该有漏洞,先这么用着
下面上代码,简单描述下关键部位
import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStream;
import java.io.PushbackInputStream;
import java.util.ArrayList;
import java.util.HashMap;
import java.util.Map;
import java.util.List;
import org.apache.poi.POIXMLDocument;
import org.apache.poi.openxml4j.exceptions.InvalidFormatException;
import org.apache.poi.openxml4j.opc.OPCPackage;
import org.apache.poi.poifs.filesystem.POIFSFileSystem;
import org.apache.poi.ss.usermodel.Cell;
import org.apache.poi.ss.usermodel.Row;
import org.apache.poi.ss.usermodel.Sheet;
import org.apache.poi.ss.usermodel.Workbook;
import org.apache.poi.xssf.usermodel.XSSFWorkbook;
import org.apache.poi.hssf.usermodel.HSSFCell;
import org.apache.poi.hssf.usermodel.HSSFWorkbook;
import org.apache.xmlbeans.impl.piccolo.io.FileFormatException;
/**
*yanbiao 2016.10.25
*/
public class ExcelUtil {
private static final String EXTENSION_XLS = "xls";
private static final String EXTENSION_XLSX = "xlsx";
/**
* 文件检查
*/
private void preReadCheck(String filePath) throws FileNotFoundException, FileFormatException {
File file = new File(filePath);
if (!file.exists()) {
throw new FileNotFoundException("导入的文件不存在:" + filePath);
}
if (!(filePath.endsWith(EXTENSION_XLS) || filePath.endsWith(EXTENSION_XLSX))) {
throw new FileFormatException("传入的文件不是excel");
}
}
/**
* 取得WorkBook对象
* xls:HSSFWorkbook,03版
* xlsx:XSSFWorkbook,07版
*/
private Workbook getWorkbook(String filePath) throws IOException, InvalidFormatException {
//直接判断后缀来返回相应的Workbook对象多数情况没问题,但是这个更保险,第3条已经说明
Workbook wb = null;
InputStream is = new FileInputStream(filePath);
if (!is.markSupported()) {
is = new PushbackInputStream(is, 8);
}
if (POIFSFileSystem.hasPOIFSHeader(is)) {
return new HSSFWorkbook(is);
}
if (POIXMLDocument.hasOOXMLHeader(is)) {
return new XSSFWorkbook(OPCPackage.open(is));
}
throw new IllegalArgumentException("您的excel版本目前不支持poi解析");
}
/**
* 读取excel文件内容
*/
public Map<Integer, List<String>> readExcel(String filePath) throws FileNotFoundException, FileFormatException {
// 检查和获取workbook对象
this.preReadCheck(filePath);
Workbook wb = null;
Map<Integer,List<String>> map = new HashMap<Integer, List<String>>();
try {
wb = this.getWorkbook(filePath);
// 默认只读取第一个sheet
Sheet sheet = wb.getSheetAt(0);
int rowcount = sheet.getLastRowNum();//逻辑行,包括空行
int cellcount = sheet.getRow(0).getLastCellNum();//第一行(将来作为字段的行)有多少个单元格
for (int i=0;i<rowcount;i++) { //这里用最原始的for循环来保证每行都会被读取
List<String> list = new ArrayList<String>();
Row row = sheet.getRow(i);
if(null!=row){
for (int j=0;j<cellcount;j++) {
list.add(getCellValue(row.getCell(j))); //这里也是用for循环,用Cell c:row这样的遍历,空单元格就被抛弃了
}
System.out.println("第"+(row.getRowNum()+1)+"行数据:"+list.toString());
map.put(row.getRowNum(), list);
}else{
for (int j=0;j<cellcount;j++) {
list.add("无数据");
}
System.out.println("第"+(i+1)+"行数据:"+list.toString());
map.put(i, list);
}
}
} catch (Exception e) {
System.out.println("读取Excel异常:"+e.getMessage());
e.printStackTrace();
} finally {
if (wb != null) {
try {
wb.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
return map;
}
/**
* 取单元格的值
*/
private String getCellValue(Cell c) {
if (c == null) {
return "无数据";
}
String value = "";
switch (c.getCellType()){
case HSSFCell.CELL_TYPE_NUMERIC://数字
value = c.getNumericCellValue()+"";
break;
case HSSFCell.CELL_TYPE_STRING://字符串
value = c.getStringCellValue();
break;
case HSSFCell.CELL_TYPE_BOOLEAN://boolean
value = c.getBooleanCellValue()+"";
break;
case HSSFCell.CELL_TYPE_FORMULA://公式
value = c.getCellFormula()+"";
break;
case HSSFCell.CELL_TYPE_BLANK://空值
value= "无数据";
break;
case HSSFCell.CELL_TYPE_ERROR:
value = "非法字符";
break;
default:
value= "未知类型";
break;
}
return value;
}
}
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持亿速云。
亿速云「云服务器」,即开即用、新一代英特尔至强铂金CPU、三副本存储NVMe SSD云盘,价格低至29元/月。点击查看>>
免责声明:本站发布的内容(图片、视频和文字)以原创、转载和分享为主,文章观点不代表本网站立场,如果涉及侵权请联系站长邮箱:is@yisu.com进行举报,并提供相关证据,一经查实,将立刻删除涉嫌侵权内容。