首先引入Apache POI依赖,然后使用DOM解析XML文件提取数据,接着通过XSSFWorkbook创建Excel并写入表头与内容,最后自动调整列宽并输出文件。1. 添加poi-ooxml依赖;2. 解析data.xml获取员工信息列表;3. 创建“员工信息.xlsx”并填充数据;4. 注意大文件用SAX解析、大量数据用SXSSFWorkbook优化内存。整个流程适用于企业级数据导出场景。

在Java开发中,处理XML数据并将其导出为Excel文件是常见的业务需求,比如系统配置导入、报表生成等场景。Apache POI 是一个强大的Java API,用于操作Microsoft Office格式文件,尤其是Excel(.xls 和 .xlsx)。本文将介绍如何使用 Java 解析 XML 文件,并结合 Apache POI 将其内容写入 Excel 文件。
1. 准备工作:引入依赖
要在项目中使用 Apache POI 处理 Excel 文件,需要添加相应的 Maven 依赖。如果你使用的是 XLSX 格式(推荐),需引入以下依赖:
<dependency>
<groupId>org.apache.poi</groupId>
<artifactId>poi-ooxml</artifactId>
<version>5.2.4</version>
</dependency>
该依赖包含了处理 XLSX 所需的核心类,如 XSSFWorkbook、XSSFSheet、XSSFRow 等。
2. 解析XML文件
Java 提供了多种方式解析 XML,这里以标准的 DOM 解析为例,适合中小规模 XML 文件。
立即学习“Java免费学习笔记(深入)”;
假设有如下结构的 XML 文件(data.xml):
<employees>
<employee id="1">
<name>张三</name>
<age>30</age>
<department>技术部</department>
</employee>
<employee id="2">
<name>李四</name>
<age>28</age>
<department>人事部</department>
</employee>
</employees>
使用 DOM 解析该文件的代码如下:
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
DocumentBuilder builder = factory.newDocumentBuilder();
Document doc = builder.parse(new File("data.xml"));
doc.getDocumentElement().normalize();
NodeList nodeList = doc.getElementsByTagName("employee");
List<Map<String, String>> dataList = new ArrayList<>();
for (int i = 0; i < nodeList.getLength(); i++) {
Node node = nodeList.item(i);
if (node.getNodeType() == Node.ELEMENT_NODE) {
Element element = (Element) node;
Map<String, String> row = new HashMap<>();
row.put("id", element.getAttribute("id"));
row.put("name", element.getElementsByTagName("name").item(0).getTextContent());
row.put("age", element.getElementsByTagName("age").item(0).getTextContent());
row.put("department", element.getElementsByTagName("department").item(0).getTextContent());
dataList.add(row);
}
}
3. 使用Apache POI生成Excel文件
将解析后的数据写入 Excel 文件:
// 创建工作簿和工作表
XSSFWorkbook workbook = new XSSFWorkbook();
XSSFSheet sheet = workbook.createSheet("员工信息");
// 创建表头
XSSFRow headerRow = sheet.createRow(0);
headerRow.createCell(0).setCellValue("ID");
headerRow.createCell(1).setCellValue("姓名");
headerRow.createCell(2).setCellValue("年龄");
headerRow.createCell(3).setCellValue("部门");
// 填充数据
int rowNum = 1;
for (Map<String, String> data : dataList) {
XSSFRow row = sheet.createRow(rowNum++);
row.createCell(0).setCellValue(data.get("id"));
row.createCell(1).setCellValue(data.get("name"));
row.createCell(2).setCellValue(Integer.parseInt(data.get("age")));
row.createCell(3).setCellValue(data.get("department"));
}
// 自动调整列宽
for (int i = 0; i < 4; i++) {
sheet.autoSizeColumn(i);
}
// 写入文件
try (FileOutputStream out = new FileOutputStream("员工信息.xlsx")) {
workbook.write(out);
}
// 关闭资源
workbook.close();
执行后将在项目根目录生成名为“员工信息.xlsx”的文件,包含完整的XML数据。
4. 注意事项与优化建议
- 大文件XML应考虑使用SAX或StAX解析,避免内存溢出
- 写入大量数据时可启用POI的SXSSFWorkbook以降低内存占用
- 注意关闭流资源,推荐使用 try-with-resources
- 对数字、日期等字段设置合适的单元格格式,提升可读性
- 路径和文件名建议做参数化处理,增强通用性
基本上就这些。通过结合 Java 内置的 XML 解析能力与 Apache POI 的 Excel 操作功能,可以高效实现数据转换任务。整个过程清晰、稳定,适用于大多数企业级应用。
以上就是Java解析XML并生成Excel文件 Apache POI库应用指南的详细内容,更多请关注php中文网其它相关文章!