
在数据交换和存储中,CSV(Comma Separated Values)和XML(Extensible Markup Language)都是非常常见的数据格式。有时,我们需要将CSV格式的数据转换为XML,并且对XML的结构有特定的要求。一个常见的需求是将CSV文件中的每一行数据转换为XML的一个元素(例如 <row>),而该行中的每一列数据则作为这个XML元素的属性,而不是独立的子元素。
例如,对于以下CSV数据:
Col1,Col2,Col3,Col4,Col5 All,0,,0,0 All,935,231,0,30 None,1011,257,0,30
我们期望生成的XML文件是这样的:
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<root>
<row col1="All" col2="0" col3="" col4="0" col5="0"></row>
<row col1="All" col2="935" col3="231" col4="0" col5="30"></row>
<row col1="None" col2="1011" col3="257" col4="0" col5="30"></row>
</root>这与将列数据作为子元素(如 <row><Col1>All</Col1>...</row>) 的常见转换方式有所不同,需要特定的处理方法。
立即学习“Java免费学习笔记(深入)”;
使用Java的javax.xml.parsers.DocumentBuilder和org.w3c.dom包来手动构建XML是一种常见的方式。然而,当我们需要将CSV列数据转换为XML属性时,这种方法容易导致错误。
例如,如果按照以下逻辑构建XML:
Element rowElement = newDoc.createElement("row");
// ... 遍历CSV列数据 ...
String curValue = String.valueOf(stringTokenizer.nextElement());
Element curElement = newDoc.createElement(csvFields[i++]); // 使用列名作为元素名
curElement.appendChild(newDoc.createTextNode(curValue)); // 将值作为文本节点
rowElement.appendChild(curElement); // 将子元素添加到行元素这段代码的newDoc.createElement(csvFields[i++])会为每个CSV列创建一个新的XML元素,例如 <Col1>、<Col2> 等,并将CSV值作为这些元素的文本内容。这最终会生成如下的XML结构:
<dataset>
<row>
<Col1>All</Col1>
<Col2>0</Col2>
<!-- ... -->
</row>
<!-- ... -->
</dataset>这显然不符合我们将列值作为属性的需求。要将数据作为属性,需要使用 setAttribute 方法,而不是 createElement 和 appendChild 来创建子元素。但手动管理大量属性会使代码变得复杂且易错。
为了高效且优雅地实现CSV到XML属性的转换,我们强烈推荐使用JAXB(Java Architecture for XML Binding)框架。JAXB提供了一种将Java对象与XML文档之间进行映射(编组和解组)的机制,极大地简化了XML处理。
本文档主要讲述的是Android数据格式解析对象JSON用法;JSON可以将Java对象转成json格式的字符串,可以将json字符串转换成Java。比XML更轻量级,Json使用起来比较轻便和简单。JSON数据格式,在Android中被广泛运用于客户端和服务器通信,在网络数据传输与解析时非常方便。希望本文档会给有需要的朋友带来帮助;感兴趣的朋友可以过来看看
0
JAXB的核心思想是:
通过这种方式,我们可以清晰地定义XML的期望结构,并让JAXB自动处理复杂的XML生成逻辑。
首先,我们需要定义两个POJO类:一个用于表示XML的根元素(例如 <root>),另一个用于表示每一行数据(例如 <row>)。
这个类将包含CSV文件中的每一列数据,并通过 @XmlAttribute 注解将它们映射为XML属性。
import javax.xml.bind.annotation.XmlAttribute;
import javax.xml.bind.annotation.XmlType;
// @XmlType(propOrder = {"col1", "col2", "col3", "col4", "col5"}) // 可选:定义属性在XML中的顺序
public class RowData {
private String col1;
private String col2;
private String col3;
private String col4;
private String col5;
// JAXB需要一个无参构造函数
public RowData() {}
public RowData(String col1, String col2, String col3, String col4, String col5) {
this.col1 = col1;
this.col2 = col2;
this.col3 = col3;
this.col4 = col4;
this.col5 = col5;
}
// 使用 @XmlAttribute 注解将字段映射为XML属性
@XmlAttribute(name = "col1") // name属性指定XML中属性的名称
public String getCol1() { return col1; }
public void setCol1(String col1) { this.col1 = col1; }
@XmlAttribute(name = "col2")
public String getCol2() { return col2; }
public void setCol2(String col2) { this.col2 = col2; }
@XmlAttribute(name = "col3")
public String getCol3() { return col3; }
public void setCol3(String col3) { this.col3 = col3; }
@XmlAttribute(name = "col4")
public String getCol4() { return col4; }
public void setCol4(String col4) { this.col4 = col4; }
@XmlAttribute(name = "col5")
public String getCol5() { return col5; }
public void setCol5(String col5) { this.col5 = col5; }
}这个类将包含一个 RowData 对象的列表,并通过 @XmlRootElement 和 @XmlElement 注解来定义XML的根元素和子元素列表。
import javax.xml.bind.annotation.XmlElement;
import javax.xml.bind.annotation.XmlRootElement;
import java.util.List;
@XmlRootElement(name = "root") // 定义XML的根元素为 <root>
public class Root {
private List<RowData> rows;
// 使用 @XmlElement 注解将List映射为XML子元素集合
// name属性指定每个列表项对应的XML元素名称,例如 <row>
@XmlElement(name = "row")
public List<RowData> getRows() {
return rows;
}
public void setRows(List<RowData> rows) {
this.rows = rows;
}
}接下来,我们需要编写逻辑来读取CSV文件,解析每一行数据,并将其转换为 RowData 对象。这些 RowData 对象将被收集到一个列表中,最终封装在 Root 对象中。
import java.io.BufferedReader;
import java.io.FileReader;
import java.io.IOException;
import java.util.ArrayList;
import java.util.List;
public class CsvProcessor {
public List<RowData> parseCsv(String csvFilePath, String delimiter) throws IOException {
List<RowData> rowDatas = new ArrayList<>();
try (BufferedReader csvReader = new BufferedReader(new FileReader(csvFilePath))) {
String line;
String[] headers = null;
// 读取CSV头行,通常包含列名。
// 在本例中,我们假设XML属性名是固定的(col1, col2...),
// 但如果需要动态生成,则需要根据headers来调整POJO或使用更高级的JAXB适配器。
if ((line = csvReader.readLine()) != null) {
headers = line.split(delimiter); // 存储列头,尽管本例中未直接使用其内容作为属性名
}
// 逐行读取CSV数据
while ((line = csvReader.readLine()) != null) {
String[] values = line.split(delimiter);
if (values.length >= 5) { // 确保数据完整性,至少有5列
// 创建RowData对象并填充数据
RowData row = new RowData(
values[0],
values[1],
values[2],
values[3],
values[4]
);
rowDatas.add(row);
} else {
System.err.println("警告: 跳过不完整的CSV行: " + line);
}
}
}
return rowDatas;
}
}有了包含所有 RowData 对象的 Root 对象后,我们就可以使用JAXB的 Marshaller 将其转换为XML文件。
import javax.xml.bind.JAXBContext;
import javax.xml.bind.JAXBException;
import javax.xml.bind.Marshaller;
import java.io.File;
import java.io.IOException;
import java.util.List;
public class CsvToXmlConverter {
public void convertCsvToXmlAttributes(String csvFileName, String xmlFileName, String delimiter) {
try {
// 1. 解析CSV文件,获取RowData对象列表
CsvProcessor csvProcessor = new CsvProcessor();
List<RowData> rowDatas = csvProcessor.parseCsv(csvFileName, delimiter);
// 2. 将RowData列表封装到Root对象中
Root root = new Root();
root.setRows(rowDatas);
// 3. 初始化JAXB上下文
// JAXBContext.newInstance() 需要所有参与编组/解组的类
JAXBContext jaxbContext = JAXBContext.newInstance(Root.class, RowData.class);
// 4. 创建Marshaller实例
Marshaller marshaller = jaxbContext.createMarshaller();
// 5. 配置Marshaller属性
marshaller.setProperty(Marshaller.JAXB_FORMATTED_OUTPUT, true); // 格式化输出,使XML可读
marshaller.setProperty(Marshaller.JAXB_ENCODING, "UTF-8"); // 设置XML编码
// 6. 执行编组,将Java对象写入XML文件
File xmlFile = new File(xmlFileName);
marshaller.marshal(root, xmlFile);
System.out.println("CSV文件 '" + csvFileName + "' 已成功转换为XML文件 '" + xmlFileName + "'。");
} catch (IOException e) {
System.err.println("文件操作错误: " + e.getMessage());
} catch (JAXBException e) {
System.err.println("JAXB编组错误: " + e.getMessage());
} catch (Exception e) {
System.err.println("发生未知错误: " + e.getMessage());
e.printStackTrace();
}
}
public static void main(String[] args) {
// 创建一个示例CSV文件用于测试
String csvContent = "Col1,Col2,Col3,Col4,Col5\n" +
"All,0,,0,0\n" +
"All,935,231,0,30\n" +
"None,1011,257,0,30\n" +
"Partial,1,2\n"; // 示例不完整行
String csvFileName = "data.csv";
String xmlFileName = "output.xml";
String delimiter = ",";
try {
java.nio.file.Files.write(java.nio.file.Paths.get(csvFileName), csvContent.getBytes());
System.out.println("示例CSV文件 '" + csvFileName + "' 已创建。");
CsvToXmlConverter converter = new CsvToXmlConverter();
converter.convertCsvToXmlAttributes(csvFileName, xmlFileName, delimiter);
} catch (IOException e) {
System.err.println("创建或写入文件时发生错误: " + e.getMessage());
}
}
}将上述 RowData.java, Root.java, CsvProcessor.java 和 CsvToXmlConverter.java 文件放置在同一个项目中。确保已添加JAXB依赖(见下一节)。运行 CsvToXmlConverter 的 main 方法后,将生成 output.xml 文件,其内容应与期望的XML结构一致:
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<root>
<row col1="All" col2="0" col3="" col4="0" col5="0"></row>
<row col1="All" col2="935" col3="231" col4="0" col5="30"></row>以上就是Java中将CSV数据转换为XML属性格式的教程的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号