
在现代java开发中,处理集合数据是常见的任务。我们经常会遇到这样的场景:一个对象列表中,每个对象又包含一个子列表,我们需要从这些子列表中提取特定的属性,并收集其唯一值。例如,我们有一个employee(员工)列表,每个employee对象包含一个address(地址)列表,而每个address对象又有一个city(城市)属性。我们的目标是获取所有员工居住过的城市的唯一名称集合。
首先,我们定义Employee和Address这两个类,它们将作为我们数据结构的基础:
import java.util.List;
import java.util.Set;
import java.util.ArrayList;
import java.util.HashSet;
import java.util.stream.Collectors;
public class StreamTutorial {
public static class Address {
private String city;
public Address(String city) {
this.city = city;
}
public String getCity() {
return city;
}
@Override
public String toString() {
return "Address{" + "city='" + city + '\'' + '}';
}
}
public static class Employee {
private List<Address> addresses;
public Employee(List<Address> addresses) {
this.addresses = addresses;
}
public List<Address> getAddresses() {
return addresses;
}
@Override
public String toString() {
return "Employee{" + "addresses=" + addresses + '}';
}
}
// 传统方法(用于对比)
public static Set<String> getCityUniqueNameLegacy(List<Employee> employees) {
Set<String> cityUniqueName = new HashSet<>();
for (Employee e : employees) {
List<Address> addList = e.getAddresses();
for (Address add : addList) {
cityUniqueName.add(add.getCity());
}
}
return cityUniqueName;
}
// 主方法用于演示
public static void main(String[] args) {
// 准备示例数据
List<Employee> employees = new ArrayList<>();
employees.add(new Employee(List.of(new Address("New York"), new Address("London"))));
employees.add(new Employee(List.of(new Address("Paris"), new Address("New York"))));
employees.add(new Employee(List.of(new Address("London"), new Address("Tokyo"))));
System.out.println("--- 传统方法获取唯一城市 ---");
Set<String> legacyCities = getCityUniqueNameLegacy(employees);
System.out.println(legacyCities); // 输出: [New York, London, Paris, Tokyo]
System.out.println("\n--- 使用 flatMap() 获取唯一城市 ---");
Set<String> flatMapCities = getCityUniqueNameWithFlatMap(employees);
System.out.println(flatMapCities); // 输出: [New York, London, Paris, Tokyo]
System.out.println("\n--- 使用 mapMulti() 获取唯一城市 ---");
Set<String> mapMultiCities = getCityUniqueNameWithMapMulti(employees);
System.out.println(mapMultiCities); // 输出: [New York, London, Paris, Tokyo]
}
}传统上,我们会使用嵌套的for循环来遍历Employee列表及其内部的Address列表,然后将每个城市的名称添加到HashSet中以确保唯一性。上述代码中的getCityUniqueNameLegacy方法展示了这种实现方式。虽然这种方法可行,但当逻辑变得更复杂时,嵌套循环会降低代码的可读性和简洁性。
Java 8 引入的 Stream API 提供了一种更声明式、更简洁的方式来处理集合数据。对于从嵌套集合中提取数据的场景,Stream API 中的扁平化操作(flatMap()和mapMulti())是关键。
flatMap()操作是Stream API中用于扁平化流的强大工具。它接收一个函数作为参数,该函数将流中的每个元素转换成一个新的流,然后flatMap()会将所有这些新生成的流合并(扁平化)为一个单一的流。
立即学习“Java免费学习笔记(深入)”;
在我们的例子中,Stream<Employee>需要转换为Stream<Address>,然后才能进一步提取城市名称。flatMap()正是为此而生。
实现方式:
public static Set<String> getCityUniqueNameWithFlatMap(List<Employee> employees) {
return employees.stream() // 将List<Employee>转换为Stream<Employee>
.flatMap(employee -> employee.getAddresses().stream()) // 将每个Employee对象的地址列表(List<Address>)转换为一个Stream<Address>,然后扁平化所有这些Stream<Address>为一个单一的Stream<Address>
.map(Address::getCity) // 从每个Address对象中提取城市名称(String)
.collect(Collectors.toSet()); // 将所有唯一的城市名称收集到一个Set<String>中
}解析:
mapMulti()是Java 16中引入的一个操作,它提供了一种更灵活的方式来转换流元素,尤其适用于一个输入元素可能产生零个、一个或多个输出元素的场景。它接收一个BiConsumer作为参数,其中第一个参数是当前流元素,第二个参数是一个Consumer,用于将结果元素添加到下游流中。
实现方式:
public static Set<String> getCityUniqueNameWithMapMulti(List<Employee> employees) {
return employees.stream() // 将List<Employee>转换为Stream<Employee>
.<Address>mapMulti((employee, addressConsumer) -> // 为每个Employee应用转换
employee.getAddresses().forEach(addressConsumer)) // 遍历当前Employee的地址列表,并将每个地址通过addressConsumer添加到下游流
.map(Address::getCity) // 从每个Address对象中提取城市名称
.collect(Collectors.toSet()); // 收集唯一的城市名称到Set中
}解析:
简洁性与可读性:无论是flatMap()还是mapMulti(),都比传统的嵌套for循环提供了更简洁、更具声明性的代码。它们使得数据转换的意图更加清晰。
选择合适的扁平化操作:
空值处理:在实际应用中,employee.getAddresses()可能返回null。为了避免NullPointerException,可以考虑在flatMap或mapMulti的Lambda表达式中添加null检查,或者确保getAddresses()方法总是返回一个非null的空列表。例如:
// flatMap中处理null
.flatMap(employee -> Optional.ofNullable(employee.getAddresses()).orElse(Collections.emptyList()).stream())
// mapMulti中处理null
.<Address>mapMulti((employee, consumer) -> {
List<Address> addresses = employee.getAddresses();
if (addresses != null) {
addresses.forEach(consumer);
}
})并行处理:Stream API天生支持并行处理。如果数据量非常大,可以通过employees.parallelStream()轻松地将操作并行化,以提高处理速度。
通过掌握flatMap()和mapMulti(),您可以更高效、更优雅地处理Java中复杂的嵌套集合数据,编写出更具现代感的代码。
以上就是Java Stream API:高效处理嵌套列表并获取唯一元素的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号