首页 > Java > java教程 > 正文

Java Stream API实战:实现多条件过滤、按日期月份分组及聚合计数

心靈之曲
发布: 2025-10-13 12:30:00
原创
328人浏览过

Java Stream API实战:实现多条件过滤、按日期月份分组及聚合计数

本文详细介绍了如何利用java stream api高效处理复杂数据。通过一个具体案例,演示了如何结合多条件过滤、自定义分组键(按日期月份和事件类型)、以及使用`collectors.counting()`进行聚合计数,最终将处理结果转换为结构化的dto列表,帮助开发者掌握java 8+流式编程的高级技巧。

在现代Java应用开发中,数据处理是核心任务之一。Java 8引入的Stream API极大地简化了集合数据的操作,使其更具可读性和表达力。本文将深入探讨如何利用Stream API实现复杂的数据转换需求,包括多条件过滤、按日期字段(月份)分组,并对分组结果进行聚合计数。我们将通过一个具体的场景来演示这些高级特性。

场景描述与数据模型

假设我们有一个包含人员事件信息的列表。每个Person对象记录了一个事件(如JOIN入职或EXIT离职)及其发生的日期。我们的目标是统计每个月不同事件类型(JOIN或EXIT)的总人数。

首先,我们定义相关的数据模型:

  1. Person 类:表示一个人员事件。

    立即学习Java免费学习笔记(深入)”;

    import java.time.LocalDate;
    
    public class Person {
        private String id;
        private String name;
        private String surname;
        private State event; // JOIN, EXIT
        private Object value; // 示例中未用到,可忽略
        private LocalDate eventDate;
    
        public Person(String id, String name, String surname, State event, LocalDate eventDate) {
            this.id = id;
            this.name = name;
            this.surname = surname;
            this.event = event;
            this.eventDate = eventDate;
        }
    
        public String getId() { return id; }
        public State getEvent() { return event; }
        public LocalDate getEventDate() { return eventDate; }
    
        // 假设 State 是一个枚举类型
        public enum State {
            JOIN, EXIT, OTHER
        }
    
        @Override
        public String toString() {
            return "Person{" +
                   "id='" + id + '\'' +
                   ", event=" + event +
                   ", eventDate=" + eventDate +
                   '}';
        }
    }
    登录后复制
  2. DTO 类:表示最终的统计结果。

    public class DTO {
        private int month;
        private Person.State info;
        private int totalEmployees;
    
        public DTO(int month, Person.State info, int totalEmployees) {
            this.month = month;
            this.info = info;
            this.totalEmployees = totalEmployees;
        }
    
        public int getMonth() { return month; }
        public Person.State getInfo() { return info; }
        public int getTotalEmployees() { return totalEmployees; }
    
        @Override
        public String toString() {
            return "DTO{" +
                   "Month=" + month +
                   ", Info=" + info +
                   ", Total Number=" + totalEmployees +
                   '}';
        }
    }
    登录后复制

核心挑战:自定义分组键

为了实现按月份和事件类型同时分组,我们需要一个复合键。Java 16及更高版本推荐使用record类型来简洁地定义这样的数据载体;对于早期版本,可以使用一个普通的class。

// Java 16+ 的 record
public record MonthState(int month, Person.State info) {}

// Java 8-15 的 class 等效实现
/*
public class MonthState {
    private final int month;
    private final Person.State info;

    public MonthState(int month, Person.State info) {
        this.month = month;
        this.info = info;
    }

    public int getMonth() { return month; }
    public Person.State getInfo() { return info; }

    @Override
    public boolean equals(Object o) {
        if (this == o) return true;
        if (o == null || getClass() != o.getClass()) return false;
        MonthState that = (MonthState) o;
        return month == that.month && info == that.info;
    }

    @Override
    public int hashCode() {
        return Objects.hash(month, info);
    }
}
*/
登录后复制

注意:如果使用class,必须正确实现equals()和hashCode()方法,以确保Map能够正确地将具有相同月份和事件状态的对象视为相同的键。record类型会自动生成这些方法。

Stream API 解决方案详解

我们将从一个Map<String, List<Person>>类型的数据源开始,其中键是pId,值是该pId对应的Person对象列表。

import java.util.*;
import java.util.stream.Collectors;
import java.time.LocalDate;

public class StreamGroupingExample {

    public static void main(String[] args) {
        // 示例数据初始化
        Map<String, List<Person>> personListById = new HashMap<>();
        personListById.put("per1", Arrays.asList(
            new Person("per1", "John", "Doe", Person.State.JOIN, LocalDate.of(2022, 1, 10))
        ));
        personListById.put("per2", Arrays.asList(
            new Person("per2", "Jane", "Smith", Person.State.JOIN, LocalDate.of(2022, 1, 10))
        ));
        personListById.put("per3", Arrays.asList(
            new Person("per3", "Bob", "Johnson", Person.State.EXIT, LocalDate.of(2022, 1, 10)),
            new Person("per3", "Bob", "Johnson", Person.State.EXIT, LocalDate.of(2022, 2, 10))
        ));
        personListById.put("per4", Arrays.asList(
            new Person("per4", "Alice", "Williams", Person.State.JOIN, LocalDate.of(2022, 3, 10))
        ));
        personListById.put("per5", Arrays.asList( // 包含其他事件类型的示例
            new Person("per5", "Charlie", "Brown", Person.State.OTHER, LocalDate.of(2022, 1, 15))
        ));

        // Stream 管道处理
        List<DTO> result = personListById.values().stream()
            // 1. 扁平化处理:将Map中所有List<Person>合并成一个Person流
            .flatMap(List::stream)
            // 2. 多条件过滤:只保留JOIN或EXIT事件类型的Person对象
            .filter(per -> per.getEvent() == Person.State.EXIT || per.getEvent() == Person.State.JOIN)
            // 3. 核心分组与计数:
            //    - 使用MonthState作为分组键,结合月份和事件类型
            //    - 使用Collectors.counting()作为下游收集器,计算每个分组中的元素数量
            .collect(Collectors.groupingBy(
                p -> new MonthState(p.getEventDate().getMonthValue(), p.getEvent()),
                Collectors.counting() // 统计每个分组的元素数量
            ))
            // 4. 将Map<MonthState, Long>的entrySet转换为Stream<Map.Entry<MonthState, Long>>
            .entrySet().stream()
            // 5. 映射为DTO对象:将Map.Entry转换为我们期望的DTO格式
            .map(entry -> new DTO(entry.getKey().month(), entry.getKey().info(), entry.getValue().intValue()))
            // 6. 排序:按月份升序排列
            .sorted(Comparator.comparing(DTO::getMonth))
            // 7. 收集结果:将Stream<DTO>收集为List<DTO>
            .toList(); // Java 16+,等同于 .collect(Collectors.toList())

        // 打印结果
        result.forEach(System.out::println);
        /* 预期输出:
        DTO{Month=1, Info=JOIN, Total Number=2}
        DTO{Month=1, Info=EXIT, Total Number=1}
        DTO{Month=2, Info=EXIT, Total Number=1}
        DTO{Month=3, Info=JOIN, Total Number=1}
        */
    }
}
登录后复制

Stream 管道分解:

  1. personListById.values().stream():

    百度智能云·曦灵
    百度智能云·曦灵

    百度旗下的AI数字人平台

    百度智能云·曦灵 83
    查看详情 百度智能云·曦灵
    • 首先,我们从Map中获取所有List<Person>的集合,并将其转换为一个Stream<List<Person>>。
  2. .flatMap(List::stream):

    • flatMap操作用于将Stream<List<Person>>扁平化为一个Stream<Person>。这意味着所有嵌套在列表中的Person对象都被提取出来,形成一个单一的流,以便后续处理。
  3. .filter(per -> per.getEvent() == Person.State.EXIT || per.getEvent() == Person.State.JOIN):

    • 这一步执行多条件过滤。我们只关心事件类型为JOIN或EXIT的Person对象,排除了其他不相关的事件。
  4. .collect(Collectors.groupingBy(p -> new MonthState(p.getEventDate().getMonthValue(), p.getEvent()), Collectors.counting())):

    • 这是整个管道的核心。Collectors.groupingBy()是一个强大的收集器,它将流中的元素根据提供的分类函数进行分组。
      • 分类函数 (p -> new MonthState(...)): 为每个Person对象创建一个MonthState实例作为分组键。这个键包含了事件发生的月份 (p.getEventDate().getMonthValue()) 和事件类型 (p.getEvent())。
      • 下游收集器 (Collectors.counting()): 对于每个分组,Collectors.counting()会计算该分组中元素的数量,其结果类型为Long。
    • 这一步结束后,我们得到一个Map<MonthState, Long>,其中键是月份和事件类型的组合,值是对应的计数。
  5. .entrySet().stream():

    • 为了将Map转换成我们最终的DTO列表,我们需要遍历Map的键值对。entrySet().stream()将Map的条目集转换为一个Stream<Map.Entry<MonthState, Long>>。
  6. .map(entry -> new DTO(entry.getKey().month(), entry.getKey().info(), entry.getValue().intValue())):

    • map操作将每个Map.Entry对象转换为一个DTO对象。
      • entry.getKey().month() 和 entry.getKey().info() 用于获取MonthState中的月份和事件类型。
      • entry.getValue().intValue() 将计数(Long类型)转换为int类型以适应DTO。
  7. .sorted(Comparator.comparing(DTO::getMonth)):

    • 对最终的DTO流进行排序,按照月份的升序排列,使输出结果更具可读性。
  8. .toList():

    • 将处理并排序后的DTO流收集到一个List<DTO>中,作为最终结果。

关键点与注意事项

  • 自定义分组键的重要性:当需要根据多个属性进行分组时,创建一个包含这些属性的自定义对象(如MonthState)作为分组键是最佳实践。对于Java 16+,record提供了极简的实现方式。
  • flatMap的使用场景:当处理包含嵌套集合的集合时,flatMap是不可或缺的,它能将多层结构扁平化为单一流,方便后续操作。
  • Collectors.groupingBy的灵活性:groupingBy可以接受一个下游收集器,这使得它能够执行各种聚合操作,如counting()、summingInt()、averagingDouble()等。
  • 类型转换:在将Long类型的计数转换为int时,需要注意潜在的溢出问题,尽管在大多数计数场景中不太可能发生。
  • 日期处理:LocalDate提供了方便的方法来获取日期的各个部分,如getMonthValue()获取月份。

总结

通过本文的详细讲解和示例,我们展示了如何利用Java Stream API的强大功能,结合多条件过滤、自定义分组键以及Collectors.groupingBy和counting()等高级特性,高效地处理复杂的数据聚合需求。掌握这些技巧将使您在日常开发中能够编写出更简洁、更具表达力且性能优越的数据处理代码。

以上就是Java Stream API实战:实现多条件过滤、按日期月份分组及聚合计数的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号