
在日常的字符串处理中,我们有时会遇到需要根据字符串中内嵌的数字对其中的词语进行重新排序的需求。例如,给定一个字符串 "my1kiran4name2is3",其中每个词语后面都紧跟着一个数字。我们的目标是根据这些数字(1到9)的顺序,将词语重新排列,最终得到 "my name is kiran"。
解决这类问题的关键在于:
Java提供了强大的正则表达式和Stream API,可以优雅地实现上述逻辑。
本方案中使用了两个关键的正则表达式:
立即学习“Java免费学习笔记(深入)”;
整个处理流程通过Stream API链式操作完成:
初始分割: Arrays.asList(string.split("(?<=\d)")):首先,利用 (?<=\d) 正向后行断言将原始字符串分割成 ["my1", "kiran4", "name2", "is3"] 这样的列表,并将其转换为一个Stream。
二次分割与映射: .stream().map(s -> s.split("(?=\d)")):对Stream中的每个元素(例如 "my1"),再次使用 (?=\d) 正向前行断言进行分割。这将把 "my1" 转换为 ["my", "1"],"kiran4" 转换为 ["kiran", "4"],以此类推。
收集到Map: .collect(Collectors.toMap((e -> Integer.parseInt(e[1])), e -> e[0])):这是核心的收集步骤。
按序重构字符串: map.values().stream().collect((Collectors.joining(" "))):
map.values():获取Map中所有的值(即词语)的集合。由于 HashMap 默认不保证顺序,但 TreeMap 或 LinkedHashMap 可以保持键的插入顺序或自然顺序。然而,Collectors.toMap 默认返回 HashMap。为了确保按数字顺序,我们需要利用Map键的自然排序特性。当从 Map 中获取 values() 并将其转换为 Stream 时,如果Map是基于键排序的(如 TreeMap),那么 values() 的迭代顺序就会是键的排序顺序。对于 HashMap,其 values() 的迭代顺序是不确定的。因此,为了确保正确的顺序,实际上需要对Map的键进行排序,然后根据排序后的键来获取值。
然而,原始代码中直接对 map.values() 进行 stream().collect(Collectors.joining(" ")),这依赖于 Collectors.toMap 内部实现对键的排序(或Map的默认迭代顺序恰好与期望一致)。更严谨的做法是:
String result = map.entrySet().stream() // 获取EntrySet
.sorted(Map.Entry.comparingByKey()) // 按键排序
.map(Map.Entry::getValue) // 映射为值
.collect(Collectors.joining(" ")); // 拼接但鉴于题目中给出的原始答案,其隐含假设是 Collectors.toMap 某种程度上能保证或最终结果符合预期,或者在简单场景下 HashMap 的迭代顺序碰巧符合。在Java 8+中,Collectors.toMap 默认返回 HashMap,其迭代顺序是不确定的。因此,为了确保按数字顺序,上述更严谨的排序步骤是必要的。原代码的简洁性是以潜在的顺序不确定性为代价的。
Collectors.joining(" "):将Stream中的所有字符串元素用空格 " " 连接起来,形成最终的字符串。
import java.util.Arrays;
import java.util.Map;
import java.util.stream.Collectors;
import java.util.TreeMap; // 引入TreeMap以保证排序
public class StringRearranger {
public static void main(String[] args) {
String string = "my1kiran4name2is3";
// 步骤1 & 2: 分割字符串并提取词语与数字,收集到TreeMap以保证键的顺序
// 注意:这里将Collectors.toMap的Supplier改为TreeMap::new,以确保Map是排序的
Map<Integer, String> map =
Arrays.asList(string
.split("(?<=\d)")) // 第一次分割:["my1", "kiran4", "name2", "is3"]
.stream()
.map(s -> s.split("(?=\d)")) // 第二次分割:例如 "my1" -> ["my", "1"]
.collect(Collectors.toMap(
e -> Integer.parseInt(e[1]), // 键:数字
e -> e[0], // 值:词语
(oldValue, newValue) -> oldValue, // 合并函数,处理重复键,这里简单取旧值
TreeMap::new)); // 指定使用TreeMap,保证键的自然排序
// 步骤3: 从TreeMap中按键的自然顺序取出值,并用空格连接
// TreeMap本身就保持了键的排序,所以直接获取values()并流式处理即可
String result = map
.values()
.stream()
.collect(Collectors.joining(" "));
System.out.println(result); // 输出: my name is kiran
}
}代码改进说明:为了确保最终字符串的顺序是正确的,我们将 Collectors.toMap 的第三个参数(合并函数)和第四个参数(Map供应商)进行了调整。通过 TreeMap::new 指定使用 TreeMap 作为底层Map实现,TreeMap 会自动根据键的自然顺序(对于 Integer 就是数值大小)进行排序。这样,当调用 map.values().stream() 时,Stream中的元素就会是按数字从小到大排列的词语。
通过巧妙地运用Java的正则表达式(特别是前后行断言)和Stream API,我们能够高效且简洁地解决根据字符串中内嵌数字对词语进行重排序的问题。这种方法展示了函数式编程在字符串处理中的强大能力。理解其背后的原理和注意事项,将有助于开发者在实际项目中灵活运用这些高级特性。
以上就是Java字符串分段排序:利用正则表达式和Stream API按内嵌数字重排词语的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号