
在处理大量数据时,例如对一个包含数千甚至数万个字符串的列表进行两两相似度计算,单线程执行会非常耗时。将这类计算密集型任务并行化是提升性能的有效途径。然而,不恰当的多线程实现,如让每个线程独立地执行整个任务,不仅无法实现并行加速,反而可能引入额外的同步开销,甚至导致错误。正确的做法是将大任务分解为多个独立的小任务,然后由线程池中的线程并行处理。
Java提供了java.util.concurrent.ExecutorService接口及其实现,用于管理和执行异步任务。它提供了一种高级的并发机制,将任务提交与线程管理分离,使得开发者可以专注于业务逻辑,而不必直接操作底层线程。
任务分解原则: 要有效利用多线程,关键在于将原始问题分解成一系列可以独立执行的子任务。对于字符串相似度计算,我们可以将“计算一个特定字符串与列表中所有其他字符串的相似度”作为一个独立的任务。
为了将每个字符串的相似度计算封装成一个可由线程执行的任务,我们创建一个实现Runnable接口的内部类SimilarityRunnable。
import java.util.List;
import java.util.concurrent.ExecutorService;
import java.util.concurrent.Executors;
// 假设 solution 对象和 listExe 已经定义并可用
// 例如:
class Solution {
public double findSimilarityRatio(String s1, String s2) {
// 实际的字符串相似度计算逻辑
// 这是一个示例,实际应用中会使用更复杂的算法
if (s1 == null || s2 == null) return 0.0;
int commonLength = 0;
for (char c : s1.toCharArray()) {
if (s2.indexOf(c) != -1) {
commonLength++;
}
}
return (double) commonLength / (s1.length() + s2.length() - commonLength);
}
}
class ListExecutor {
public List<String> getStringList() {
// 模拟获取字符串列表
return List.of("apple", "apricot", "banana", "bandana", "orange", "grape");
}
}
public class MultiThreadSimilarityCalculator {
// 假设 solution 是一个线程安全的或在run方法内部进行同步的对象
private static final Solution solution = new Solution();
private static final ListExecutor listExe = new ListExecutor();
private static class SimilarityRunnable implements Runnable {
private final String str;
private final List<String> stringList;
/**
* 构造函数,传入当前需要比较的字符串和完整的字符串列表。
* @param str 当前要计算相似度的字符串
* @param stringList 用于比较的字符串列表
*/
public SimilarityRunnable(String str, List<String> stringList) {
this.str = str;
this.stringList = stringList;
}
@Override
public void run() {
for (String listStr : stringList) {
// 避免自身与自身比较。
// 注意:这里使用 == 比较的是对象引用,如果列表中包含通过不同方式创建但内容相同的字符串,
// 它们将不会被跳过。对于此场景,通常是希望跳过列表中的“同一个”元素。
if (listStr == str) {
continue;
}
// 打印当前线程名和相似度结果
// 如果 solution 对象非线程安全,则需要在这里对其进行同步,例如:
// synchronized (solution) { ... }
System.out.println(Thread.currentThread().getName()
+ ": similarity of '" + str + "' to '" + listStr + "' is "
+ solution.findSimilarityRatio(str, listStr));
}
}
}
// ... main 方法在下面定义
}在SimilarityRunnable中:
在main方法中,我们创建ExecutorService,并向其提交SimilarityRunnable任务。
立即学习“Java免费学习笔记(深入)”;
// ... MultiThreadSimilarityCalculator 类中
public static void main(String[] args) {
// 创建一个固定大小的线程池,例如10个线程
// 线程池会复用这些线程来执行提交的任务
ExecutorService pool = Executors.newFixedThreadPool(10);
// 获取待处理的字符串列表
List<String> stringList = listExe.getStringList();
// 遍历字符串列表,为每个字符串创建一个 SimilarityRunnable 任务并提交给线程池
for (String str : stringList) {
pool.submit(new SimilarityRunnable(str, stringList));
}
// 所有任务提交完毕后,关闭线程池
// shutdown() 方法会等待所有已提交的任务执行完毕,然后关闭线程池
pool.shutdown();
// (可选)等待所有任务完成,以确保主线程在所有计算完成前不会退出
// try {
// pool.awaitTermination(Long.MAX_VALUE, TimeUnit.NANOSECONDS);
// } catch (InterruptedException e) {
// Thread.currentThread().interrupt();
// System.err.println("等待线程池终止时被中断: " + e.getMessage());
// }
System.out.println("所有相似度计算任务已提交。");
}
}在main方法中:
通过上述方法,我们能够有效地利用Java的ExecutorService和线程池机制,将复杂的字符串相似度计算任务并行化,从而显著提高程序的执行效率。
以上就是Java多线程实践:使用ExecutorService高效计算字符串相似度的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号