
在php开发中,我们经常会遇到需要从一个包含多个关联数组(即二维数组)的数据集中,根据另一个一维数组中指定的条件值,筛选出符合条件的行。例如,我们有一个用户列表(二维数组),希望根据一个年龄白名单(一维数组)来筛选出特定年龄的用户。
考虑以下示例数据:
$a1 = [
['name' => 'mike', 'age' => 18],
['name' => 'james', 'age' => 22],
['name' => 'sarah', 'age' => 35],
['name' => 'ken', 'age' => 29],
];
$a2 = [22, 25, 35, 40]; // 希望保留age为这些值的用户我们的目标是得到如下结果:
[
['name' => 'james', 'age' => 22],
['name' => 'sarah', 'age' => 35]
]下面将介绍两种实现此过滤的方法。
array_uintersect() 函数可以计算两个或更多数组的交集,并使用用户自定义的比较函数进行值的比较。由于我们的两个数组具有不同的结构(一个二维数组,一个一维数组),因此需要一个自定义的比较函数来指定如何提取和比较值。
立即学习“PHP免费学习笔记(深入)”;
array_uintersect(array $array1, array $array2, ... , callable $value_compare_func) 函数返回一个数组,其中包含所有在 array1 中存在并且在所有其他数组中也存在的值。值是通过用户提供的回调函数进行比较的。
在我们的场景中,$a1 的元素是关联数组,而 $a2 的元素是标量值。直接比较它们会导致错误。因此,我们需要一个回调函数来:
回调函数会接收两个参数,分别代表来自两个(或更多)输入数组的元素。由于在 array_uintersect 的内部迭代过程中,回调函数可能会收到来自 $a1 的完整行数组,也可能收到来自 $a2 的标量年龄值,因此我们需要健壮地处理这两种情况。
<?php
$a1 = [
['name' => 'mike', 'age' => 18],
['name' => 'james', 'age' => 22],
['name' => 'sarah', 'age' => 35],
['name' => 'ken', 'age' => 29],
];
$a2 = [22, 25, 35, 40];
$filteredArray = array_uintersect(
$a1,
$a2,
fn($a, $b) => ($a['age'] ?? $a) <=> ($b['age'] ?? $b)
);
var_export($filteredArray);
?>fn($a, $b) => ($a['age'] ?? $a) <=> ($b['age'] ?? $b) 是一个箭头函数,它定义了比较逻辑。
array_uintersect() 方法的优点是其语义清晰,直接表达了“取交集”的意图。它在内部处理了迭代和比较,代码相对紧凑。对于中等规模的数据集,其性能通常可以接受。然而,对于非常大的数据集,由于自定义回调函数的每次调用都会带来一定的开销,可能需要进行基准测试以评估其性能。
另一种更直观且常用的方法是使用 array_filter() 配合一个回调函数,该回调函数内部使用 in_array() 来检查当前元素的 age 值是否在白名单 $a2 中。
将两者结合,我们可以遍历 $a1 中的每个用户行,然后检查该用户的 age 是否存在于 $a2 白名单中。
<?php
$a1 = [
['name' => 'mike', 'age' => 18],
['name' => 'james', 'age' => 22],
['name' => 'sarah', 'age' => 35],
['name' => 'ken', 'age' => 29],
];
$a2 = [22, 25, 35, 40];
$filteredArray = array_filter(
$a1,
fn($row) => in_array($row['age'], $a2)
);
var_export($filteredArray);
?>in_array() 在每次调用时都需要遍历其内部数组 $a2 来查找值。如果 $a1 非常大(需要多次调用 in_array()),并且 $a2 也非常大,那么这种重复遍历可能会导致性能瓶颈,因为 in_array() 的时间复杂度是 O(n)。
为了优化性能,尤其是在 $a2 包含大量元素时,我们可以先将 $a2 转换为一个关联数组(哈希表/查找表),这样 isset() 或 array_key_exists() 的查找时间复杂度就接近 O(1)。
<?php
$a1 = [
['name' => 'mike', 'age' => 18],
['name' => 'james', 'age' => 22],
['name' => 'sarah', 'age' => 35],
['name' => 'ken', 'age' => 29],
];
$a2 = [22, 25, 35, 40];
// 将 $a2 转换为一个用于快速查找的哈希表
// 例如:[22 => true, 25 => true, 35 => true, 40 => true]
$whitelistLookup = array_flip(array_map('strval', $a2)); // 使用 strval 确保键是字符串,防止意外类型转换
$filteredArray = array_filter(
$a1,
fn($row) => isset($whitelistLookup[(string)$row['age']]) // 使用 isset 进行 O(1) 查找
);
var_export($filteredArray);
?>注意事项:
array_filter() 结合 in_array() 的方法在代码可读性上通常优于 array_uintersect(),尤其对于不熟悉复杂回调函数的开发者。它易于理解和实现。当白名单数组 $a2 较小,或者 $a1 数组也较小时,性能差异不明显。但如前所述,对于大规模数据,转换为哈希表进行查找是提高性能的关键优化。
两种方法都能有效解决根据一维数组过滤二维数组特定列的问题。
array_uintersect() 方法:
array_filter() 结合 in_array() 方法:
在实际开发中,建议根据具体的数据规模和性能要求来选择最合适的方法。对于大多数常见场景,array_filter() 结合优化的哈希表查找通常是兼顾可读性和性能的最佳实践。
以上就是PHP:基于一维数组对二维数组指定列进行过滤的两种方法的详细内容,更多请关注php中文网其它相关文章!
PHP怎么学习?PHP怎么入门?PHP在哪学?PHP怎么学才快?不用担心,这里为大家提供了PHP速学教程(入门到精通),有需要的小伙伴保存下载就能学习啦!
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号