
本文详细介绍了在numpy中如何有效比较浮点数数组,尤其是在存在精度差异时。我们将探讨`numpy.isclose`函数的使用方法,该函数允许通过设定绝对容差(`atol`)和相对容差(`rtol`)来执行灵活的近似相等性检查,从而避免因浮点数表示限制导致的精确匹配失败问题,确保数据比较的鲁棒性。
在计算机科学中,浮点数(如float64)的表示是近似的,这源于其二进制表示的限制。这意味着许多十进制小数无法被精确表示,从而导致在数学运算或数据存储后产生微小的精度误差。当我们需要比较两个浮点数数组时,这种微小的差异常常会导致直接使用 == 运算符进行精确匹配失败,即使从逻辑上看它们应该被认为是相等的。
考虑以下 NumPy 数组的例子:
import numpy as np
e = np.array([0.8292222222222225, 0.1310000000000003])
print(f"原始数组 e: {e}")
print(f"e[0]: {e[0]}")
print(f"e[0] == 0.829225: {e[0] == 0.829225}")输出结果会是 False,因为 0.8292222222222225 与 0.829225 之间存在微小的数值差异。在这种情况下,我们并非要改变数组中浮点数的实际值或其打印精度,而是希望在进行相等性检查时,能够容忍这种固有的精度差异,实现“近似相等”的比较。
为了解决浮点数比较的这一固有挑战,NumPy 提供了 numpy.isclose 函数。该函数允许用户定义一个容差范围,判断两个浮点数是否在这个容差范围内足够接近,从而被认为是相等的。
numpy.isclose(a, b, rtol=1e-05, atol=1e-08, equal_nan=False)
numpy.isclose 的判断条件是:abs(a - b) <= (atol + rtol * abs(b))。只要满足这个条件,对应的元素就被认为是近似相等的。
atol 用于指定一个固定的最大绝对误差。当数值接近零,或者我们对误差的绝对大小有一个明确的上限要求时,atol 非常有用。
让我们使用前述的例子来演示 atol 的作用:
import numpy as np
a = np.array([0.8292222222222225, 0.1310000000000003])
b = np.array([0.8293, 0.132]) # 另一个用于比较的数组
print(f"原始数组 a: {a}")
print(f"比较数组 b: {b}")
# 示例1: atol=1e-3 (0.001)
# abs(0.82922 - 0.8293) = 0.000078 < 0.001 -> True
# abs(0.13100 - 0.132) = 0.001 <= 0.001 -> True
result_1e3 = np.isclose(a, b, atol=1e-3)
print(f"np.isclose(a, b, atol=1e-3): {result_1e3}")
# 示例2: atol=1e-4 (0.0001)
# abs(0.82922 - 0.8293) = 0.000078 < 0.0001 -> True
# abs(0.13100 - 0.132) = 0.001 > 0.0001 -> False
result_1e4 = np.isclose(a, b, atol=1e-4)
print(f"np.isclose(a, b, atol=1e-4): {result_1e4}")
# 示例3: atol=1e-5 (0.00001)
# abs(0.82922 - 0.8293) = 0.000078 > 0.00001 -> False
# abs(0.13100 - 0.132) = 0.001 > 0.00001 -> False
result_1e5 = np.isclose(a, b, atol=1e-5)
print(f"np.isclose(a, b, atol=1e-5): {result_1e5}")
# 针对用户最初的需求:比较 0.8292222222222225 与 0.829225
val_a = 0.8292222222222225
val_b = 0.829225
# 它们之间的绝对差值约为 abs(val_a - val_b) = 2.22222222222225e-06
print(f"\n比较单个值: {val_a} 与 {val_b}")
# 当 atol 设置为 1e-5 (0.00001) 时,差值小于 atol
print(f"np.isclose({val_a}, {val_b}, atol=1e-5): {np.isclose(val_a, val_b, atol=1e-5)}")
# 当 atol 设置为 1e-6 (0.000001) 时,差值大于 atol
print(f"np.isclose({val_a}, {val_b}, atol=1e-6): {np.isclose(val_a, val_b, atol=1e-6)}")rtol 用于指定一个相对误差的上限。当比较的数值大小差异很大,或者我们关心误差与数值本身的比例(例如百分比误差)时,rtol 非常有用。它尤其适用于避免因数值过大而导致绝对误差看起来很大,但相对误差却很小的情况。
# rtol 示例
x = 100.0
y = 100.00001
# 绝对差值是 0.00001
# 相对差值是 abs(x - y) / abs(y) 约等于 0.00001 / 100 = 1e-7
print(f"\n比较 {x} 与 {y} (rtol 示例)")
# rtol=1e-5 (0.00001) 时,相对差值 1e-7 小于 rtol
print(f"np.isclose({x}, {y}, rtol=1e-5): {np.isclose(x, y, rtol=1e-5)}")
# rtol=1e-7 时,相对差值 1e-7 等于 rtol
print(f"np.isclose({x}, {y}, rtol=1e-7): {np.isclose(x, y, rtol=1e-7)}")
# rtol=1e-8 时,相对差值 1e-7 大于 rtol
print(f"np.isclose({x}, {y}, rtol=1e-8): {np.isclose(x, y, rtol=1e-8)}")
# 当数值接近零时,rtol 可能不适用,因为 abs(b) 接近零会导致 rtol * abs(b) 也很小
# 此时 atol 变得更重要
x_small = 1e-10
y_small = 2e-10
print(f"\n比较 {x_small} 与 {y_small} (rtol 和 atol 结合)")
# 相对差值 abs(x_small - y_small) / abs(y_small) = 1e-10 / 2e-10 = 0.5
# rtol=1e-5 显然无法满足
print(f"np.isclose({x_small}, {y_small}, rtol=1e-5): {np.isclose(x_small, y_small, rtol=1e-5)}") # False
# 如果我们希望它们相等,可能需要依赖 atol
print(f"np.isclose({x_small}, {y_small}, atol=1e-9): {np.isclose(x_small, y_small, atol=1e-9)}") # True, 因为 abs(x-y)=1e-10 < 1e-9选择合适的 atol 和 rtol 值是进行鲁棒浮点数比较的关键。
通常情况下,atol 和 rtol 会被一起使用,numpy.isclose 的默认值 (rtol=1e-05, atol=1e-08) 已经是一个比较合理的通用设置。然而,在特定应用中,您可能需要根据数据的特性和业务需求来调整这些值。
注意事项:
numpy.isclose 函数是 NumPy 中处理浮点数数组比较不可或缺的工具。它通过引入绝对容差 (atol) 和相对容差 (rtol) 的概念,使得在面对浮点数固有的精度问题时,我们能够进行灵活且鲁棒的“近似相等”判断。理解并正确应用这些容差参数,对于确保数值计算的准确性和程序的健壮性至关重要。在任何需要比较浮点数数组的场景中,都应优先考虑使用 numpy.isclose,而非直接使用 == 运算符。
以上就是使用numpy.isclose进行浮点数组的容差比较的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号