
sorted()函数用于对可迭代对象进行排序,其核心在于key参数。key参数期望接收一个函数,这个函数将作用于可迭代对象中的每个元素,并返回一个用于比较的值。重要的是,这个key函数必须只接受一个参数,即当前正在处理的列表元素。
例如,当我们有一个只接受一个参数的自定义函数时,可以直接将其传递给key:
from statistics import mean
def sort_by_well_range(col):
"""
根据字符串中的深度范围计算平均深度。
例如:'avgDTS_1100_1200' -> (1100 + 1200) / 2 = 1150.0
"""
parts = col.split('_')[1:] # 移除前缀字符串,保留深度范围
depths = [float(p) for p in parts] # 将字符串转换为浮点数
middle_depth = mean(depths)
return middle_depth
data_list = ['avgDTS_1100_1200', 'avgDTS_900_1000', 'avgDTS_1300_1400', 'avgDTS_800_850']
sorted_list = sorted(data_list, key=sort_by_well_range, reverse=False)
print(f"原始列表: {data_list}")
print(f"排序结果: {sorted_list}")
# 预期输出: ['avgDTS_800_850', 'avgDTS_900_1000', 'avgDTS_1100_1200', 'avgDTS_1300_1400']当自定义排序函数需要多个参数时,直接将其传递给key参数会导致TypeError。这是因为sorted()在遍历列表元素时,只会将当前元素作为唯一的参数传递给key函数。如果key函数声明了额外的参数,但没有接收到它们,就会抛出错误。
考虑以下一个需要额外start参数的函数:
def sort_by_well_range_1(col, start=1):
"""
根据字符串中从指定索引开始的深度范围计算平均深度。
例如:'influx_oil_1100_1200', start=2 -> (1100 + 1200) / 2 = 1150.0
"""
parts = col.split('_')[start:] # 从指定索引开始分割
depths = [float(p) for p in parts]
middle_depth = mean(depths)
return middle_depth
data_list_1 = ['influx_oil_1100_1200', 'influx_oil_900_1000', 'influx_oil_1300_1400', 'influx_oil_800_850']
# 尝试直接调用会报错
try:
# 错误示例:这里实际上是调用了sort_by_well_range_1(start=2)并将其返回值作为key
# 但sort_by_well_range_1()缺少必需的位置参数'col'
sorted_list_1 = sorted(data_list_1, key=sort_by_well_range_1(start=2), reverse=False)
except TypeError as e:
print(f"\n错误信息: {e}")
print("原因:`key`参数期望一个函数对象,而不是函数调用的结果。")
print("并且,即使是函数对象,它也必须只接受一个参数。")上述代码中的错误在于,key=sort_by_well_range_1(start=2)实际上是在将sort_by_well_range_1函数的调用结果(而不是函数本身)赋值给key。由于sort_by_well_range_1在被调用时缺少col参数,因此会立即引发TypeError。即使我们能正确传递函数对象,sorted()在内部调用它时,也只会提供一个参数。
立即学习“Python免费学习笔记(深入)”;
lambda表达式是创建小型匿名函数的简洁方式。我们可以利用lambda来封装多参数函数,并固定其部分参数,从而生成一个只接受一个参数的新函数,供key使用。
from statistics import mean
def sort_by_well_range_1(col, start=1):
"""
根据字符串中从指定索引开始的深度范围计算平均深度。
例如:'influx_oil_1100_1200', start=2 -> (1100 + 1200) / 2 = 1150.0
"""
parts = col.split('_')[start:]
depths = [float(p) for p in parts]
middle_depth = mean(depths)
return middle_depth
data_list_1 = ['influx_oil_1100_1200', 'influx_oil_900_1000', 'influx_oil_1300_1400', 'influx_oil_800_850']
# 使用lambda表达式
# lambda x: ... 创建了一个匿名函数,它接受一个参数x(即列表中的每个元素)
# 然后在函数体内部调用 sort_by_well_range_1,将x作为col参数,并固定start=2
sorted_list_lambda = sorted(
data_list_1,
key=lambda x: sort_by_well_range_1(x, start=2),
reverse=False
)
print(f"\n原始列表: {data_list_1}")
print(f"使用lambda排序结果: {sorted_list_lambda}")
# 预期输出: ['influx_oil_800_850', 'influx_oil_900_1000', 'influx_oil_1100_1200', 'influx_oil_1300_1400']在这个例子中,lambda x: sort_by_well_range_1(x, start=2)创建了一个新的函数。当sorted()遍历data_list_1中的每个元素时,会将该元素作为x传递给lambda函数。lambda函数内部再调用sort_by_well_range_1,其中x作为col参数,而start参数则被固定为2。
functools.partial是一个非常有用的工具,它可以根据现有函数创建新的函数,新函数的某些参数已经被预设为固定值。这在需要重用带固定参数的函数时特别方便。
from functools import partial
from statistics import mean
def sort_by_well_range_1(col, start=1):
"""
根据字符串中从指定索引开始的深度范围计算平均深度。
例如:'influx_oil_1100_1200', start=2 -> (1100 + 1200) / 2 = 1150.0
"""
parts = col.split('_')[start:]
depths = [float(p) for p in parts]
middle_depth = mean(depths)
return middle_depth
data_list_1 = ['influx_oil_1100_1200', 'influx_oil_900_1000', 'influx_oil_1300_1400', 'influx_oil_800_850']
# 使用functools.partial
# partial(sort_by_well_range_1, start=2) 创建了一个新的函数对象
# 这个新函数在被调用时,其start参数将自动设置为2
# 它仍然需要一个位置参数,这个参数将作为sort_by_well_range_1的col参数
partial_sort_key = partial(sort_by_well_range_1, start=2)
sorted_list_partial = sorted(
data_list_1,
key=partial_sort_key, # 将新创建的函数对象传递给key
reverse=False
)
print(f"\n原始列表: {data_list_1}")
print(f"使用functools.partial排序结果: {sorted_list_partial}")
# 预期输出: ['influx_oil_800_850', 'influx_oil_900_1000', 'influx_oil_1100_1200', 'influx_oil_1300_1400']partial(sort_by_well_range_1, start=2)创建了一个新的函数对象partial_sort_key。这个新函数在被调用时,start参数将始终为2。当sorted()将列表元素传递给partial_sort_key时,这个元素会作为sort_by_well_range_1的第一个位置参数(即col)被接收。
functools.partial的优点在于,它能够创建具有更清晰名称的函数,特别是当需要多次使用相同参数组合的函数时,可以提高代码的可读性和可维护性。
在Python中,当需要使用带多个参数的自定义函数作为sorted()或list.sort()方法的key参数时,不能直接传递。解决方案是利用lambda表达式或functools.partial来创建一个新的单参数函数。lambda提供了一种简洁的匿名函数创建方式,适用于快速解决问题;而functools.partial则更适合于需要预设固定参数并可能在多处复用的场景,它能创建更具描述性的函数对象,从而提升代码的可读性和可维护性。掌握这两种技巧,可以极大地增强Python列表排序的灵活性。
以上就是Python列表自定义多参数函数排序指南的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号