
在数据处理过程中,我们有时会将复杂的数据结构(如字典)存储在 numpy 数组中。例如,在统计城市伤亡人数的场景中,我们可能得到一个 city_dict 字典,其键为城市名,值为总伤亡人数。当这个字典被封装进一个 numpy 数组时,我们面临的问题是如何有效地对其进行排序,特别是按照伤亡人数(字典的值)进行降序排列,以找出伤亡最严重的城市。
考虑以下示例数据,它是一个包含城市及其总伤亡人数的字典:
import numpy as np
city_dict = {
'New Delhi': 2095, 'Samastipur': 4, 'Bombay': 210, 'Imphal': 603,
'Aizawl': 2, 'Amapur': 2, 'Raisikah': 1, 'Champhai': 1,
'Jamshedpur': 32, 'Chennai': 366, 'Chiaplant': 1, 'Tindol': 7,
'Calcutta': 57, 'Tirupattur': 6, 'Gauhati': 112, 'Jorhat': 3,
'Massad': 1, 'Chandigarh': 333, 'Jodhpur': 2, 'Amritsar': 768,
'Tipaimukh': 6, 'Guwahati': 822, 'Harchowal': 1, 'Mothan Wala': 2,
'Qadian': 7, 'Baloda Bazar': 10
}
# 将字典放入 NumPy 数组
np_city = np.array(city_dict)
print("原始 NumPy 数组内容:")
print(np_city)
print("NumPy 数组的类型:", type(np_city))
print("NumPy 数组中元素的类型:", np_city.dtype)运行上述代码,你会发现 np_city 实际上是一个 dtype=object 的 NumPy 数组,它只包含一个元素,这个元素就是我们传入的整个 city_dict 字典。
原始 NumPy 数组内容:
{'New Delhi': 2095, 'Samastipur': 4, 'Bombay': 210, 'Imphal': 603, 'Aizawl': 2, 'Amapur': 2, 'Raisikah': 1, 'Champhai': 1, 'Jamshedpur': 32, 'Chennai': 366, 'Chiaplant': 1, 'Tindol': 7, 'Calcutta': 57, 'Tirupattur': 6, 'Gauhati': 112, 'Jorhat': 3, 'Massad': 1, 'Chandigarh': 333, 'Jodhpur': 2, 'Amritsar': 768, 'Tipaimukh': 6, 'Guwahati': 822, 'Harchowal': 1, 'Mothan Wala': 2, 'Qadian': 7, 'Baloda Bazar': 10}
NumPy 数组的类型: <class 'numpy.ndarray'>
NumPy 数组中元素的类型: object由于 np_city 是一个包含单个字典对象的 NumPy 数组,我们需要先将其中的字典对象提取出来。NumPy 数组提供了一个方便的方法 .item() 来获取仅包含一个元素的数组中的该元素。
# 提取 NumPy 数组中的字典对象
extracted_dict = np_city.item()
print("\n提取出的字典对象:")
print(extracted_dict)
print("提取出的对象类型:", type(extracted_dict))现在 extracted_dict 就是原始的 city_dict 字典,我们可以对其进行标准的 Python 字典操作。
Python 的内置 sorted() 函数是实现排序的关键。sorted() 函数可以接受一个可迭代对象,并返回一个新的排序后的列表。对于字典,我们通常需要根据其键或值进行排序。
为了按字典的值进行排序,我们需要:
最后,我们可以使用字典推导式将排序后的键值对列表转换回一个新的字典。需要注意的是,从 Python 3.7+ 开始,字典会保留插入顺序,因此这种方式创建的字典将保持排序后的顺序。
# 对字典进行降序排序
sorted_city_casualties = {
key: value
for key, value in sorted(extracted_dict.items(), key=lambda item: item[1], reverse=True)
}
print("\n按伤亡人数降序排序后的城市字典:")
print(sorted_city_casualties)下面是整合了上述步骤的完整代码示例:
import numpy as np
import csv # 仅为示例背景,实际排序不依赖csv文件
# 示例数据:城市及其总伤亡人数的字典
# 在实际应用中,这个字典可能通过读取CSV文件或其他数据源生成
city_dict = {
'New Delhi': 2095, 'Samastipur': 4, 'Bombay': 210, 'Imphal': 603,
'Aizawl': 2, 'Amapur': 2, 'Raisikah': 1, 'Champhai': 1,
'Jamshedpur': 32, 'Chennai': 366, 'Chiaplant': 1, 'Tindol': 7,
'Calcutta': 57, 'Tirupattur': 6, 'Gauhati': 112, 'Jorhat': 3,
'Massad': 1, 'Chandigarh': 333, 'Jodhpur': 2, 'Amritsar': 768,
'Tipaimukh': 6, 'Guwahati': 822, 'Harchowal': 1, 'Mothan Wala': 2,
'Qadian': 7, 'Baloda Bazar': 10
}
# 将字典放入 NumPy 数组
np_city = np.array(city_dict)
print("--- 原始数据 ---")
print("NumPy 数组内容:", np_city)
print("NumPy 数组类型:", type(np_city))
print("NumPy 数组元素类型:", np_city.dtype)
# 1. 从 NumPy 数组中提取字典对象
extracted_dict = np_city.item()
print("\n--- 提取字典 ---")
print("提取出的字典对象:", extracted_dict)
print("提取出的对象类型:", type(extracted_dict))
# 2. 对字典进行降序排序(按值)
# sorted() 函数返回一个元组列表,每个元组是 (key, value)
# key=lambda item: item[1] 表示按元组的第二个元素(值)排序
# reverse=True 表示降序
sorted_items = sorted(extracted_dict.items(), key=lambda item: item[1], reverse=True)
# 3. 将排序后的键值对列表转换回字典
sorted_city_casualties = {key: value for key, value in sorted_items}
print("\n--- 排序结果 ---")
print("按伤亡人数降序排序后的城市字典:")
print(sorted_city_casualties)
# 如果只需要前N个结果,可以这样做:
top_5_cities = dict(sorted_items[:5])
print("\n--- 前5个伤亡最严重的城市 ---")
print(top_5_cities)通过以上步骤,我们能够高效地处理在 NumPy 数组中封装的字典数据,并根据特定需求对其进行排序,这在数据分析和报告生成中是一个非常实用的技巧。
以上就是在 NumPy 数组中对内嵌字典进行值排序的教程的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号