在 NumPy 数组中对内嵌字典进行值排序的教程-Python教程-PHP中文网

在 NumPy 数组中对内嵌字典进行值排序的教程

花韻仙語

发布： 2025-09-28 12:12:23

原创

412人浏览过

在 NumPy 数组中对内嵌字典进行值排序的教程

本教程详细介绍了如何在 NumPy 数组中包含的字典中，根据字典的值进行降序排序。文章将通过示例代码演示如何从 NumPy 数组中提取字典对象，并利用 Python 的 sorted() 函数结合 lambda 表达式实现灵活的自定义排序，最终生成一个按值排序的新字典，适用于数据分析和报告场景。

1. 问题背景与数据结构

在数据处理过程中，我们有时会将复杂的数据结构（如字典）存储在 numpy 数组中。例如，在统计城市伤亡人数的场景中，我们可能得到一个 city_dict 字典，其键为城市名，值为总伤亡人数。当这个字典被封装进一个 numpy 数组时，我们面临的问题是如何有效地对其进行排序，特别是按照伤亡人数（字典的值）进行降序排列，以找出伤亡最严重的城市。

考虑以下示例数据，它是一个包含城市及其总伤亡人数的字典：

import numpy as np

city_dict = {
    'New Delhi': 2095, 'Samastipur': 4, 'Bombay': 210, 'Imphal': 603,
    'Aizawl': 2, 'Amapur': 2, 'Raisikah': 1, 'Champhai': 1,
    'Jamshedpur': 32, 'Chennai': 366, 'Chiaplant': 1, 'Tindol': 7,
    'Calcutta': 57, 'Tirupattur': 6, 'Gauhati': 112, 'Jorhat': 3,
    'Massad': 1, 'Chandigarh': 333, 'Jodhpur': 2, 'Amritsar': 768,
    'Tipaimukh': 6, 'Guwahati': 822, 'Harchowal': 1, 'Mothan Wala': 2,
    'Qadian': 7, 'Baloda Bazar': 10
}

# 将字典放入 NumPy 数组
np_city = np.array(city_dict)

print("原始 NumPy 数组内容:")
print(np_city)
print("NumPy 数组的类型:", type(np_city))
print("NumPy 数组中元素的类型:", np_city.dtype)

登录后复制

运行上述代码，你会发现 np_city 实际上是一个 dtype=object 的 NumPy 数组，它只包含一个元素，这个元素就是我们传入的整个 city_dict 字典。

原始 NumPy 数组内容:
{'New Delhi': 2095, 'Samastipur': 4, 'Bombay': 210, 'Imphal': 603, 'Aizawl': 2, 'Amapur': 2, 'Raisikah': 1, 'Champhai': 1, 'Jamshedpur': 32, 'Chennai': 366, 'Chiaplant': 1, 'Tindol': 7, 'Calcutta': 57, 'Tirupattur': 6, 'Gauhati': 112, 'Jorhat': 3, 'Massad': 1, 'Chandigarh': 333, 'Jodhpur': 2, 'Amritsar': 768, 'Tipaimukh': 6, 'Guwahati': 822, 'Harchowal': 1, 'Mothan Wala': 2, 'Qadian': 7, 'Baloda Bazar': 10}
NumPy 数组的类型: <class 'numpy.ndarray'>
NumPy 数组中元素的类型: object

登录后复制

2. 从 NumPy 数组中提取字典

由于 np_city 是一个包含单个字典对象的 NumPy 数组，我们需要先将其中的字典对象提取出来。NumPy 数组提供了一个方便的方法 .item() 来获取仅包含一个元素的数组中的该元素。

# 提取 NumPy 数组中的字典对象
extracted_dict = np_city.item()

print("\n提取出的字典对象:")
print(extracted_dict)
print("提取出的对象类型:", type(extracted_dict))

登录后复制

现在 extracted_dict 就是原始的 city_dict 字典，我们可以对其进行标准的 Python 字典操作。

3. 对字典进行排序

Python 的内置 sorted() 函数是实现排序的关键。sorted() 函数可以接受一个可迭代对象，并返回一个新的排序后的列表。对于字典，我们通常需要根据其键或值进行排序。

怪兽AI数字人

数字人短视频创作，数字人直播，实时驱动数字人

查看详情

为了按字典的值进行排序，我们需要：

使用 extracted_dict.items() 方法获取字典的键值对列表（以元组 (key, value) 的形式）。
将这个列表传递给 sorted() 函数。
利用 key 参数指定排序依据。这里我们使用 lambda item: item[1]，表示对每个键值对元组 item，我们根据其第二个元素（即值）进行排序。
设置 reverse=True 参数，实现降序排序。

最后，我们可以使用字典推导式将排序后的键值对列表转换回一个新的字典。需要注意的是，从 Python 3.7+ 开始，字典会保留插入顺序，因此这种方式创建的字典将保持排序后的顺序。

# 对字典进行降序排序
sorted_city_casualties = {
    key: value
    for key, value in sorted(extracted_dict.items(), key=lambda item: item[1], reverse=True)
}

print("\n按伤亡人数降序排序后的城市字典:")
print(sorted_city_casualties)

登录后复制

4. 完整示例代码

下面是整合了上述步骤的完整代码示例：

import numpy as np
import csv # 仅为示例背景，实际排序不依赖csv文件

# 示例数据：城市及其总伤亡人数的字典
# 在实际应用中，这个字典可能通过读取CSV文件或其他数据源生成
city_dict = {
    'New Delhi': 2095, 'Samastipur': 4, 'Bombay': 210, 'Imphal': 603,
    'Aizawl': 2, 'Amapur': 2, 'Raisikah': 1, 'Champhai': 1,
    'Jamshedpur': 32, 'Chennai': 366, 'Chiaplant': 1, 'Tindol': 7,
    'Calcutta': 57, 'Tirupattur': 6, 'Gauhati': 112, 'Jorhat': 3,
    'Massad': 1, 'Chandigarh': 333, 'Jodhpur': 2, 'Amritsar': 768,
    'Tipaimukh': 6, 'Guwahati': 822, 'Harchowal': 1, 'Mothan Wala': 2,
    'Qadian': 7, 'Baloda Bazar': 10
}

# 将字典放入 NumPy 数组
np_city = np.array(city_dict)

print("--- 原始数据 ---")
print("NumPy 数组内容:", np_city)
print("NumPy 数组类型:", type(np_city))
print("NumPy 数组元素类型:", np_city.dtype)

# 1. 从 NumPy 数组中提取字典对象
extracted_dict = np_city.item()

print("\n--- 提取字典 ---")
print("提取出的字典对象:", extracted_dict)
print("提取出的对象类型:", type(extracted_dict))

# 2. 对字典进行降序排序（按值）
# sorted() 函数返回一个元组列表，每个元组是 (key, value)
# key=lambda item: item[1] 表示按元组的第二个元素（值）排序
# reverse=True 表示降序
sorted_items = sorted(extracted_dict.items(), key=lambda item: item[1], reverse=True)

# 3. 将排序后的键值对列表转换回字典
sorted_city_casualties = {key: value for key, value in sorted_items}

print("\n--- 排序结果 ---")
print("按伤亡人数降序排序后的城市字典:")
print(sorted_city_casualties)

# 如果只需要前N个结果，可以这样做：
top_5_cities = dict(sorted_items[:5])
print("\n--- 前5个伤亡最严重的城市 ---")
print(top_5_cities)

登录后复制

5. 注意事项与总结

NumPy 数组与字典的封装： 当你将一个 Python 字典直接传递给 np.array() 时，如果字典是唯一的元素，NumPy 会创建一个 dtype=object 的数组，其中包含你的字典作为单个元素。这不是一个结构化数组，而是将 Python 对象“原样”存储在 NumPy 容器中。
.item() 方法： 它是从只包含一个元素的 NumPy 数组中提取该元素的便捷方式。如果数组包含多个元素，使用 .item() 会引发 ValueError。
sorted() 函数的灵活性： sorted() 函数是 Python 中非常强大的排序工具。通过 key 参数，你可以指定任何可调用对象（如 lambda 函数或自定义函数）来定义排序的依据，这使得它在处理复杂数据结构时非常灵活。
字典的顺序： 从 Python 3.7+ 开始，字典会保留元素的插入顺序。因此，通过字典推导式从排序后的键值对列表创建新字典时，新字典的元素顺序将与排序后的列表一致。
获取 Top N 结果： 在字典排序完成后，如果只需要获取前几个或后几个结果，可以直接对 sorted() 函数返回的列表进行切片操作，然后再转换回字典。