
Pandas isin()函数:高效筛选DataFrame数据
在Pandas数据分析中,isin()函数是筛选DataFrame中符合特定条件数据的利器。本文将演示如何利用isin()函数根据指定列表筛选DataFrame的行和列。
场景:从大型DataFrame中提取特定数据
假设我们有两个DataFrame:df1包含大量数据,df2包含需要从df1中筛选的项目列表。目标是从df1中提取包含df2中所有项目的列,并整合到一个新的DataFrame中。
解决方案:巧妙运用isin()函数
Pandas的isin()函数能够高效地检查DataFrame列中的值是否包含在给定集合中。其语法如下:
<code class="python">df['列名'].isin(值集合)</code>
其中:
df:待筛选的DataFrame列名:需要筛选的列名值集合:包含需要查找的值的集合(列表、集合等)实现目标的步骤:
df2中的每个项目。isin()函数在df1中筛选包含该项目的列。代码示例:
<code class="python">import pandas as pd
# 创建示例DataFrame
df1 = pd.DataFrame({'uid': ['a1', 'a2', 'a3'], 'score': [1, 4, 6]})
df2 = pd.DataFrame({'uid': ['a1', 'a3']})
# 使用isin()函数筛选数据并合并
new_df = pd.DataFrame()
for uid in df2['uid']:
selected_rows = df1[df1['uid'].isin([uid])]
new_df = pd.concat([new_df, selected_rows], ignore_index=True)
# 输出结果
print(new_df)</code>输出结果:
<code> uid score 0 a1 1 1 a3 6</code>
通过以上步骤,我们成功地利用isin()函数从df1中提取了包含df2中指定项目的行,并创建了一个新的DataFrame。 此方法高效且易于理解,是Pandas数据处理中的常用技巧。
以上就是如何使用Pandas的isin()函数筛选DataFrame的行和列?的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号