使用 Pandas 动态分割 DataFrame 中的多列

DDD
发布: 2025-08-19 18:38:01
原创
759人浏览过

使用 pandas 动态分割 dataframe 中的多列

本文介绍如何使用 Pandas 动态地将 DataFrame 中的多个列按照相同分隔符进行分割。通过循环遍历需要分割的列,并结合 str.split() 和 pd.concat() 函数,可以高效地完成列分割任务,避免手动指定每一列的分割操作,适用于处理含有不定数量分隔符的列。

在数据处理过程中,经常会遇到需要按照特定分隔符分割 DataFrame 中多个列的情况。手动为每一列编写分割代码不仅繁琐,而且当需要分割的列数较多时,代码的可维护性也会大大降低。本文将介绍一种动态分割 DataFrame 列的方法,通过循环遍历需要分割的列,并结合 Pandas 提供的字符串分割函数,可以高效地完成任务。

实现方法

  1. 确定需要分割的列:首先,需要明确 DataFrame 中哪些列需要进行分割。将这些列名存储在一个列表中。
  2. 循环遍历列名列表:使用 for 循环遍历列名列表,对每一列执行分割操作。
  3. 使用 str.split() 分割列:在循环中,使用 Pandas 的 str.split() 函数按照指定分隔符分割当前列。设置 expand=True 将分割后的结果展开为新的列。
  4. 重命名分割后的列:为了区分分割后的列,可以使用 rename() 函数为它们添加后缀。例如,可以将原始列名作为前缀,加上分割后的列的索引。
  5. 使用 pd.concat() 合并结果:将分割后的 DataFrame 与原始 DataFrame 中不需要分割的列合并。使用 pd.concat() 函数,并设置 axis=1,表示按列合并。

代码示例

import pandas as pd

# 示例数据
data = {'DATE': ['2023-11-21', '2023-11-21', '2023-11-21', '2023-11-21', '2023-11-21'],
        'TALK_TIME': [None, '00:04:16', None, '00:24:30', '00:04:08'],
        'CONSULT_TIME': ['05:10', None, None, None, None]}
df = pd.DataFrame(data)

# 需要分割的列名列表
cols = ['TALK_TIME', 'CONSULT_TIME']

# 分割并重命名列
lst = [df[col].str.split(':', expand=True)
       .rename(columns=lambda x: f'{col}_{x+1}')
       for col in cols
      ]

# 合并结果
out = pd.concat([df.drop(columns=cols)]+lst, axis=1)

# 输出结果
print(out)
登录后复制

代码解释

eMart 网店系统
eMart 网店系统

功能列表:底层程序与前台页面分离的效果,对页面的修改无需改动任何程序代码。完善的标签系统,支持自定义标签,公用标签,快捷标签,动态标签,静态标签等等,支持标签内的vbs语法,原则上运用这些标签可以制作出任何想要的页面效果。兼容原来的栏目系统,可以很方便的插入一个栏目或者一个栏目组到页面的任何位置。底层模版解析程序具有非常高的效率,稳定性和容错性,即使模版中有错误的标签也不会影响页面的显示。所有的标

eMart 网店系统 0
查看详情 eMart 网店系统
  • cols = ['TALK_TIME', 'CONSULT_TIME']: 定义需要分割的列的列表。
  • lst = [...]: 使用列表推导式,循环遍历 cols 中的每一列。
    • df[col].str.split(':', expand=True): 使用 str.split() 函数按照冒号 : 分割当前列,expand=True 将分割后的结果展开为新的列。
    • .rename(columns=lambda x: f'{col}_{x+1}'): 使用 rename() 函数重命名分割后的列,将原始列名作为前缀,加上分割后的列的索引。
  • out = pd.concat([df.drop(columns=cols)]+lst, axis=1): 使用 pd.concat() 函数将分割后的 DataFrame 与原始 DataFrame 中不需要分割的列合并。df.drop(columns=cols) 删除原始的需要分割的列,axis=1 表示按列合并。

注意事项

  • 确保 DataFrame 中需要分割的列是字符串类型。如果不是,可以使用 astype(str) 将其转换为字符串类型。
  • 如果分隔符在某些行中不存在,str.split() 函数会返回 NaN 值。可以使用 fillna() 函数填充这些 NaN 值。
  • 根据实际需求调整列名的重命名规则。

总结

本文介绍了一种动态分割 Pandas DataFrame 中多个列的方法。通过循环遍历需要分割的列,并结合 str.split() 和 pd.concat() 函数,可以高效地完成列分割任务。这种方法避免了手动指定每一列的分割操作,提高了代码的可维护性和可重用性。

以上就是使用 Pandas 动态分割 DataFrame 中的多列的详细内容,更多请关注php中文网其它相关文章!

最佳 Windows 性能的顶级免费优化软件
最佳 Windows 性能的顶级免费优化软件

每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。

下载
来源:php中文网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号