
csv 模块是 Python 标准库中用于处理 CSV(Comma Separated Values)文件的强大工具。csv.writer 对象提供了 writerow() 和 writerows() 方法,分别用于写入单行和多行数据。通常,writerows() 方法期望接收一个可迭代对象,其中每个元素代表一行数据,而每行数据本身又是一个可迭代对象(如列表或元组),其内部元素代表该行的各个字段。
例如,如果我们有以下数据:
data = [
['item1', 'item2', 'item3'],
['item4', 'item5', 'item6']
]使用 csv.writer 写入时,会得到期望的 CSV 格式:
item1,item2,item3 item4,item5,item6
然而,当数据来源于某些数据库查询(例如使用 cursor.fetchall())时,返回的 result_set 可能具有一种特殊的结构,导致 csv.writer 产生非预期的引用。具体来说,如果数据库的查询结果集中的每一行被封装成一个只包含一个元素的元组,而这个元素本身是一个已经包含逗号分隔值的字符串,例如:
立即学习“Python免费学习笔记(深入)”;
# 模拟从数据库获取的 result_set
result_set = [
('item1,item2,item3',),
('item4,item5,item6',)
]在这种情况下,csv.writer 在处理 ('item1,item2,item3',) 这一行时,会将其识别为一个只包含一个字段的行。由于这个字段 ('item1,item2,item3') 内部包含了 CSV 分隔符(逗号),根据 csv 模块的默认引用规则 (QUOTE_MINIMAL),它会将整个字段用引号括起来,从而导致输出变为:
"item1,item2,item3" "item4,item5,item6"
这与我们期望的 item1,item2,item3 格式不符。
解决此问题的关键在于,在将数据传递给 csv.writer 之前,对其进行适当的预处理,使其符合 writerows() 期望的“每行是字段列表”的结构。由于原始数据中每个元组只包含一个字符串元素,我们可以通过解包该元组并使用字符串的 split(',') 方法将该字符串拆分成多个字段。
以下是具体的实现代码:
import csv
import os
def write_data_to_csv(filename, result_set):
"""
将预处理后的数据写入CSV文件。
Args:
filename (str): 要写入的CSV文件路径。
result_set (list): 从数据库查询得到的原始结果集,
例如:[('item1,item2,item3',), ('item4,item5,item6',)]
"""
try:
# 使用 'w' 模式清空并写入,如果希望追加,请使用 'a'
with open(filename, 'w', newline='', encoding='utf-8') as csvfile:
datafile = csv.writer(csvfile)
# 预处理数据:
# 对于result_set中的每个元组(col,),解包出col,然后用split(',')将其拆分为字段列表。
# 使用生成器表达式以提高内存效率。
processed_rows = (col.split(",") for (col,) in result_set)
# 将处理后的行写入CSV文件
datafile.writerows(processed_rows)
print(f"数据已成功写入到 {filename}")
except IOError as e:
print(f"写入文件时发生错误: {e}")
# 示例数据(模拟从数据库获取)
mock_result_set = [
('apple,banana,cherry',),
('date,elderberry,fig',),
('grape,honeydew,kiwi',)
]
# 定义输出文件名
output_filename = 'output_correct.csv'
# 调用函数写入数据
write_data_to_csv(output_filename, mock_result_set)
# 验证输出内容 (可选)
print("\n--- 验证输出文件内容 ---")
if os.path.exists(output_filename):
with open(output_filename, 'r', encoding='utf-8') as f:
print(f.read())
else:
print("文件未生成或路径错误。")
# 错误示例(不进行预处理)
print("\n--- 错误示例输出 ---")
error_output_filename = 'output_quoted.csv'
try:
with open(error_output_filename, 'w', newline='', encoding='utf-8') as csvfile:
datafile = csv.writer(csvfile)
datafile.writerows(mock_result_set) # 直接写入未处理的数据
print(f"错误示例数据已写入到 {error_output_filename}")
except IOError as e:
print(f"写入文件时发生错误: {e}")
print("\n--- 错误示例文件内容 ---")
if os.path.exists(error_output_filename):
with open(error_output_filename, 'r', encoding='utf-8') as f:
print(f.read())代码解析:
当使用 csv.writer 将数据库查询结果写入 CSV 文件时,意外的引号通常是由于源数据结构不符合 writerows() 期望的“每行是字段列表”格式所致。通过在写入前对数据进行预处理,特别是利用元组解包和字符串 split() 方法将单字符串字段转换为多字段列表,可以有效地解决这一问题。理解数据源的实际结构是解决此类问题的关键,并能帮助你更好地利用 csv 模块的强大功能。
以上就是Python csv.writer 写入数据库查询结果时意外引用问题的解决方案的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号