要使用Python合并多个CSV文件,你可以使用`pandas`库的`concat`函数。以下是一个简单的步骤说明:
1. 导入必要的库:
import os
import pandas as pd
2. 定义一个函数来读取指定路径下的所有CSV文件,并将它们合并为一个DataFrame:
def merge_csv_files(path_to_folder):
all_files = os.listdir(path_to_folder) 获取文件夹下的所有文件
csv_files = [file for file in all_files if file.endswith('.csv')] 筛选出所有CSV文件
df_list = [] 创建一个空列表来存储DataFrame
for file in csv_files:
file_path = os.path.join(path_to_folder, file) 获取完整的文件路径
df = pd.read_csv(file_path) 读取CSV文件
df_list.append(df) 将DataFrame添加到列表中
merged_data = pd.concat(df_list, ignore_index=True) 使用concat函数合并列表中的DataFrame
return merged_data
3. 调用函数并指定包含CSV文件的文件夹路径:
path_to_csv_folder = 'path/to/your/csv/folder' 替换为实际的文件夹路径
merged_csv_data = merge_csv_files(path_to_csv_folder)
4. 若要将合并后的数据保存到新的CSV文件,可以使用`to_csv`方法:
merged_csv_data.to_csv('merged_data.csv', index=False) 将合并后的数据保存到merged_data.csv文件,不包含索引列
以上步骤将指导你如何合并指定文件夹中的所有CSV文件。请确保将`path_to_csv_folder`替换为包含CSV文件的实际文件夹路径。