在Python中,您可以使用Pandas库来拆分CSV文件。以下是一个简单的步骤说明:
1. 安装Pandas库(如果尚未安装):
pip install pandas
2. 导入Pandas库:
import pandas as pd
3. 读取CSV文件:
data = pd.read_csv('input.csv')
4. 拆分数据为多个子集:
chunks = [data[i:i + 100] for i in range(0, data.shape, 100)]
在这个例子中,`data.shape` 表示数据集中的行数,`range` 函数用于迭代行,每次迭代处理100行。
5. 将每个子集保存到新的CSV文件中:
for i, chunk in enumerate(chunks):
chunk.to_csv(f'output_part_{i}.csv', index=False)
以上代码将原始CSV文件拆分成多个包含100行的小CSV文件,并保存到当前目录下,文件名格式为`output_part_0.csv`, `output_part_1.csv`, 等等。