Python处理表格数据通常使用Pandas库,它提供了丰富的功能来读取、处理和分析表格数据。以下是一些基本操作:
读取表格数据
CSV文件:使用`read_csv`函数。
import pandas as pddata = pd.read_csv('data.csv')
Excel文件:使用`read_excel`函数。
data = pd.read_excel('data.xlsx')
查看数据
使用`head`函数查看表格的前几行数据。
data.head() 查看前5行数据data.head(10) 查看前10行数据
筛选数据
使用条件语句筛选数据。
filtered_data = data[data['column_name'] > 10]
排序数据
使用`sort_values`函数对数据进行排序。

sorted_data = data.sort_values('column_name') 按某一列进行升序排序sorted_data = data.sort_values('column_name', ascending=False) 按某一列进行降序排序
数据统计
使用`describe`函数进行数据统计。
data.describe()
其他操作
读取Excel文件:可以使用`xlrd`或`openpyxl`库。
import xlrdworkbook = xlrd.open_workbook('data.xls')sheet_name = workbook.sheet_names()
写入Excel文件:可以使用`xlwt`或`openpyxl`库。
from openpyxl import Workbookwb = Workbook()ws = wb.activews['A1'] = 'Hello'ws['B1'] = 'World'wb.save('output.xlsx')
注意事项
确保已安装必要的库,如`pandas`和`openpyxl`。
对于合并单元格等特殊格式,可能需要额外的处理。
对于大数据集,可能需要考虑性能优化。
以上是使用Python处理表格数据的一些基本方法。
