在 Python 中引入 Excel 文件,通常使用 `pandas` 库,它是一个强大的数据处理库,可以方便地读取和写入 Excel 文件。以下是使用 `pandas` 引入 Excel 文件的基本步骤:
1. 安装 `pandas` 库(如果尚未安装):
pip install pandas
2. 使用 `pandas` 的 `read_excel` 函数读取 Excel 文件:
import pandas as pd
读取 Excel 文件
df = pd.read_excel('example.xlsx')
显示前 5 行
print(df.head())
如果 Excel 文件包含多个工作表,可以通过 `sheet_name` 参数指定要读取的工作表:
读取特定工作表
df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
`read_excel` 函数还有其他参数,例如可以指定读取的行和列的范围:
读取特定行和列
df = pd.read_excel('example.xlsx', sheet_name='Sheet1', usecols=[0, 1, 2])
如果需要创建新的 Excel 文件,可以使用 `pandas` 的 `ExcelWriter` 类,配合 `openpyxl` 或 `xlwt` 等库。例如,使用 `openpyxl` 创建一个新的 Excel 文件:
import pandas as pd
from openpyxl import Workbook
创建一个新的 DataFrame
data = {'Name': ['Alice', 'Bob', 'Charlie'], 'Age': [25, 30, 35]}
df = pd.DataFrame(data)
创建一个新的 Excel 文件
wb = Workbook()
ws = wb.active
将 DataFrame 写入工作表
for r in dataframe_to_rows(df, index=False, header=True):
ws.append(r)
保存 Excel 文件
wb.save('new_file.xlsx')
请注意,`dataframe_to_rows` 函数需要从 `openpyxl.utils.dataframe` 模块导入。
以上是使用 `pandas` 引入和处理 Excel 文件的基本方法。