要使用Python读取Word文档的内容,你可以使用`python-docx`库。以下是使用该库读取Word文档内容的步骤和示例代码:
1. 安装`python-docx`库:
pip install python-docx
2. 使用以下代码读取Word文档内容:
from docx import Document
打开文档
doc = Document('example.docx')
读取段落
for para in doc.paragraphs:
print(para.text)
读取表格
for table in doc.tables:
for row in table.rows:
for cell in row.cells:
print(cell.text)
这段代码会打印出Word文档中的所有段落和表格内容。
请确保将`example.docx`替换为你想要读取的Word文档的实际路径。如果你需要读取的是纯文本内容,上述代码已经足够了。如果你需要处理更复杂的文档结构,比如图片、图表等,`python-docx`库也提供了相应的处理方法