Python可以操作的文件类型主要包括文本文件和二进制文件。
文本文件操作
读取:使用`read()`、`readline()`、`readlines()`方法。
写入:使用`write()`方法,文件需要以`w`或`w+`模式打开。
追加:使用`append()`模式,文件需要以`a`或`a+`模式打开。
二进制文件操作
读取:使用`read()`、`readline()`、`readlines()`方法,文件需要以`rb`模式打开。
写入:使用`write()`方法,文件需要以`wb`模式打开。
文件操作模式
`r`:只读模式。
`w`:写入模式,如果文件存在则清空内容。
`a`:追加模式,如果文件不存在则创建。
`rb`:二进制读取模式。
`wb`:二进制写入模式。
`r+`:读写模式。
`w+`:读写模式,如果文件存在则清空内容。
`a+`:读写追加模式,如果文件不存在则创建。
文件操作的最佳实践
使用`with`语句来管理文件对象,确保文件在使用后自动关闭。
读取大文件时,可以使用循环读取的方式,避免一次性加载整个文件到内存中。
文件操作模块
`json`:处理JSON格式文件。
`xlrd`、`xlsxwriter`:处理Excel文件。
`pandas`:处理数据分析和操作。
`openpyxl`:处理Excel文件。
`pdfminer`:提取PDF文档内容。
`docx`:处理Word文档。
文件操作注意事项
文件操作前应检查文件是否存在,避免操作不存在的文件导致的错误。
文件操作完成后应关闭文件,释放系统资源。
以上是Python中文件操作的基本知识和方法。