Python数据清洗常用的库包括:
Pandas:
提供丰富的数据结构和数据分析工具,用于数据清洗、转换、合并等操作。
NumPy:
用于数值计算,提供数学函数和数组操作,高效处理数据。
Pyjanitor:
R语言的Janitor包在Python中的实现,使用链式方法进行数据清理。
Missingno:
帮助可视化数据中的缺失值情况,便于处理缺失值。
SciPy:
基于NumPy的高级科学计算库,提供更多的数学函数和算法。
Openpyxl:
用于操作Excel文件。
Matplotlib 和 Seaborn:
用于数据可视化。
klib:
提供易于应用的函数,用于数据清洗和可视化。