Pandas
提供`Series`和`DataFrame`数据结构,用于数据的导入、清洗、转换、分析和可视化。
示例代码:
```python
import pandas as pd
data = pd.read_csv('data.csv')
print(data.head())
NumPy
提供`ndarray`对象,支持向量化操作和广播机制,是科学计算的基础。
示例代码:
```python
import numpy as np
arr = np.array([1, 2, 3, 4, 5])
print(arr[1:3])
SciPy
依赖于NumPy,提供高级数学函数和优化算法,用于解决科学和工程问题。
示例代码:
```python
from scipy.stats import norm
sample = norm.rvs(loc=0, scale=1, size=1000)
print(sample.mean())
Matplotlib
用于数据的可视化。
示例代码:
```python
import matplotlib.pyplot as plt
plt.plot(sample)
plt.show()
其他
如`Scikit-Learn`、`Keras`、`Gensim`、`Scrapy`等,用于更专业的数据分析任务。
选择合适的库取决于具体的数据处理需求