在Python中,缺失值通常使用 `np.nan`(NumPy库中的缺失值表示)或 `pd.NA`(Pandas库中的缺失值表示)来表示。在Pandas中,`None` 也可以用来表示缺失值,尤其是在处理对象类型数据时。
1. 使用 `np.nan` 表示缺失值:
```python
import numpy as np
import pandas as pd
data = {
'A': [1, 2, np.nan, 4],
'B': [5, np.nan, np.nan, 8]
}
df = pd.DataFrame(data)
print(df)
2. 使用 `pd.NA` 表示缺失值:
```python
import pandas as pd
创建一个包含缺失值的DataFrame
data = {
'A': [1, 2, pd.NA, 4],
'B': [5, pd.NA, pd.NA, 8]
}
df = pd.DataFrame(data)
print(df)
3. 使用 `None` 表示缺失值:
```python
import pandas as pd
创建一个包含缺失值的DataFrame
data = {
'A': [1, 2, None, 4],
'B': [5, None, None, 8]
}
df = pd.DataFrame(data)
print(df)
在处理缺失值时,可以使用Pandas提供的函数,如 `isnull()`、`notnull()`、`dropna()` 和 `fillna()`,来识别、删除或填充缺失值。
例如,要删除包含缺失值的行,可以使用 `dropna()` 函数:
```python
删除包含任何缺失值的行
df_cleaned = df.dropna()
print(df_cleaned)
要填充缺失值,可以使用 `fillna()` 函数:
```python
用特定值填充缺失值
df_filled = df.fillna(0)
print(df_filled)
希望这些信息对你有帮助!