最大最小标准化(Min-Max Scaling)
import numpy as np
示例数据
data = np.array([[1, 2, 3], [4, 5, 6]])
标准化
min_max_scaler = (data - np.min(data, axis=0)) / (np.max(data, axis=0) - np.min(data, axis=0))
print(min_max_scaler)
Z-score标准化
import numpy as np
示例数据
data = np.array([[1, 2, 3], [4, 5, 6]])
标准化
mean = np.mean(data, axis=0)
std = np.std(data, axis=0)
z_score_data = (data - mean) / std
print(z_score_data)
使用scikit-learn的StandardScaler
from sklearn.preprocessing import StandardScaler
示例数据
data = np.array([[1, 2, 3], [4, 5, 6]])
初始化StandardScaler对象
scaler = StandardScaler()
标准化
scaled_data = scaler.fit_transform(data)
print(scaled_data)
使用pandas进行数据标准化
import pandas as pd
示例数据
data = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [10, 20, 30, 40, 50]})
标准化
min_max_scaler = (data - data.min()) / (data.max() - data.min())
print(min_max_scaler)
以上代码展示了如何使用NumPy和scikit-learn库进行数据标准化。使用scikit-learn的`StandardScaler`类可以方便地对数据进行标准化处理,并且可以处理缺失值和异常值。