在Python中,计算熵通常使用`scipy.stats.entropy`函数,该函数默认以自然数e为底计算熵,但也可以通过参数指定底数。以下是一个使用`scipy.stats.entropy`计算熵的例子:
from scipy.stats import entropy
定义概率分布
probabilities = [0.25, 0.25, 0.5]
计算熵
entropy_value = entropy(probabilities)
print(entropy_value)
如果你需要计算信息熵,可以使用以下代码:
from math import log2
def calcShannonEnt(dataSet):
numEntries = len(dataSet)
labelCounts = {}
for featVec in dataSet:
currentLabel = featVec[-1]
if currentLabel not in labelCounts.keys():
labelCounts[currentLabel] = 0
labelCounts[currentLabel] += 1
shannonEnt = 0.0
for key in labelCounts:
prob = float(labelCounts[key]) / numEntries
shannonEnt -= prob * log2(prob)
return shannonEnt
这个函数计算的是给定数据集的信息熵。