在Python中,计算熵通常使用`scipy.stats.entropy`函数,该函数默认以自然数e为底计算熵,但也可以通过参数指定底数。以下是一个使用`scipy.stats.entropy`计算熵的例子:
from scipy.stats import entropy定义概率分布probabilities = [0.25, 0.25, 0.5]计算熵entropy_value = entropy(probabilities)print(entropy_value)
如果你需要计算信息熵,可以使用以下代码:

from math import log2def calcShannonEnt(dataSet):numEntries = len(dataSet)labelCounts = {}for featVec in dataSet:currentLabel = featVec[-1]if currentLabel not in labelCounts.keys():labelCounts[currentLabel] = 0labelCounts[currentLabel] += 1shannonEnt = 0.0for key in labelCounts:prob = float(labelCounts[key]) / numEntriesshannonEnt -= prob * log2(prob)return shannonEnt
这个函数计算的是给定数据集的信息熵。
