Shiori
用户2590
添加快捷方式
分享
2021C 生产企业原材料的订购与运输复现
输入“/”快速插入内容
2021C 生产企业原材料的订购与运输复现
用户2590
用户2590
2025年8月8日修改
Abstract
1.
信息
本质是“区分”和“差异”,
信息产生于差异之中。
差异越大,我们能够区分的事物就越多,信息量也就越大,例如:
◦
指纹识别:
每个人的指纹都是独一无二的,指纹的纹路变化非常复杂多样(
变异程度很大
)。 正是这种
高度的变异性
,使得指纹能够
提供非常丰富的信息
,用于身份识别。 如果所有人的指纹都一样,指纹识别就毫无意义,信息量为零。
◦
商品价格:
如果所有商品的价格都固定不变,那么价格信息就非常有限,只能告诉我们商品的价格是多少,而不能提供更多关于商品价值、供需关系等方面的信息。 但
如果商品价格经常波动(变异程度很大)
,价格信息就能
反映市场供需变化
、
商品价值变化等更丰富的信息
。
◦
天气预报:
如果每天的天气预报
都说“晴”
,那么天气预报的信息量就很低,因为它
没有提供任何差异性信息
。 但如果天气预报能准确预测晴天、阴天、雨天、多云等各种天气情况,并且这些天气情况在不同天之间有所变化(
变异,variation
),那么天气预报的信息量就很大,因为它能帮助我们区分不同日子的天气状况,减少我们对未来天气的“不确定性”。
◦
考试成绩:
如果所有学生考试
都考了 100 分
,那么考试成绩这个指标就
没有提供任何区分学生的信息
。 但如果学生成绩分布在 60 分到 100 分之间,
成绩差异很大
,那么考试成绩就能有效
区分学生的学习水平
,信息量就很大。
2.
信
息熵 (Information Entropy) / 熵值 (Entropy Value)
信息熵的概念来自于信息论,由克劳德·香农 (Claude Shannon) 提出。它借鉴了热力学中熵的概念,用于
度量
随机变量的不确定性 或
信息量
。
例如:
◦
硬币均匀 (公平) 的情况: 抛一枚均匀硬币,正面朝上和反面朝上的概率都是 0.5。
信息熵为 1 比特,表示结果非常不确定,需要 1 比特的信息才能消除不确定性 (例如知道是正面还是反面)。
◦
硬币不均匀 (作弊) 的情况: 假设一枚硬币,正面朝上的概率是 0.9,反面朝上的概率是 0.1
信息熵约为 0.469 比特,远小于均匀硬币。因为结果更倾向于正面朝上,不确定性降低,所需信息也更少。
3.
变异程度(Degree of variation)
“差异”的量化体现:
◦
极差 (Range):
最大值与最小值之差。 最简单粗暴的衡量,但容易受极端值影响。
◦
方差 (Variance):
每个数据点与平均值的偏差平方的平均数。 反映数据分散程度的平均水平。
◦
标准差 (Standard Deviation):
方差的平方根。 单位与原始数据相同,更易于理解和解释。
标准差是最常用的变异程度指标。
4.
熵权法(Entropy Weight Method, EWM)
在熵权法中,信息熵是计算目标指标谁更重要(包含的信息量多)的媒介,因为——信息熵反映了数据的不确定性,
信息熵越大,指标提供的信息越少,权重应越低
;
信息熵越小,指标提供的信息越多,权重应越高。
其中,熵,是信息熵;权,是熵权,即
所占权重——指标所含的信息量的大小
5.
如何使用熵权法?
5.1
设定决策矩阵
假设有
m 个方案(对象)
,
n 个指标(特征)
,决策矩阵为:
其中
表示第
个方案在第
个指标上的值。
5.2
数据归一化
为消除不同指标单位的影响,需对数据进行归一化,一般选择
极大型指标
:
•
极大型指标
(值越大越好,例如利润、生产量):
•
极小型指标
(值越小越好,例如成本、污染量):
•
中间型指标
(最优值在某个范围):
其中
为最优值。
归一化矩阵:
5.3
计算每个指标的信息熵
计算概率: