2021C 生产企业原材料的订购与运输复现

用户2590

2025年8月8日修改

Abstract

1.
信息​
本质是“区分”和“差异”，信息产生于差异之中。 差异越大，我们能够区分的事物就越多，信息量也就越大，例如：​
◦
指纹识别： 每个人的指纹都是独一无二的，指纹的纹路变化非常复杂多样（变异程度很大）。 正是这种高度的变异性，使得指纹能够提供非常丰富的信息，用于身份识别。 如果所有人的指纹都一样，指纹识别就毫无意义，信息量为零。​
◦
商品价格： 如果所有商品的价格都固定不变，那么价格信息就非常有限，只能告诉我们商品的价格是多少，而不能提供更多关于商品价值、供需关系等方面的信息。 但如果商品价格经常波动（变异程度很大），价格信息就能反映市场供需变化、商品价值变化等更丰富的信息。​
◦
天气预报： 如果每天的天气预报都说“晴”，那么天气预报的信息量就很低，因为它没有提供任何差异性信息。 但如果天气预报能准确预测晴天、阴天、雨天、多云等各种天气情况，并且这些天气情况在不同天之间有所变化（变异，variation），那么天气预报的信息量就很大，因为它能帮助我们区分不同日子的天气状况，减少我们对未来天气的“不确定性”。​
◦
考试成绩： 如果所有学生考试都考了 100 分，那么考试成绩这个指标就没有提供任何区分学生的信息。 但如果学生成绩分布在 60 分到 100 分之间，成绩差异很大，那么考试成绩就能有效区分学生的学习水平，信息量就很大。​

2.
信息熵 (Information Entropy) / 熵值 (Entropy Value)​
信息熵的概念来自于信息论，由克劳德·香农 (Claude Shannon) 提出。它借鉴了热力学中熵的概念，用于度量 随机变量的不确定性 或 信息量。​
例如：​
◦
硬币均匀 (公平) 的情况: 抛一枚均匀硬币，正面朝上和反面朝上的概率都是 0.5。​
​
​
​
信息熵为 1 比特，表示结果非常不确定，需要 1 比特的信息才能消除不确定性 (例如知道是正面还是反面)。​
◦
硬币不均匀 (作弊) 的情况: 假设一枚硬币，正面朝上的概率是 0.9，反面朝上的概率是 0.1​
​
​
​
信息熵约为 0.469 比特，远小于均匀硬币。因为结果更倾向于正面朝上，不确定性降低，所需信息也更少。​

3.
变异程度(Degree of variation)​
“差异”的量化体现：​
◦
极差 (Range): 最大值与最小值之差。 最简单粗暴的衡量，但容易受极端值影响。​
◦
方差 (Variance): 每个数据点与平均值的偏差平方的平均数。 反映数据分散程度的平均水平。​
◦
标准差 (Standard Deviation): 方差的平方根。 单位与原始数据相同，更易于理解和解释。 标准差是最常用的变异程度指标。​

4.
熵权法（Entropy Weight Method, EWM）​
在熵权法中，信息熵是计算目标指标谁更重要（包含的信息量多）的媒介，因为——信息熵反映了数据的不确定性，信息熵越大，指标提供的信息越少，权重应越低；信息熵越小，指标提供的信息越多，权重应越高。​
其中，熵，是信息熵；权，是熵权，即
所占权重——指标所含的信息量的大小​

5.
如何使用熵权法？​

5.1
设定决策矩阵​
假设有 m 个方案（对象），n 个指标（特征），决策矩阵为：​
​
​
​
其中 
 表示第 
个方案在第 
 个指标上的值。​

5.2
数据归一化​

为消除不同指标单位的影响，需对数据进行归一化，一般选择极大型指标:​

•
极大型指标（值越大越好，例如利润、生产量）：​
​
 
​
​

•
极小型指标（值越小越好，例如成本、污染量）：​
​
​
​

•
中间型指标（最优值在某个范围）：​
​
​
​
其中 
 为最优值。​

归一化矩阵：

5.3
计算每个指标的信息熵​

计算概率：

2021C 生产企业原材料的订购与运输复现​

2021C 生产企业原材料的订购与运输复现