摘 要:本文主要运用主成分分析模型对彩票设计方案的合理性进行了综合分析,得到了影响彩票吸引力的主要指标,并给出了一种“更好“的彩票设计方案及其算法。
首先,我们对给出的29 种常见方案进行了数据处理。由于不同的方案,奖项设置各不相同,为了方便计算,我们对原始数据做了适当的补充和修改,使29 种方案均有七个奖项且各方案原来未设奖项的中奖率和奖金额均记为零,并求出了所有方案各种奖项的中奖率,引入了奖金分配率的概念。根据问题所给出的29 种方案的特点,我们将这两大重要因素细分为一至七等奖的中奖率、一至三等奖(高项奖)的奖金分配率、低项奖的奖金分配额及总中奖率等12 项指标,从而将方案的合理性评价化为一个多指标综合评价问题。运用主成分分析模型对29 种方案进行了综合分析,得出各种方案的综合评价值并按该值进行了排名,通过对排名表及相关对应指标的观察分析,得出第6、7、10、23、8 和5 号方案的设置较为合理。并归纳出以下特点:
(1) 总中奖率、低项奖奖金分配率及一等奖奖金分配率较高的方案排名靠前;
(2) 奖项种类设置较多的方案排名靠前;
(3) 备选号码较少的方案排名靠前(备选号码不超30 的方案全都进入前7 名);
(4) 总中奖率低、备选号码较多且奖项设置少的方案排名较后;
结合这些特点和主成分分析模型中特征值的累积贡献率,我们得出了决定彩票吸引力5
大指标依次为总中奖率、低项奖奖金分配率、一等奖奖金分配率、备选号码数量和奖项的个
数 。
其次,通过分析同一种方案的各种奖项中奖率的规律,得出了几个反映彩票中奖率规律
的重要结果,
如乐透“ k / n ”型方案相邻奖项中奖率满足
乐透“ k +1/ n ”型方案相邻奖项中奖率满足
这些规律都能在奖金分配方案的制定过程中发挥了重要应用。
第三,根据彩票中奖率的规律和主成分分析模型中方案评价的相关结论,结合彩票销售地区的实际特点,给出了一种较好的彩票方案的设计原则和相应的算法:
(1) 根据总中奖率较高的原则,确定销售规则,使中奖率超过3%;
(2) 根据销售规则制订奖项的等级;
(3) 依据彩票销售地区的环境(人口、收入水平)确定方案的定位,从而确定高项奖和低项奖的奖金分配率;
(4) 根据各奖项中奖率的关系(见定理2 及其推论),确定低项奖各奖项的固定奖金额和高项奖的奖金比率。然后这个原则,我们设计了一个具有7 个奖项的乐透28 选7 型带特别号的方案,从一等奖至七等奖的奖金设置原则依次为70%,10%,20%,500 元,25 元,10 元和5 元,该方案加入主成分分析模型中,得到的综合评价值为1.52,在所有“ k / n ”型彩票中排名第一,说明了该方案确实比已有方案更好。
最后,我们根据综合各种分析的结果,给彩票管理部门提出了6 条有意义的建议,并给报纸投了一篇关于彩票中有关数学规律的文章,供彩民参考。
关键词:彩票、主成分分析法、综合评价值、设计方案
一、问题的提出
近年来“彩票飓风”席卷中华大地,巨额诱惑使越来越多的人加入到“彩民”的行列,目前流行的彩票主要有“传统型”和“乐透型”两种类型。
“传统型”采用“10 选6+
表一:传统型“10 选6+
|
中 奖 等 级 |
10 选 6+1(6+1/10) | |
|
基 本 号 码 特别号码 |
说 明 | |
|
一等奖 |
Abcdef g |
选7 (6+1) |
|
二等奖 |
abcdef |
选7 中(6) |
|
三等奖 |
abcdeX Xbcdef |
选7 中(5) |
|
四等奖 |
abcdXX XbcdeX XXcdef |
选7 中(4) |
|
五等奖 |
abcXXX XbcdXX XXcdeX XXXdef |
选7 中(3) |
|
六等奖 |
abXXXX XbcXXX XXcdXX XXXdeX XXXXef |
奖 选7 中(2) |
“乐透型”有多种不同的形式,比如“33 选
表二、乐透型“33 选
目前流行的彩票销售规则繁多,相应的奖金设置方案也各不相同,如附录一中给出了29种常见的彩票方案,其中一、二、三等奖为高项奖,后面的为低项奖。低项奖奖金数额固定,高项奖按比例分配,但一等奖单注保底金额60 万元,封顶金额500 万元,各高项奖额的计算方法为:
[(当期销售总额 ×总奖金比例) -低项奖奖金总额 ]×单项奖比例
面对众多的方案,我们的问题是:
(1)对常见的29 种彩票销售规则和相应的奖金设置方案就彩票中奖率、奖项和奖金额的设置及对彩民的吸引力等因素,通过建立评价模型,对这些方案进行综合评价,并且给出排序结果,以供彩票管理部门作决策参考。根据这些方案的具体情况,综合分析各种奖项出现的可能性、各种奖项的奖金在总奖金中的比率,不同彩票的总中奖率,并建立数学模型评价各方案奖项和奖金额的设置以及对彩民的吸引力等因素的合理性。
(2)在根据问题(1)的评价结果,分析各方案存在的优缺点,综合考虑彩票销售公司和彩民的利益,设法设计一种“更好”的方案,并给出设计模型或设计算法,以此给现有彩票管理部门提出建议。
(3)根据前面得到的信息,以客观的态度给报纸写一篇介绍性的短文,告诉彩民关于彩票销售中的数学奥秘,如各种彩票的中奖率、总中奖面、各种彩票奖项的奖金额占总奖金额的比例等问题,以供彩民在购买彩票作参考。
二、问题的分析
彩票发行的目的是筹集资金,兴办各种福利事业,因此对发行部门来说,单期彩票的销售量越大越好。当销售量增大时,作为对彩民回报的奖金额(本文为销售额的50%)也会增加,彩票吸引力得以加强,问题的核心是如何判断不同方案的吸引大小。影响彩票吸引力的因素很多(人口密度,人均收入,文化层次等等),但站在彩民角度上考虑,我们认为各等级奖项的中奖率、奖金总额的分配原则是其中最重要的两类因素。
1.如果高项奖的奖金额比率过大,巨奖的诱惑往往会吸引具有冒险精神的彩民,但是低项奖奖金额的减少带来的是中奖面的缩小,稳重彩民的热情必然降低,从而可能减少销售额;同样,如果低项奖的分配比率过高,不利于基金的积累,但是低项奖的金额会增加,带来的是中奖面的扩大,彩民的热情会增加。因此高、低项奖的奖金设置直接影响到彩票的销售额。
2.如果高项奖的中奖率过高,根据奖金的基本分配原则,必然要减少低项奖奖项的数量,增加彩票赌博的色彩,同样降低稳重彩民的热情,仍有可能减少销售额;同样,如果低项奖的中奖率过高,同样会降低彩票的吸引力。因此高、低项奖的奖项设置也直接影响到彩票的销售额。
因此,彩票奖项等级的设置和奖金的设置是直接影响彩票销售的两大重要因素,我们可以根据问题所给出的29 个方案的特点,将这两大因素分一至七等奖的中奖率、一至三等奖(高项奖)的奖金分配率、低项奖的奖金分配额和总中奖率共12 项指标来进行分析,从而将其化为多指标综合评价问题。
多指标综合评价的方法很多,根据权重确定方法的不同,这些方法大致可分为两类:一类是主观赋权法,如层次分析法、德尔菲法等,多是采用综合咨询评分的定性方法,这类方法因受到人为因素的影响,往往会夸大或降低了某些指标的作用,致使排序的结果不能完全真实地反映事物间的现实关系。另一类是客观赋权法,即根据各指标间的相关关系或各项指标值的变异程度来确定权数,避免了人为因素带来的偏差。如主成分分析法、因子分析法等。主成分分析法在将原始变量转变为主成分的过程中,同时形成了反映主成分和指标包含信息量的权数,以计算综合评价值,这样在指标权重选择上克服了主观因素的影响,有助于保证
客观地反映样本间的现实关系。主成分分析法是通过恰当的数学变换,使新变量——主成分成为原变量的线形组合,并选取少数几个在变差总信息量中比例较大的成分来分析事物的一种方法。
根据对本问题的分析,采用主成分分析法比较合理。主成分分析法原理如下:
1)给定样本数据 如果一批申报中有N 个产品,每项产品有m 项指标,其标准化后的样本数据矩阵为:
,写成向量形式为
4)计算对应于特征值
的相应的特征向量
,m 个特征向量形成特征向量矩阵
如果
超过0.85,则说明前k 个主成分基本包含了全部指标具有的信息,因此可以只选
前五个主成分来进行分析;
6)由前k 个特征向量可以确定k 个新因子
,有Z = XC ,从而得到k个主成分的值
;
8)根据样本评价值就可以对产品进行评价,还可对一批样本进行排序。
三、模型假设
1. 每个号码被抽中的概率是相同的;
2. 每种方案的销售规则及相应的奖金设置方案在一定的时期内是固定不变的;
3. 一、二、三等奖为高项奖,后面的为低项奖;
4. 低项奖奖金数额固定,高项奖奖金按比例分配;
5. 奖项不能兼得,即单注若已得到高级别的奖就不再兼得低级别的奖;
6. 低等奖的中奖概率相对较高,中奖的彩票注数受随机因素影响较小,即认为低项奖的中奖注数与销售总注数的比值与相应的低项奖的中奖概率近似相等,每期彩票低项奖的奖金分配比例不变;
7. 各高项奖额的计算方法为:[(当期销售总额× 总奖金比例)-低项奖奖金总额]× 单项奖比例。该计算方法在一定时期内是固定不变的;
8. 每种方案对彩民的吸引力是不同的;
9. 同种方案对彩民的吸引力在一定时期内是固定不变的;
10.彩票每期的中奖号码都随机产生不受外界任何因素的影响;
11.低等奖的中奖次数受随机因素影响较小,即按概率分布。
四、部分符号说明
本文中使用主要符号及其意义如下:
pij : 第i种方案j等奖的中奖概率;
:第i种方案j 等奖单注彩票所得的奖励,其中j = 4,5,6,7 时为低项奖的单注固定奖金数, j = 1,2,3 时为高项奖奖金在高项奖奖金总额中的比例;
: 第i种方案j 等奖的累积奖金在总奖金中的比率,成为奖金分配率, i = 1,2,…,29 ,
j = 1,2,…,7 ;
X :样本数据的标准化矩阵;
R : X 的相关系数矩阵;
五、模型建立
(一)数据处理
根据附录一,可知多数方案有7 项奖项,部分方案没有7 个奖项,为了方便,不妨假设有该项奖,但奖金为零,如第1 方案只有一至四等奖,因此它的五、六、七等奖的单注奖金为
另外,第23 方案的高项奖只有一等奖,其二、三等奖为固定奖金的低项奖,为统一,将其二、三、四、五等奖的奖励值分别视为四、五、六、七等奖的奖励值,并设其二、三等奖的奖金比例视为零,即
同样,在求各种方案的每种奖项的中奖率时也做类似处理,只要用到排列组合的知识,就可以得到中奖概率矩阵
其中pij 随方案i 的类型不同而有不同的求法,以乐透型33 选7 为例,说明pij 的求法,
根据古典概率的知识,33 选7 的各个奖项的概率分别为
中奖概率矩阵P 的具体元素见表三,表中“--------”表示对应的方案没有设置相应的奖项,在矩阵P 中的值设为零。
为总中奖率向量(数据见表三)。
对于低项奖,中奖概率ij p 乘以j 等奖的单注固定奖金数ij m ,