基于最大熵原理的人口预测模型的最优控制
2024-10-18
来源:威能网
第30卷第4期(上) 2014年4月 赤峰学院学报(自然科学版) Journal of Chifeng University(Natural Science Edition) Vol|30No.4 Apr.2014 基于最大熵原理的人口预测模型的最优控制 戴晓娟 (宁夏师范学院摘数学与计算机科学学院,宁夏 固原 756000) 要:本文提出一种基于最大信息熵的人口预测模型,该模型以熵函数作为目标函数,以已知数据 的各阶统计距作为约束条件,通过最大化熵来预测人口的发展状况.并通过现有数据,对我国未来人口分 布做了相应的预测. 关键词:最大熵;预测;模型;最优控制 中图分类号:0232 文献标识码:A 文章编号:1673—260X(2014)04—0016-03 1 引言 此研究报告说明,人口老龄化速度加快,高龄 人类社会发展到今Et,面临着一系列严峻的挑 趋势明显,这显然也会影响到将来的人口发展.因 战,诸如战争与和平、生态失衡、人口爆炸、环境污 此我们建立偏微分方程对我国将来的人口数量作 染、资源短缺等.其中尤为突出是人口问题,因为人 出更加合理的估计.即假设人口的数量不仅和时间 口的发展影响和制约着经济的发展,而经济的发展 t有关,还与年龄X有关. 则关乎社会的进步,人类的文明,它们之间是相辅 + =一 (x,t)p(x,t),t,x>0 相成的. 以中国为例,由于我国是一个人口大国,我们 p(x’。 p0(x) (1) 所面临的人口问题,不仅有人口数量控制的问题, p(O,x):f(x) 一 更重要的是面临着复杂的人口流动、管理、保障和 发展的问题.在这一过程中,如何遵循以人为本的 F(x,t)=』:p(X'1)dx 其中t>0为时间,X为人的年龄,均为连续变 科学发展观,遵循经济规律和人口变动规律,最大 量,p(x,f)为人口密度函数, (x,f)为死亡率,V(x,t)为 限度的实现社会公正,是新时期人口发展和管理面 给定时刻t年龄小于X的人口分布函数.这个连续 临的新课题.正确认识人口变动特征,则是解决人 型人口发展方程描述了人口的演变过程,从这个方 口问题的前提. 程确定出的密度函数可以直接得到各个年龄的人 根据全国第六次人口普查数据的显示,我国人 口数,即人口分布函数. 口有如下显著特点: 本文在此模型的基础上提出一种基于最大信 (1)人口增速减缓,经济社会发展推动生育率 息熵的人口预测模型,该模型以熵函数作为目标函 的进一步下降 数,以已知数据的各阶统计距作为约束条件,通过 (2)“未富先老”人口老龄化加剧 最大化熵来预测人口的发展状况. (3)城市化水平提速,中国已经进入城市人口 2最大信息熵原理 快速增长期 2.1基本原理 (4)出生人口性别比例失衡,制约经济发展和 熵最初来源于热力学.在哲学和统计物理中被 社会稳定 解释为物质系统的混乱和无序程度.信息论则认为 (5)流动人口成正增长趋势,影响社会的发展 它是信息源的状态的不确定程度.所谓熵增加原 基金项目:本文系校科研项目(YB201347) 一l6一 理,是指孤立系统向着微观状态最混乱的方向变 响,能够更精确地描述人口年龄的结构及发展趋 势,故选取我国1990年到2010年的人口数据. 化,直到熵达到最大. 1948年,香农把波尔兹曼熵的概念引入信息 论并把熵作为度量一个随机事件的平均不确定性. 因此,信息数量的大小,可以用被消除的不确定性 的多少来表示,而随机事件的不确定性的大小可以 用概率分布函数来描述. 如果随机变量为离散型,x的取值为Xi,i=l,2, …鉴于模型(1)属二维概率分布,有两个变量,所 以取时间为任意固定值,密度函数的变化决定人口 的分布.我们首先来确定时刻t年龄为x的人口死 亡率W(t,X),由于现阶段由于医疗水平等条件的限 制,可以近似地认为在一定时期内人口死亡率是保 持不变的,即认为Ix(t,x)仅仅是年龄x的函数 (x). 利用提供的数据进行数据拟合,得到的年龄与死亡 ,n,xi出现的概率为f)i,i:1,2,…,n,∑pi=1,则包含 i=1 的信息量为H(x)=一∑pilogpi,其中H是pl,p ,…,p i=1 的连续函数,当且仅当pl=p:=…:p 时,H取最大值. 如果随机变量x是连续分布的,其分布密度 函数为p(x),X熵定义为 f H(x)=一j p(x)logp(x)dx 矗 基于熵的定义,可以直观地说明最大熵分布原 理:使其熵在一些约束条件下达可以到最大值,即 f maxH(X)=-J。p(x)logp(x)dx J p(x)dx=1 』 x (x)dx= n=1,2,…,N 式中, 为第n阶原点矩,其值可由样本数据 计算出来,N为所用原点矩的阶数. 2.2求解方法 最大熵分布就是在保证样本的统计特性条件 下通过调整p(x)使熵H达到最大.现用经典的变分 法求解目标函数的极值问题. 引入拉格朗日乘子ho,h 一,入 ,令 L=H(x)+入。(f p(x)dx一1)+ :入1(j p(x)x“dx一 l1) (3) 3L/Op(x)=0,得 N . otSOp(x)一『R(1+lnp)p(x)dx+j 入 』 x怔o / N 、 可得p(X)=exp(入0+∑ 1 (4) 3最大信息熵在人口预测模型中的应用 3.1模型选取 由于偏微分方程考虑了年龄对人口增长的影 率之间的函数关系为: I(x)J:e =e m m (15))J 3.2取已得样本得5阶原点距为约束条件,由公式 = II1 i=∑xl in计算.其中,n为采样次数,in为原点距 阶次. 3.3根据特征值矩阵求出各个约束条件,应用最 大熵原理求出特征估计的分布函数,得到一个预测 的人口分布函数Pi,根据式(1),(2)可得 r maxH(X)=-I p(x)logp(x)dx Jf p (x)dx=1 (6) 』 x5p(x)dx= 1 i 。,N 其中X为人口的年龄变量,是预测问题的变 量.通过调整P来使得熵最大,并采用拉格朗Et乘 子法来求解此问题. 设H为拉格朗日函数,拉格朗日乘子因子为 kl,.--,k ,根据式(4)则有: H=H(x)+(入0+1)(J Rp(x)dx一1) 十i 1∑ I【 f (x)dx.1∑ iIn i=1 n JI (7) 令dH/dp(x)=0有 一f[1np(x)+1]dx 。+1) + :i dx=0 (8) 根式(5)可以解得p(x)=exp(ho+∑入ixi) (9) 式(10)就是最大熵概率密度函数的解析形式. 将式(1O)代入式(3)可得 由图1可以看出,我国人口结构老龄化进程加 (10) 速,在2050年左右达到高峰,随机趋稳.图2得 出,到2020年乡镇人口大批涌入城市,城市人口 饱和.除此,还可以看出,在实现稳定低生育水平 的前提下,由于人口基数大,未来相当一个时期 人口还将持续增长,但由于计划生育政策的执行 xo=.1nl \J expl 、i=1 Jdx) (12) 零增长. 5结论 使我国人口得以控制,在40到5O年以后将达到 把(9)式代入(6)式,即可得到此人口的概率密度 函数确定的最大熵.再把(5)与(9)式代入(1)式,可得 利用最大熵原理分析人口密度函数,从而确定 到人口的结构预测和人口分布结果. 4实例研究 通过以上所述模型的建立过程及相应的算法, 运用历年的统计数据,借助Matlab软件对我国人 口分布作中长期(2020年~2050年)预测,求得以下 结果: 图2 一18一 人口分布函数,得到的对未来人口结构和分布的预 测情况.我国人口的年龄变化是一种随机事件,最 大熵方法确定的被测量分布是含有最少主观假定 的分布,因此用最大熵原理来预测其分布是可靠 的. 参考文献: [1]朱雪龙.应用信息论基础[M].j匕京:清华大学出 版社.2001. [2]沈世镒,吴忠华.信息论基础与应用[M】.北京:高 等教育出版社。2004.7. [3]徐宗学.熵极大识别准则及其应用[『】.武汉水力 电力学院学报,1987. (4]马力,张学文.最大熵原理与概率分布函数[M】. 数理统计与应用概率.1993. [5]冯利华,张萍.基于最大熵原理的台风统计预报 Ⅱ】.海洋科学,2003,27(3):47—51. (6]朱成骐,孙宏斌,张伯明.基于最大信息熵原理的 短期负荷- ̄m,l综合模型[『].中国电机工程学报, 2005(10):1—6. [7]李环,高全胜,李育武,周静.中国人口增长的状态 空间预测模型Ⅱ].武汉工业学院学报,2009,28 (1):101-105.