发布网友 发布时间:2022-04-24 14:53
共1个回答
热心网友 时间:2023-10-17 09:55
统计回归模型 班级:八班 姓名:罗军 学号:1033710812 摘要: 当人们对研究对象的内在特征和各因素间的关系有比较充分的认识时,一般用机理分析方法建立数学模型,如果由于客观事物内部规律的复杂性及人们认识程度的*,无法分析对象内在的因素关系,建立合乎机理规律的数学模型,那么通常的法是搜集大量的数据,基于对数据的统计分析去建立模型,建立统计回归模型。医药上的药物疗效也是通过大量的实验得出的数据来分析药物的作用的,下面我们就此建立统计回归数学模型来进行合理的分析。 关键词: 疼痛减轻时间,用药剂量,性别,血压组别 一问题的提出: 一个医药公司的新药研究部门为了掌握一种新止痛剂的疗效,设计了一个药物试验,给患有同种疾病的病人使用这种新止痛剂的以下4个剂量中的某一个:2g,5g,和10g,并记录每个病人病痛明显减轻的时间。为了了解新药的疗效与病人性别和血压有什么关系,试验过程中研究人员把病人按性别及血压得低,中,高三档平均分配来进行测试,通过比较每个人病人的血压历史数据,从高到低分称三组,分别计作0.25,0.50,0.75。实验结束后,公司的记录结果见下表(性别以0表示女,1表示男) 请根据这些数据为公司建立模型,根据病人的用药剂量,性别和血压组别,预测出服药后病痛明显减轻的时间 病人序号疼痛减轻时间用药剂量性别血压组别 135200.25 243200.5 355200.75 447210.25 543210.5 657210.75 726500.25 827500.5 928500.75 1029510.25 1122510.5 1229510.75 1319700.25 1411700.5 1514700.75 1623710.25 1720710.5 1822710.75 19131000.25 2081000.5 2131000.75 22271010.25 23261010.5 2451010.75 二模型分析与假设: 从我们所得到的数据可以分析出疼痛减轻时间与血压,用药量,性别有关系。 设疼痛时间为Y,用药量为x1,血压为x2,性别为x3。数据中同列相同值但是疼痛时间不同,这说明疼痛时间的确是与我们索要找的三个因变量有关的。 下面,我们利用matlab工具来分析一下Y与三个变量的关系 其中红色代表x2与Y之间的关系,绿色代表x1与Y之间的关系,蓝色代表x3与Y之间的关系。 从上面的图,我们估计Y与x1,x2,x3之间是一个非常复杂的关系,这是一个多元的关系,这样我们假设一个数学模型: Y=b0+b1*x1^(-1)+b2*x2+b3*x3+b4*x2.^2+b5*x1.^2+b6*x1*x2+b7*x3*x2+b8*x1*x3+ε 模型就这样假设了。 三模型的建立与求解 Y=b0+b1*x1^(-1)+b2*x2+b3*x3+b4*x2.^2+b5*x1.^2+b6*x1*x2+b7*x3*x2+b8*x1*x3+ε这样一个模型是否合理,需要我们求证。用matlab下的regress命令求结果 初次求出来的结果为 B=[bbint]= 13.662-5.6532.98 42.8117.18868.432 23.428-52.669.524 3.439-10.70117.579 0.011172-0.135670.15801 12-59.60683.606 -5.3213-8.8549-1.7877 -20-40.6710.67096 1.76020.313693.2067 R=[rrint]= -4.0578-10.852.7348 -1.5042-9.95426.9459 3.5495-3.352510.452 5.9829-0.3315712.297 1.5365-6.91879.9917 -6.4098-12.625-0.19447 3.5415-5.172712.256 3.0861-6.10712.279 1.1308-7.746610.008 -0.69838-9.61938.2225 -4.1537-13.1954.8877 4.1-3.547613.33 1.3802-7.756610.517 -5.4144-14.4753.58 -2.7091-11.6956.27 -5.3799-14.0043.2443 -2.1746-11.87.2986 4.5307-4.195313.257 0.63615-6.55287.8251 0.83246-7.69019.355 -0.47123-7.73546.793 -1.4045-8.57665.7675 7.79180.4747915.109 -4.5119-11.3482.3241 Stats=[0.9184421.1137.74e-007] 从中我们可以看出,R.^2值为91.844%,F值为21.113。R^2的值还不够合符要求,而F却很小,这样我们建立的模型不太符合要求。我们可以用残差分析,来建立相对较好的模型。于是,我们考虑是否其中有的项不需要呢,或者还需要添一些项呢。然后我们用stepwise的命令来进行分析: 当我们建立Y=b0*x0+b1*x1.^(-1)+b2*x2+b3*x3+b4*x2.^(-1)+b5*x1.*x2+b6*x1.*x3b7*x2.*x3统计模型时,进行残差分析 所得的最好的残差的效果图为 这时,R.^2=91.0316%F=36.5407,这样F的值大一点了,残差分析说明b0,b3,b4的值为0,他们的对应项对目标函数的影响很少,可以忽略不计。 但是我们是否能找到更好的模型来取代当前所求得的这个模型呢,因为F的纸还不是很合理。 我们继续分析题中要求。题中用药量根据常识应该是跟疼痛时间成反比,因为用药量越少,疼痛时间越大。还有,血压大的话,疼痛时间应该越大。另外血压应该是与性别有联系的, 当我们建立Y=b0*x0+b1*x1+b2*x2+b3*x3+b4*x2.^2+b5*x1.*x2+b6*x1.*x3b7*x2.*x3+b8*x.^2统计模型时,进行残差分析,所得的结果如图所示 明显比刚才的数据要好很多了,我们继续对此模型进行调整,或许能够找到一组比如上图形更好的数据。 继续查找后,所得又一结果如图 从上图我们可以看出,R^2=94.0512%,F=56.9166,这又是一个好的数据结果, 依此图建立的数学模型为 Y=b0*x0+b1*x1+b2*x.1^2+b3*x2.^2+b4*x1.*x2+b5*x1.*x3+b6*x2.*x3 这说明,疼痛的时间与用药量成二次项关系,与血压成二次项关系,模型中含有所有变量的交叉项。 而对其他模型 如Y=b0*x0+b1*x1.^(-1)+b2*x2+b3*x3+b4*x2.^2+b5*x1.*x2+b6*x1.*x3b7*x2.*x3+b8*x.^2 所得的结果如下图 这样的结果明显较上面结果不好。 R.^2很小。 所以我们确定了模型 Y=b0*x0+b1*x1+b2*x.1^2+b3*x2.^2+b4*x1.*x2+b5*x1.*x3+b6*x2.*x3 再来看看它的置信区间 bint= 43.261.974 -10.213-3.9083 0.281450.74077 24.19560.862 -10.151-4.5978 0.4381.4715 所有的系数的置信区间不通过原点,且数据比较合理, 再看残差 r= -4.7019 -0.98862 1.4086 5.388 -2.87 1.4985 2.2782 4.5224 1.4506 0.50291 -5.2529 -2.3247 0.82047 -2.248 0.36743 -1. 0.066566 1.682 -4.5328 0.929 1.0761 -0.083352 9.3791 -6.4745 每个数据的大小不是很大,这样那么我们将所有变量的实际值拿出来建立实际模型 Y=52.808-7.0608*x1+0.51111*x.1^2+42.528*x2.^2-7.3746*x1.*x2+0.95506*x1.*x3 这个模型基本上是满足要求的。 所以我就确定了该模型。 四模型结果 Y=52.808-7.0608*x1+0.51111*x.1^2+42.528*x2.^2-7.3746*x1.*x2+0.95506*x1.*x3 五模型应用 当利用此模型来求疼痛时间时,只要给了我们三个变量基本的数据,我们可以很好的求出结果来。 比如x1=2x2=0.5,x3=0 则Y=40.7308与所给数据43相差不大,模型得到很好的应用。 《数学建模》 出版社:高等教育出版社作者:姜启源谢金星叶俊 骆吉洲老师的课件MATLAB软件简介数学建模课件