发布网友 发布时间:2022-04-24 14:47
共1个回答
热心网友 时间:2023-10-17 03:41
一条记录列入的变量假如有缺失值,就自动不纳入分析了。
缺失值处理方法:
1、分类变量:若分组分析,选择相应的分组变量,在“最大类别”输入最大的分类数,默认25,超过规定分类数则不进行分析。“个案标签”选择一定变量作为标记变量,也不可不选择。
2、“模式”:“按照缺失值模式分组的表格个案”:以表格形式列出每个变量各种缺失方式的缺失例数。“按照缺失值模式对变量排序”:缺失率太小的缺失方式不予显示,系统默认1%。
3、“单变量统计分析”:给出每个变量的未缺失数、缺失数与缺失率,对于“定量变量”给出均数、标准差及极端值个数等。“百分比不匹配”:以矩阵形式给出每一对变量不匹配(其中一个变量缺失而另一个变量不缺失)例数占总例数的百分比,对角线位置上即为单个变量的缺失率。“T检验”:按照缺失指示变量将各计量变量分为两组,用T检验比较两组均数有无差别,助于判断变量是否为完全随机缺失。“交叉表”:按各分类变量分类给出其他变量的缺失数和缺失率及每种缺失方式的比例。缺失率太小的不予显示,默认为5%。
4、“估计”:估计含有缺失值的变量的均数、相关阵和协方差矩阵。按列表:各入选变量均无缺失值的观察单位参加估计。成对:所有入选变量两两匹配,每对变量无缺失值的观察单位参加估计。EM(Expectation-Maximization):期望-最大似然估计法,采用迭代法建模.关于EM建模法,先利用未缺失值建模估计缺失值的期望值,然后迭代计算,用最大似然估计法重新估计参数。回归:多元线性回归估计缺失值,给出被预测值的均数、协方差阵即相关阵
EM:正太分布是系统默认的;混合正太分布,两个分布混合比例,在0-1之间,标准差的比值,取值大于0,余下的值用户自己定义;假定服从t分布,自由度用户自己定义。最大迭代次数为系统默认25。回归:四个选项中选择一个作为回归模型中的误差项,系统默认随机抽取未缺失数据的残差作误差项。