admin 管理员组文章数量: 887021
2023年12月20日发(作者:数据库课程设计销售管理系统源码)
condition index回归分析
若随机变量X服从一个数学期望为μ、方差为XXX的正态分布,记为N(μ,XXX)。其概率密度函数为正态分布的期望值μ决定了其位置,其标准差σ决定了分布的幅度。当μ=X,σ=X时的正态分布是标准正态分布。
二项分布就是重复n次独立的伯努利试验。(抛硬币)在每次试验中只有两种可能的结果,而且两种结果发生与否互相对立,并且相互独立,与其它各次试验结果无关,事件发生与否的概率在每一次独立试验中都保持不变,则这一系列试验总称为n重伯努利实验,当试验次数为X时,二项分布服从X-X分布。
伽马分布:统计学的一种连续概率函数
泊松分布:tweedle分布:
回归:连续型拟合
descriptive statistics:描述性统计
mean:均值
ion:标准差
N:所使用的记录数
correlations:相关性
主要分为:pearson correlations(皮尔森相关):对称矩阵,表示变量之间两两相关系数。越接近X相关程度越高。
sig.(X-tailed)(单托维显著性):只要是显著性,不管是单托维或者双托维,都和作比较。越接近显著性越高。
N:表示不同的变量之间的数据值。
variables entered/removed:变量的进入/移出,表示生成模型的第一步
model summary:模型概述
R:所得到的曲线拟合程度,和X做比较
R square:R的平方,曲线拟合的优异程度,和X做比较。
adjusted R square:模型复杂度的惩罚值。和X做比较。
of the Estimate:预估的标准误。标准误=标准差/样本容量的开方。均值的置信区间是根据标准误来算的。
selection criteria:选择的标准
AIC:模型简洁度,此值越小越好。
MPC:模型变量选择权衡点,此值越小越好。
D-W:在一定程度上表达残差是否服从正太分布,越服从正太分布说明变量之间独立性越强,相关性越弱,正如我们所需要的,一般此值在X-X之间,越接近X越好。
ANOVA:方差分析
分为两大部分:regression回归residual残差
sum of square:方差之和
df:自由度,取值不受限制的那些变量的个数,等于n-X
mean square:均方差
F:f值,通常用自由度可以查到自由度所对应F值,然后再跟模型计算的F值做比较,若计算的F值小于所查到的F值,说明差异不明显(F检验:方差齐性检验),若大于,则要进行T检验。
sig.:显著性,和比较。如果是X.X的置信区间,则和X.X作比较。
coefficients:回归系数
unstandardized coefficients:非标化的回归系数
B:以下每个量的回归系数
:以下每个量的标准误
standardized coefficients:标化的回归系数(通常直接看此项就行)
beta:以下每项的标注化回归系数
collinearity statistics:共线性统计,判断独立性
tolerance:容忍度,容差
VIF:与容忍度成反比,一般此值小于XX说明变量之间独立性相对较好。
coefficients correlations:回归系数的相关性
correlations:各个变量之间的相关性,一般在X.X或者X.X以下最好。若是高于X.X,那么要对变量重新选择或者其他处理。
covariances:协方差
collinearity diagnostics:多重共线性诊断
condition index:条件指数,一般小于XX认为不存在多重共线性,说明变量之间独立性较好。
residuals statistics:残差统计
最小值,最大值,均值,残差的标准差,残差个数
当共线性不能接受时:要重新选择变量;尝试有偏向性估计;扩大样本;设置“类型”节点时,有选择的“输入”角色。
推荐思路:将变量逐一与因变量进行相关分析。通过相关系数的筛选,将筛选的自变量与因变量一起做多重回归分析。
版权声明:本文标题:condition index回归分析 内容由网友自发贡献,该文观点仅代表作者本人, 转载请联系作者并注明出处:http://www.freenas.com.cn/free/1703007565h439389.html, 本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容,一经查实,本站将立刻删除。
发表评论